
开源日报 微软蓝屏波及全球;GPT-4o迷你版;泡沫最大的半导体公司;GPU独孤求败? - OSCHINA
应用介绍
Windows 用户今天在更新 CrowdStrike 后遇到了蓝屏死机 (BSOD) 错误。该问题似乎很普遍,影响运行不同 CrowdStrike 版本的机器。在社交媒体上,全球不同地区的用户纷纷在抱怨这个突如其来的蓝屏死机错误。
英伟达通过官方博客现在正式宣布,其开源内核模块最终将取代闭源驱动 —— 目前正处于完全过渡到开源 GPU 内核模块的时刻。在即将发布的 R560 驱动版本中,他们将作出这一更改。
借助 R515 驱动程序,英伟达于 2022 年 5 月发布了一套开源的Linux GPU 内核模块,该模块采用双许可证,即 GPL 和 MIT 许可。初始版本主要面向数据中心计算 GPU,而 GeForce 和工作站 GPU 则处于 Alpha 状态。
当时,他们宣布在后续版本中将提供更可靠、功能齐全的 GeForce 和工作站 Linux 支持,NVIDIA 开放内核模块最终将取代闭源驱动。
GPT-4o mini GPT-4o mini 在 MMLU 上的得分为 82%,目前在 LMSYS 排行榜(在新窗口中打开)上的聊天偏好方面优于 GPT-4。它的价格为每百万输入代币 15 美分,每百万输出代币 60 美分,比以前的前沿模型便宜一个数量级,比 GPT-3.5 Turbo 便宜 60% 以上。
GPT-4o mini 以其低成本和低延迟实现了广泛的任务,如连锁或并行多个模型调用(如调用多个 API)、向模型传递大量上下文(如完整代码库或对话历史)或通过快速、实时文本回复与客户交互(如客户支持聊天机器人)的应用。
目前,GPT-4o mini 的应用程序接口支持文本和视觉,未来还将支持文本、图像、视频和音频输入和输出。该模型的上下文窗口可容纳 128K 标记,每个请求最多支持 16K 输出标记,知识库可持续到 2023 年 10 月。
DeepSeek-V2是幻方量化旗下组织深度求索在今年 5 月份发布的第二代开源 MoE 模型,其优势包括:参数更多、能力更强、成本更低。
2022 年 11 月开源,到现在也还没满两年,我们达到一个小小的里程碑:4000 star,并且国内和海外对半开。这个过程没有什么奇技淫巧,我坚信老老实实做好产品和技术,老老实实去做好社区,这是一家以开源为本的公司的基础。让我开心的是,我们的独立贡献者有 70~80 个,大部分不是一些简单的修正(当然,我们也非常欢迎),而是深度参与了一些 feature 的研发,由衷地表示感谢。#GreptimeDB#
从去年开始,就看到大佬 Pavel Oliva 在推上频繁地测试自己的建筑生成器 Buildify,最近终于发布了。没想到的是,已经从一个建筑生成器变成了城市生成器,还完美兼容知名开源地理插件 Blender OSM。而更没想到的是,免费,可商用。
据台媒报道,台积电近期准备开始生产英伟达最新Blackwell平台架构GPU,同时因英伟达的客户需求强劲,故此对台积电的晶圆订单增加25%;并有可能令本周放榜的台积电上调今年盈利预期。
报道引述业界消息指出,亚马逊、戴尔、谷歌、Meta及微软等都会使用Blackwell架构GPU来建立AI伺服器,令需求超出预期。
但是,英伟达的动态估值只有60倍,以它仍然无懈可击的GPU产品,以及垄断市场的地位,你很难说这个估值高得离谱,何况,AI未来是何等的星辰大海。
更重要的是,英伟达完全能够交得出业绩,90%的毛利率,50%的净利率,一年数百亿美元的净利润,距离微软的水平也不是很遥远,你可以说英伟达的估值不便宜,但说是泡沫,似乎也不妥。
如果对比另外一个半导体公司,英伟达的估值可以说低得可怜。因为那家半导体公司的动态PE,是英伟达的10倍。不到一年时间,它的市值暴涨4倍,接近2000亿美元。而一年的营收,在30亿美元的水平,净利润只有区区3亿美元,算下来,PE接近600倍。
DeepSeek 刚刚发布了他们最新的DeepSeek-V2-0628,在huggingface已经可以下载了,但是这个非量化版本实在是太大了,达到了236B, 按照官方的说法, 需要8块80G的显卡才能跑起来. 即使是4bit量化的版本(由于刚发布3小时, 还没人去量化), 估计消费级硬件也只有192G的顶配 Apple M2 Ultra 可以试一试了. 好奇为啥不推出一款差不多70b的型号? 33b的倒是有, 但是还没更新。
摩尔线程官方宣布,与清华系AI系统软件公司清程极智正式建立战略合作关系,旨在加速国产大规模GPU智算集群的产业化进程,推动AI算力生态的快速发展,为大模型行业提供更强大、灵活且高效的基础设施支持。
在一段时间的摸索和沉淀之后,各家AI手机的战略轮廓逐渐变得更加清晰,厂商们在自研大模型之外,也陆续尝试接入AI公司的通用大模型,比拼用户体验。
鸿蒙生态(武汉)创新中心是继深圳、成都之后,华中首个、全国第三个鸿蒙生态创新中心,是一个集技术服务、展示体验、教育培训、活动推广等功能于一体的高水平公共服务平台。
在竞争激烈的市场中,Wiz 的卖点是「一站式平台」,提供云工作负载保护(CWPP)、云安全姿态管理(CSPM)、云基础设施权限管理(CIEM)等功能。同时,Wiz 还与许多其它初创公司合作,建立生态系统,提供灵活性。
自2023年下半年起,“落地”就成了AI圈内最常提及的话题。一个明显的趋势是,为了加快AI的落地,模型尺寸在变小,更轻量、更垂的模型不断推出,模型变得越来也便宜。
中国电信推出首款AI手机麦芒30,搭载高通骁龙695处理器,内置中国电信自研的星辰大模型。据了解该手机可实现文案创作、图像生成、智能问答、一键调用AI等功能。
为了突破CUDA护城河,现在已经有各种努力,比如 HIPIFY 帮助将 CUDA 源代码转换为适用于 AMD GPU 的可移植 C++ 代码,然后是之前由 AMD 资助的ZLUDA,允许 CUDA 二进制文件通过 CUDA 库的直接替换在 AMD GPU 上运行。
但现在又出现了一个新的竞争者:SCALE。SCALE 现已作为 GPGPU 工具链公开,允许 CUDA 程序在 AMD 图形处理器上本地运行。
OpenTURNS 是一个 C++ 和 Python 库,内置专用于处理不确定性数据的模型和算法。该库的主要目标是提供处理工业应用研究中的不确定性所需的所有功能。
日志中台承载了百度千亿量级 PV 的埋点流量,如何对这些流量进行准确监控,并支持个性化字段的抽取、下钻,是日志中台的一大难题。本文简单介绍了日志中台的基本概念及实时流架构,并基于此深入讲解了低成本实现可扩展、高准确度的埋点监控的技术方案。
观点 1:信息安全厂商 CrowdStrike 的一款产品在更新后,众多运行 Windows 的电脑瞬间成废砖。CrowdStrike 的首席威胁猎人 Brody Nisbet 已确认了这个问题,并在 X上发布了以下内容: 存在一个有错误的通道文件,所以不是完全意义上的正确更新。有一种解决方法:1、引导Windows进入安全模式或WRE。2、进入C:\Windows\System32\drivers\CrowdStrike。3、找到并删除匹配“C-00000291*.sys”的文件。4. 正常启动。他在后来的另一个帖子中写道:“这个解决方法并不能帮助所有人,不过我目前也没有进一步可付诸实践的方法可以帮助用户。”
观点 4:刚刚经历蓝屏,公司几百台办公笔记本电脑一台接一台蓝屏。在家办公的也未能幸免。起初还以为是公司网络故障导致的。工作的激情戛然而止,公司一下子热闹起来。
观点 10:我说今儿为啥OneDrive提示“很抱歉,OneDrive 服务器出现问题 -- (错误代码: 0x8004def5)”
观点 1:本身是消费端【找内容】的主场景,已经变成生产端【内容曝光】的主场景。搜索领域的“推荐算法、信息流”该革新了,不管是个性化还是非个性化方向。
观点 4:不索引新内容如何发现新“独角兽”呢?这样会加强既得势者的垄断,保护了垄断者,拒绝了新创新者。
观点 2:你可以自己动手解决bug,也可以多捐钱加快bug处理速度, 不要一边吃饭一边骂厨子
观点 1:直接代码里暗度陈仓,留点小秘密,被优化后,到黑市上以另一个身份,贩卖个好价钱,一石二鸟,既给自己创收,又让压力到了对方那边。并且这锅到时候也不用你背,顶多算bug
观点 2:话说,你不删都崩溃的代码,为什么要多此一举,给公司创造利益。我的意思是,删代码,公司起诉你,找你索赔这种方式创造利润。
观点 5:程序员何苦为难程序员,老板哪会关心代码怎么写的,有问题背锅的是下一个程序员,怎么实现我不管,限你今天就搞定
观点 13:你这样敲码的话,有没有一种可能,没等公司把你辞退,你就率先因为看不懂自己上个月写的代码而提桶跑路了?