开源社区

世界第一!继DeepSeek后这个汕头90后再度炸翻美国科技圈

世界第一!继DeepSeek后这个汕头90后再度炸翻美国科技圈

  • 发布:
  • 人气: 1
  • 评论: 0
标签:

应用介绍

  时隔半年,又一家中国AI创业公司给美国科技圈带来冲击波。由这家公司推出的新模型K2让美国科技圈惊呼,中国人在计算资源限制下仍然能持续做出世界级的创新,世界迎来“又一个DeepSeek时刻”!

  7月11日晚,中国AI公司北京月之暗面科技有限公司(简称“月之暗面”)正式发布并同步开源了最新的大模型——Kimi K2。

  K2开源模型的突然发布,像一颗深水炸弹,海内外AI圈瞬间炸锅。这款大模型凭借强大的编程、智能体任务性能以及实惠的API价格,引发了硅谷及全球开源社区的高度关注,在发布后48小时内引爆市场:Kimi官网访问量激增36亿,开源社区Hugging Face下载量突破10万次,超过了该平台上的任何其他模型。

  良好的使用体验,也让Kimi K2模型在海外技术社区上,收获了大量好评。全球最大开源AI平台Hugging Face联合创始人托马斯评价称:“来自中国的Kimi团队在过去几个月推出的系列模型令人印象深刻,K2更是挑战了闭源模型的极限。”

  Allen人工智能研究所的机器学习研究员Nathan Lambert在社交媒体平台Bluesky上评价到:Kimi K2是“世界上新的最佳开放模型”。

  月之暗面的优异表现也获得了英伟达创始人黄仁勋的关注,在北京参加链博会期间接受媒体采访时,黄仁勋对DeepSeek、阿里巴巴Qwen、Kimi等中国大模型给予高度评价。

  7月16日,英国《自然》杂志甚至对Kimi K2进行了专门报道,报道指出,Kimi K2在各项基准测试中的表现可与西方竞争对手相媲美,甚至更胜一筹,同时也超越了部分DeepSeek模型。文章认为,Kimi K2是继1月DeepSeek推出R1震惊世界之后,六个月内中国推出的第二款令人瞩目的模型,世界迎来“又一个DeepSeek时刻”。

  而就在Kimi K2发布一周之后,7月18日,国际权威大模型排行榜LMArena揭晓最新排名:北京月之暗面科技有限公司(以下简称“月之暗面”)研发的万亿参数开源模型Kimi K2强势登顶全球开源模型榜首!同时,Kimi K2获得了超3000张社区投票,在大模型竞技场的总榜上排名第五。

  有学者指出,Kimi K2带来的“DeepSeek时刻”应该引起西方科技圈的再一次重视和觉醒。

  Kimi K2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型,其在SWE Bench Verified(编程)、Tau2(智能体)、AceBench(工具调用)等基准性能测试中,均取得开源模型中的SOTA成绩(指在特定任务或基准测试中取得当前最佳表现),展现出在代码、智能体、数学推理任务上的领先能力。而代码能力和Agent的自主工具使用能力是此次K2发布的一大重点,同时也是全球大模型厂商正在发生的转变。

  当用户将13万行的原始数据丢给K2,根据实测案例,它可以帮你分析远程办公比例对薪资的影响,还自动生成统计图表与回归模型解读,并用统一色调做出相关专业图表,整理成报告。

  据介绍,Kimi K2模型参数总规模达到万亿级别,但激活参数只有32B。这意味着,Kimi K2模型能以更低的成本、开展更加复杂的工作。目前,Kimi K2已接入OpenRouter、Cline、Visual Studio Code等国际主流开发平台。

  Kimi K2由北京月之暗面科技有限公司(Moonshot AI)推出的开源万亿参数大模型,这家成立仅有两年多时间的企业,却是很有代表性的一家中国AI创业公司,其创始人杨植麟年仅32岁,在最新的《新财富》杂志500创富榜上,身家已达到93.9亿元。

  杨植麟1993年出生于广东汕头,2008年,15岁的杨植麟一脚踏入汕头最好的高中——金山中学。高一时,他加入了学校的信息学奥赛班,仅训练一年,就在全国青少年信息学奥林匹克联赛中获得广东赛区一等奖,首次获得清华大学保送资格;紧接着,他又参加了清华大学的自主招生考试,再次超越录取分数线拿到了录取资格;高三时,已是清华保送生的他决定以普通高考生的身份参加高考,结果以667的高分考上汕头市的理科状元,第三次获得了清华的录取资格。

  2019年,杨植麟在美国卡内基梅隆大学计算机学院获博士学位,后来曾在Facebook人工智能研究院和谷歌大脑研究院任职。

  2023年3月,杨植麟在北京创办月之暗面科技有限公司,同年10月发布大模型 kimi,迅速引发关注。值得一提的是,月之暗面在创业一年之内就已经完成总额超过30亿元的融资,其在2024年初获得当时国内大模型诞生的最大笔融资,被阿里、红杉等著名资本争投。

  值得注意的是,此次月之暗面是抢在DeepSeek R2之前推出万亿参数大模型,并同样采取开源策略。这不仅是月之暗面的一次技术发布,更是一场豪赌。

世界第一!继DeepSeek后这个汕头90后再度炸翻美国科技圈

  可以看到,经两年多的狂飙突进,大模型行业正在快速收拢。在海外,大模型决赛圈被收拢至OpenAI、谷歌、Meta、Anthropic和xAI五家公司,各家的发布也呈现你追我赶的态势。在国内,竞争也从未停止。

  今年1月20日,DeepSeek发布R1引爆全网之时,Kimi其实也发布了其多模态推理模型K1.5.虽然和R1一起被OpenAI认证为最早破解o1技术原理的两个模型之一,但很长一段时间,Kimi都在DeepSeek所占据C位的聚光灯外。

  其后,Kimi又与DeepSeek多次在论文和模型上“撞车”。在这种频繁的追赶和技术交锋中,不同于DeepSeek背靠母公司幻方量化在算力和资金方面的有力支撑,Kimi除了需要坚持基础大模型的训练,还面临商业化的挑战,如何与中国的开源模型们一起打破技术垄断,也是接下来Kimi们需要翻越的大山。

相关应用