开源社区

Anthropic创始人:DeepSeek是不是开源并不重要|中企荐读

Anthropic创始人:DeepSeek是不是开源并不重要|中企荐读

  • 发布:
  • 人气: 6
  • 评论: 0
标签:

应用介绍

  “当我谈到AI存在的风险时,有些人却给我扣上了“末日论者”的帽子,他们说‘这家伙是个末日论者,他想拖慢AI的发展。’我非常生气。”达里奥·阿莫迪(Dario Amodei)说道。

  近日,Anthropic联合创始人兼CEO达里奥·阿莫迪(Dario Amodei,以下简称阿莫迪)接受了知名播客Alex Kantrowitz的对话采访,两人谈到了AI发展的风险、对马克·扎克伯格高薪挖人才的看法,以及他的成长经历对其创办公司的影响等内容。阿莫迪表示,自己从不在公开场合高喊AGI、超级智能等口号,只承认AI发展的速度是指数级的。他既对AI的发展充满信心,还专门写了文章来分析AI的好处,又对AI的发展充满忧虑,多次警告人们注意AI的安全问题。在谈到开源时,阿莫迪表示,并不关心模型是否开源,只关心它是不是好模型,是不是比Anthropic的模型好。最后,他还谈到了为什么离开OpenAI自己创业。

  1.所有与人工智能相关的问题,从国家安全到世界经济,都已经成为我们实际要面对的问题,这些事情的紧迫性已经上升了。

Anthropic创始人:DeepSeek是不是开源并不重要|中企荐读

  3.我们能用1亿美元做别人用10亿美元做的事,用100亿美元做别人用1000亿美元能做的事,那么投资我们公司要比投资其他公司资金效率高出10倍。

  4.企业对AI的使用需求比消费者更大,或者说AI的商业应用需求更大,高级用户会用它来提高生产力。

  5.当看到一个新模型出现时,我并不在乎它是不是开源的,比如DeepSeek,我不认为DeepSeek是开源的这一点很重要,我只关心这是一个好模型吗?比我们的模型更好吗?

  主持人:过去几个月你的行为很有意思,比如你说人工智能可能会消灭一半的入门级白领工作,当你得知OpenAI即将收购Anthropic的顶级模型时,你就切断了Windsurf对Anthropic顶级模型的访问。为什么会这么做?

  达里奥·阿莫迪:我和Anthropic总是专注于去做和说我们所相信的事情。随着我们越来越接近更强大的人工智能,我想要公开地、有力地、清晰地表达我的观点。人工智能正在变得越来越强大,几年前它们的思维还很混乱,但水平已经相当于一个聪明的高中生了,现在它们已经开始像聪明的大学生,甚至是博士生,在更专业的领域中展现出超强的学习能力。因此我认为所有与人工智能相关的问题,从国家安全到世界经济,都已经成为我们实际要面对的问题,这些事情的紧迫性已经上升了。所以我迫切地想要说出这些问题,并警告世界可能出现的负面影响。

  我自己和Anthropic的员工都认为有责任警告世界即将发生的事情,当然这并不意味着我们在否认人工智能的积极应用。2024年我写了《Machines of Loving Grace》这篇文章,阐述我对AI会带来哪些积极影响的看法,事实上,我比一些自称AI乐观主义者或加速主义者的人更清楚地表达出了AI的好处。但出于同样的原因,我觉得自己也有义务警告人们注意风险。

  主持人:在你的时间线里,总是能比其他人更早看到AI发展的节点,因此现在你感受到了一种紧迫感,想要离开是吗?

  达里奥·阿莫迪:我不确定什么时候要离开,这很难预测,特别是在社会应用层面,比如人们什么时候会大规模部署AI、公司会每月固定在AI上支出XXX美元,或者AI什么时候会推动医疗进步等都有点难预测。反而是底层技术的发展更有可能进行预测,不知道其他人怎么看,我在这方面变得更有信心了。在未来两年的某个时候,我认为有20%~25%的可能性模型会开始停止变得更好。

  主持人:我与20多位曾与你共事或竞争过的人交谈,他们都表示,在所有主流AI实验室的领导者中,你列出的AI发展时间线是最短的,为什么会这么短?我们又为什么要相信你们的时间线?

  达里奥·阿莫迪:这取决于你所说的时间线是什么意思。人工智能的世界中经常出现各种术语,比如AGI和超级智能。你可能会听到公司领导说我们已经实现了AGI,我们正在向超级智能迈进,或者有人停止研究AGI并开始研究超级智能,真是令人兴奋,但我认为这些术语完全没有意义。我不知道AGI是什么,也不知道超级智能是什么,这些听起来像是营销术语,像是某种只激活人们多巴胺的东西。

  所以我在公开场合从来不使用这些术语,我认为真实存在的事情就是AI指数级的增长速度,我们的想法是每隔几个月就会得到一个比以前更好的AI模型。我们在AI模型上投入更多的算力、数据和新的训练方式来实现这一点。最初是通过所谓的预训练来完成的,也就是将来自互联网的一堆数据输入到模型中,现在我们有了第二阶段即推理训练,它涉及强化学习的第二阶段。现在正如我们各个公司的AI模型中看到的那样,这两件事正在一起扩大模型的规模。我们已经看到了AI模型在数学和代码方面的进步,已经非常接近高专业水平,但在主观任务方面还没有明显进步,不过这只是暂时的障碍,我看到的是模型指数级的增长速度。

  人们可能不太理解什么指数级增长,如果某样东西每6个月翻一番,那么在它发生这种变化的两年前,看起来只是完成了1/16,如今我们处于2025年中期,很多模型在经济方面开始了爆炸式增长。以Anthropic为例,我们在2023年营收从零增长到1亿美元,在2024年营收从1亿美元增长到10亿美元。2025年上半年我们营收预估可达4.5亿美元,假设按照这个指数级增长速度发展两年,营收规模可能会进入千亿美元,当然这不是一定会发生的,只是假设。我的意思是当AI处于指数级发展速度时,你真的会被它愚弄,现在看起来才刚刚开始成为一件事,但距离它疯狂增长或许只剩两年的时间。

  达里奥·阿莫迪:我只能谈论Anthropic的模型,就Anthropic的模型而言,以编码为例,编码领域的模型发展得非常快,我们发布了Claude 3.5、3.6、3.7、4一系列模型,每一个在编码方面的能力都比上一个好得多。具体可参考模型在基准测试平台SWE-bench上的表现,Claude模型的评测数据18个月前增长速度还是3%左右,现在一路增长到了72.7%,它实际的使用量也呈指数级增长。模型的进步非常快,而且我们没有看到任何收益减少,也没听其他公司说过收益因为规模扩大而减少了。

  主持人:也许Anthropic是一家拥有正确想法但资源不足的公司,因为像xAI和Meta等公司都投入了大量资源来扩大他们的数据中心规模。虽然你们也筹集了数十亿美元,但他们资金实力雄厚,Anthropic有可能竞争得过他们吗?

  达里奥·阿莫迪:目前我们已经筹集了近200亿美元的资金。我不认为我们的数据中心规模比该领域其他公司的小得多,这些东西通常都受到能源的限制。当人们谈论这些巨额资金时,可能会连续几年都在宣传它,但消息出来时或许他们还没有真正得到资助,所以我们实际上非常有信心,我们建造的数据中心规模不比他们的差。

  主持人:你如何看待马克·扎克伯格最近在招揽AI人才方面所做的努力?人才在AI竞争中能起多大的作用?

  达里奥·阿莫迪:这是件很有意思的事,相对于其他公司,Anthropic的人很少受到影响。我和很多人谈过,Anthropic也有人收到了扎克伯格的邀请,但他们拒绝了,只回复说:“不,我会留在Anthropic。”

  我在公司内部发布了全员信,强调我们公司坚持薪酬公平原则,来回应扎克伯格的挖角行为。Anthropic的工作方式是采用一系列层级结构,新员工进来,他们被分配到各个层级的岗位上,同一层级的员工薪资相差不大。同一层级的员工技术一样,才华一样,凭什么其中一人比另一人获得10倍的报酬。如果你允许他摧毁你的公司文化,引起了你的恐慌,从而开始不公平地对待员工,那会让公司真正受到伤害,这实际上是公司应该团结的时刻,拒绝妥协我们的原则。他在试图购买一些用钱买不到的东西,很多人并不只是看重钱。

  主持人:那么让我们来谈谈你的业务吧,你提到Anthropic筹集了近200亿美元的资金。你是如何筹集到这些资金的?因为你们并不属于大型科技公司,难道只需要带着规模定律(scaling law)去对他们说:“我能得到一些钱吗?”

  达里奥·阿莫迪:我认为在这方面天赋是最重要的。三年前,我们只筹集了数亿美元的时候,OpenAI已经从微软筹集了130亿美元。当时我们提出的观点是,我们知道如何让这些模型比其他模型更好,模型性能增长方面可能存在规模定律。我们能用1亿美元做别人用10亿美元能做的事情,用100亿美元做别人用1000亿美元能做的事情,那么投资我们公司要比投资其他公司资金效率高出10倍。如果能以同样的价格制造出比其他人都好得多的东西,或者以更低的价格制造出与其他人一样好的东西,投资者都是聪明人,他们知道如何选择。

  主持人:CNBC报道称,Anthropic的收入中有70%~75%来自API调用付费,这个数据准确吗?

  达里奥·阿莫迪:我不会给出确切的数字,但收入大头确实来自API调用付费,尽管我们的应用程序业务也蓬勃发展,最近高级用户和程序员都在使用Claude模型,但大多数业务还是集中在API调用付费上。

  主持人:因此你对这项技术进行了最纯粹的押注,就像OpenAI押注ChatGPT一样,为什么你要对这项技术本身进行纯粹的押注呢?

  达里奥·阿莫迪:我不会那么说,我倾向于将此描述为我们在押注模型的业务用例,而不是API本身,只不过该模型的第一个业务用例是通过API来实现的。OpenAI非常注重消费者业务,而我们的观点是企业对AI的使用需求比消费者更大,或者说AI的商业应用需求更大,高级用户会用它来提高生产力。成为一家专注于商业用例的公司实际上更能驱动我们不断改进模型。设想一下,假如我这个模型本来相当于生物本科生能力水平,然后我对它进行了改进,使它拥有生物博士生的能力水平,如果我将这个消息告知消费者,或许99%的人都不关心这个问题,但如果我把这个消息告知辉瑞(Pfizer,Inc.美国跨国生物制药公司),他们可能会花10倍的价格买下这个新模型。

  AI发展的终极目标是解决世界上的各种问题,就像我文章里写的那样,解决生物医学、经济发展、教育、法律等我们迫切需要解决的实际问题。这些问题可以更好地激励人们努力开发模型,探索更多积极业务。

  主持人:现在你们正在销售Claude模型,但定价方式令人感到困惑,我与一位开发人员交谈时,他们说从你们公司的API中获得了每月相当于6000美元的收入,而他每个月最多只需要支付200美元的费用即可。埃德·齐特龙(Ed Zitron,英国科技作家)曾指出,如果人们是这项技术的超级用户,你的模型越受欢迎,你损失的钱就越多。那么这样做有什么意义呢?

  达里奥·阿莫迪:定价方案和费率确实设计得非常复杂。实际上人们并没有完全理解该如何使用这些模型,也不清楚到底能从模型中获得多少收益。因此在过去的几天里,我们进行了调整,特别是在opus等规模较大的版本上,降低了订阅费用,未来可能还会有更多的变化。总的来说我们并没有亏钱,我们分析过用户使用量和算力支出,并不会发生用户获得越多,模型就损失越多的情况。

  主持人:我想还有另一个问题,你是否可以在不提高价格的前提下继续提供这些服务?因为我听有些开发人员抱怨过,使用Anthropic新模型的成本提高了。

  达里奥·阿莫迪:我的想法是随着模型越来越好,我会考虑它们创造了多少价值,所以你这个问题中的假设不一定正确。还有一个单独的问题,那就是价值是如何在制造模型的人、制造芯片的人和制造底层应用程序的人之间分配的,所以不要在太具体的点上纠结价格。我确实希望提供一定水平的AI模型价格能够下降。提供前沿智能可以带来某种程度的经济价值,这种价值可能会上升,也可能会下降,我猜测它的价格可能不变,但所创造的价值会大幅上升。预计两年后我们将会拥有与现在成本相同的模型,但它们的工作能力更强,更加自主,应用的范围更加广泛。

  主持人:有报道称Anthropic的毛利率略低于软件毛利率,你可能需要提高这些模型的收费标准。

  达里奥·阿莫迪:我认为较大的模型比较小的模型运行成本更高,Anthropic的模型大多比较小,运行成本没那么高。就模型成本而言,要把利润率从百分之x提高到百分之y,真的很难,所以我们一直在改进的点是让模型的运行效率提高50%。我们才刚刚开始优化推理,模型的推理能力已经有了很大的提高,这才是我们模型价格下降的原因。

  达里奥·阿莫迪:虽然运行模型是有成本的,模型生产的每一美元都有一定的成本,但实际上已经相当有利可图了。其实花在支付工资和公司运营上的费用并不高,最大的成本开支是训练下一个模型。

  我认为公司亏损和不盈利是两个概念。假设在2023年,你训练了一个价值5000万美元的模型,然后在2024年发布了出去,它创造了2亿美元的收入,但此时你又花费了10亿美元在训练一个新的模型,而在2025年,这个10亿美元的模型又创造了20亿美元的收入,此时你又花费了100亿美元来训练下一个模型。从公司的角度来看,每年都是不盈利的,2024年损失了8亿美元,2025年又损失了80亿美元,看起来这像是一个无利可图的行业。但如果从每个模型是否盈利的角度来思考,第一年在模型上投资了1亿美元,然后第二年赚了2亿美元,那这个模型的利润率就是50%,接着又在新模型上投资了10亿美元,第二年赚回了20亿美元,这么看,每个模型都是盈利的。

  主持人:那你怎么看开源?假设你停止投资开发模型,然后其他开源模型追赶上来了,人们可能就会换用开源模型了,我很想听听你对此的看法。

  达里奥·阿莫迪:我在2014年从事人工智能研究的时候,当时有一个人工智能和机器学习研究社区,他们以特定的方式思考问题,我们认为当时的AI只是一时的热潮,它行不通,无法扩展,后来大家也看到了AI模型的指数级增长速度,证明了我们当时的想法都是错误的。

  我们正处于这样一个阶段,世界上的商业领袖,比如投资者和企业都在不断创造可以营销的词汇,开源就是其中一个。我从来没有用那个词汇来思考过,在这种情况下什么都不知道,往往会让你做出比那些拥有上一代技术思维方式的人更好的预测。

  我不认为开源在人工智能中的工作方式与其他领域相同。主要是因为有了开源,你可以看到模型的源代码,而看不到模型内部的所谓的开源,通常被称为开放权重。它有很多好处,那就是很多人可以研究它。实际上我一直把开源看作是一种转移注意力的手段,当看到一个新模型出现时,我并不在乎它是不是开源的,比如DeepSeek,我不认为DeepSeek是开源的这一点很重要,我只关心这是一个好模型吗?比我们的模型更好吗?

  达里奥·阿莫迪:我刚来旧金山的时候,这座城市还没有这么先进,科技热潮还没有发生,直到我上高中,这座城市才逐渐掀起科技热潮。一开始我对科技不感兴趣,反而想成为一名科学家,对物理和数学更感兴趣。当时的我根本没有编写一些网站之类的想法,也没有想创办一家公司,我对发现基本的科学真理很感兴趣,想着怎样才能做一些让世界变得更美好的事情。我看着科技热潮在我周围发生,虽然不感兴趣,但确实从中学到了很多东西。

  达里奥·阿莫迪:我一直和他们保持着非常密切的关系。他们教给了我一种是非观,告诉了我什么是最重要的,给我灌输了强烈的责任感。我生活在一个非常有爱心的家庭,我和妹妹丹妮拉的关系也非常好,她也是Anthropic的联合创始人。我们很早就决定要以某种方式合作,不过没想到能把公司做到今天这个规模。

  达里奥·阿莫迪:他病了很长时间,最终在2006年去世了。父亲生病是促使我进入AI领域的原因之一,在进入AI和生物学领域之前,我在普林斯顿想要成为一名理论物理学家。我在那里的头几个月做了一些宇宙学方面的工作。后来父亲生病去世,我的研究领域转向了生物学,试图解决人类疾病和生物学问题。我开始与在普林斯顿大学从事生物物理和计算机神经科学工作的人交流,启发了我转向生物学和计算机神经科学。当我在生物学领域工作了很多年之后,我意识到生物学中潜在问题的复杂性似乎超出了人类的能力规模。为了解决这一切,需要成百上千的人类研究员,他们通常很难合作或分享彼此的知识,也很难结合他们的知识去突破问题,而我接触人工智能后发现,它是唯一能够弥合这一差距的技术,可以让我们超越人类的能力规模,充分理解和解决生物学问题。

  达里奥·阿莫迪:当然,但是这也告诉了你解决相关问题的紧迫性。你知道曾经有人致力于治疗这种疾病,他们也成功治愈了这种疾病,挽救了许多人的生命,但是如果他们能够再早几年找到治疗方法,或许可以挽救更多人的生命。

  我可能比任何人都更了解获得AI这些好处有多么紧迫,我明白其中的利害关系。当我谈到AI存在的风险时,有些人却给我扣上了“末日论者”的帽子,他们说“这家伙是个末日论者,他想拖慢AI的发展。”我非常生气。我的父亲就是因为没有等到治疗方法去世的,我比任何人想技术发展得更快一些。某些人在社交平台X上为AI加速而欢呼,我认为他们没有从人文主义的角度看待这项技术的益处,他们是肾上腺素飙升,想为某事欢呼,想要AI加速发展,但没有真正理解AI发展会带来的益处与问题,所以当这些人称我为“末日论者”时,我非常生气,也绝不承认这样的指控。

  达里奥·阿莫迪:许多活动都是技术性的,与你想要产生的影响力没有直接关联。我进入人工智能领域的原因是,如果没有人工智能,生物学的问题几乎是无法解决的,或者说进展太慢。而之所以我自己想创办一家公司,是因为我曾在其他公司工作过,觉得那些公司的运营方式并不是真正以产生影响力为导向的。

  达里奥·阿莫迪:我的确参与了这些模型的扩展工作,实际上构建GPT-2和GPT-3的最初原因是我们正在进行AI校准工作,我和Paul Christiano以及后来的多位Anthropic联合创始人从人类反馈中开发出了被称为RL(强化学习)的技术,旨在帮助引导模型朝着遵循人类意图的方向思考。后来我们发现即使运用来自人类反馈的更原始的RL技术,它也无法与我们的GPT-1语言模型一起工作,而这个模型是由OpenAI的其他人构建的,因此我们对GPT-2和GPT-3进行了扩展,以便研究这些技术,从而大规模应用来自人类反馈的RL。

  我认为在这个领域,人工智能系统的安全性和能力是以某种方式交织在一起的,比我们想象的更加紧密。这让我意识到分别研究人工智能系统的安全性和能力是行不通的,只做好其中一件事非常困难。所以有时候组织层面的决策会影响到很多东西,什么时候发布产品,什么时候进行内部研究,在系统上做什么样的工作,这些都和组织决策有关。这就是激励我和Anthropic其他联合创始人创业的原因,我们想按照自己的方式去做这些事情。

  主持人:把这件事比作开车,你在OpenAI是推动前沿模型开发的人,相当于坐在副驾驶位置,但如果你离开并创建自己的公司,就相当于坐在了主驾驶位置上,可以控制这辆车按照你想要的方式安全行驶。

  达里奥·阿莫迪:我再强调一下,那些关于发布模型、公司治理、公司对外形象展示、公司的AI部署以及公司对社会责任的承诺等决定都很重要。很多事情不是通过训练模型就能控制的,信任非常重要,公司的领导者必须是动机真诚、值得信赖的人。

  Anthropic创始人:DeepSeek是不是开源并不重要|中企荐读@应该比较重要的,1.遵循国际主流共享模式,认同该价值观,也就是与国际主流接轨2.摩尔定律一直在起作用,普遍认为是18个月左右,且有不断缩短的趋势。简而言之,就是过期作废。官场有个59岁现象,马上就要退休了,有权不用,过期作废。3基于规则互惠互利。何乐而不为呢? 以后会是常态化操作。

相关应用