开源社区

Github的十字路口:并入微软AI是开源精神的终结吗?

Github的十字路口:并入微软AI是开源精神的终结吗?

  • 发布:
  • 人气: 2
  • 评论: 0
标签:

应用介绍

  8月11日,Github CEO Thomas Dohmke宣布卸任,而后微软宣布不会有继任者。随之而来的,是Github宣布并入微软的Core AI部门。这一举措,在科技界引起轩然。

  自2018年被微软收购以来,Github一直保持独立运营,并始终坚持自己的开源文化。而如今这一举动不得不让开发者们发出疑问,Github在未来是否还能继续保持独立?这个开源乌托邦是否终将迎来落幕?

  本期文章,我们就来聊聊,这个全球开发者们的理想社区为何行至于此?而微软又为何走出这步?AI的发展,是否必然意味着开源精神的终结?

Github的十字路口:并入微软AI是开源精神的终结吗?

  八年前,一个名叫Thomas Dohmke的程序员在Reddit上发帖:我是Thomas Dohmke,HockeyApp的联合创始人。我们的软件旨在方便开发者进行移动App的beta测试、收集崩溃报告。在这条帖子的评论里,聚集了一大批热情的开发者。

  当时,他的公司已经被微软收购,成为微软移动业务中的一环。Thomas本人也加入了微软,并在2021年成为了Github的首席产品官。几个月后,CEO Nat Friedman宣布离职,并在推特上表示要“回归自己的创业初心”,而Thomas则代替Friedman成为了Github的CEO。

  不过,今年8月11日,Thomas也突然宣布卸任。在博客上,他用母语德语向Github及其背后庞大的开发者社区道别,并说了和当年Friedman一样的话:我的创业初心始终牵动着我,所以我决定离开Github,再次创业。但让所有人措手不及的是,这次Github却没有任命新的CEO。

  微软CoreAI部门的主管Jay Parikh宣布,Github将不再独立运营,而是完全融入今年一月成立的CoreAI。这具体体现在两项组织结构变化:第一,微软开发者部门主管Julia Liuson将负责监督GitHub的营收、工程及支持工作。其次,GitHub首席产品官Mario Rodriguez,将向微软AI平台副总裁Asha Sharma汇报。

  很多人看到这则新闻的时候才发现,自2018年微软收购Github以来,已经过去七年了。说实话,这七年里微软的存在感一直很弱。Github作为一个子公司,始终是独立运营,并长期坚持自己的企业文化。这种文化,和“开源”密不可分。

  所以在我看来,Github不单是一个平台,它其实是一个社区,能够让各种相信开源这个运动的开发者能够一起协作,然后让大家更好的去推进软件的发展。

  Jasper Zhang是Hyperbolic的创始人及CEO,他的产品旨在为新兴的AI项目提供灵活和高性价比的算力。他告诉我们,开发者主要担心的是,Github在未来是否还能继续保持独立?

  这样的担心来自于两个方面:一方面,是Github的商业决策是否会更加贴近微软的Azure和AI战略,在基础设施的选择上更加依赖微软,并将原本的免费功能付费化。另一方面,在各大实验室也面临AGI竞争的情况下,开发者担心微软是否会使用平台上大家上传的代码去训练自己的AI。

  但与此同时,也有人乐观地认为,这次架构调整会进一步强化AI工具的能力,让开发过程更便捷。那么,微软为什么要走这一步棋?Github及其开发者的未来又将如何?要解答这个问题,我们先来回顾一下Github的历史。

  Github的故事,要追溯到1991年。那年,芬兰裔美国工程师Linus Torvalds创建了Linux内核,也就是全球无数服务器、安卓手机和超级计算机都在运行的核心系统。2005年,他写了Git这个版本控制系统,作为Linux的官方版本控制工具。

  所谓版本控制,主要用来追踪和管理代码变更,不仅能让每个开发者的电脑上都保留完整的代码历史,还方便多人协作。但一开始的Git几乎全是命令行操作,使用之前要搞懂很多术语,对于初学者和非核心开发者来说门槛很高。于是,Github诞生了。

  2007年,一名叫做Chris Wanstrath的年轻人从大学辍学,搬到了旧金山,在线上网站CNET当一名网页工程师,但他同时也在开源社区里十分活跃。在旧金山市中心的一家酒吧里,他遇到了同样熟悉开源和Ruby开发语言的Tom Preston-Werner。两人都看到了Git的潜力,于是一拍即合,决定做一个让Git更便于使用,且开源友好的工具。这个工具,叫做Logic Awesome,后来改名为更直观的Github。

  几个月后,Chris在CNET的前同事PJ Hyett也加入了这个团队,三人在2008年4月推出了Beta版Github。Github并不是第一个Git托管方案,但却比之前的任何一个方案都要简单、直观和有趣:它不仅是一个便于使用、界面美观的网页版Git仓库,还带有社交功能,比如用户资料、关注、和动态信息流,让每个用户都能看到公共仓库上的编程协作和成果。

  一开始,Github先在Ruby开发者中流行了起来,后来扩展到了更广泛的开源社区。刚才我们说到的免费公共仓库吸引了开源项目,而需要付费的私密仓库则开始吸引企业客户。

  在2010年代,也就是Marc Andreessen口中“软件正在吃掉世界”的那段时间,Github成了软件公司追捧的工具,Andreessen的a16z也给Github投了1亿美元,赌的就是Github会成为下一个微软或者甲骨文。

  后来的故事,我们就都知道了。Github从一个酒吧里诞生的业余项目变成了全世界最大的源代码托管平台。可以说,几乎所有的现代主流开源项目都在Github上发布或托管过。这就包括编程语言Python和Rust、开源深度学习框架Tensorflow和PyTorch,以及支持软件部署的基础设施Docker和Terraform等等。

  2018年,微软以75亿美元收购了Github。其实当时,很多用户就对Github是否还能保持作为第三方平台的中立性提出了质疑。但当时,微软向开发者承诺,Github将保持独立运营,不干涉其开放性。为此,微软还聘请了在科技界广受尊重的Nat Friedman,最终Github依旧是深深根植于热爱编程的开发者和开源社区当中的平台。

  事实证明,微软收购Github的几年中,确实做到了当时的承诺。开源生态依旧繁荣,Github也保持了相对独立,没有出现优先服务微软的Azure、Visual Studio等生态的情况,也没有出现激进的收费、广告以及与产品的强绑定。

  甚至在2021年,在Thomas麾下的Github还推出了Copilot这样的重磅创新,成为了首个被大规模应用的AI编程助手。2022年6月,Github向所有个人用户开放了Copilot,这甚至比GPT 3.5的出现还早几个月。在六月的一次采访中,Thomas透露,早在2020年GPT-3发布后,Github就通过微软和OpenAI的合作获得了早期访问权限,并发现GPT-3能用多种编程语言写出不错的代码,随后OpenAI针对编程场景微调出Codex模型,而Github也发布了Copilot,几个月就突破了100万用户。

  我们和OpenAI一起意识到,GPT-3能够用多种编程语言写出相当不错的代码,而且不会混淆Python、Ruby和JavaScript的语法。这周有人问我最让我惊讶的是什么,我的回答就是即使没有内置编译器,它也能做到。

  这项功能运行得非常好,所以我们很快就看到公司内部的Hubbers(GitHub 员工)开始使用这个工具,给出了非常高的评价,说“这个太棒了,我想一直用下去。”这并不是那种“管理层让你用但你其实并不想用”的情况。

  虽然一开始Copilot让开发者非常惊艳,但是,随着AI的发展,编程助手很快成了各家大厂和初创公司的兵家必争之地。尽管使用Github Copilot的人数依然很高,达到了2000万用户,但市场上也出现了其他更好用的产品。

  慢慢的会有一些新的初创公司做类似的功能,因为本质上只要这个模型够好,你就可以通过做一个coding agent去解决问题,所以慢慢的像Cursor、Windsurf这些软件都发布了,Cursor就做的非常好,然后就把market share给抢过去了。

  不少人猜测,这就是微软要把Github和CoreAI部门紧密结合的原因:在AI时代,Github最大的价值已经不是作为代码仓库而存在,而是Copilot这样的AI开发工具。在Thomas的告别信中,他数次提到Copilot,表示“Github Copilot是继个人电脑之后,在软件开发领域最伟大的进展。”而Satya Nadella也提到Copilot对AI的重要性,并在三个月前宣布开源Copilot,从而抢回市场份额。

  开源是GitHub的核心。现在我们正迈出下一大步。随着GitHub Copilot在VS Code中不断演进,AI已经成为编程过程中的核心部分,这也是为什么我们决定将Copilot在VS Code中开源。我们对此感到非常兴奋。

  所以,微软此举是要让Github从“代码托管平台”彻底转型为“AI开发工具核心”,并把Copilot的经验和技术输送到整个微软的Copilot生态中。Github Copilot的技术、用户反馈和生态数据都对整个微软的AI布局至关重要。通过最开始我们说的精简Github组织架构,直接对接微软的AI负责人,让微软能更好的统一资源投入。

  但是,在微软野心勃勃的商业前景里,却并没有提到那些开源开发者们,也就是Github作为一个代码分享社区存在的意义。

  但我觉得一个更大的担心是,Github会慢慢的不让其他的用户或开发者通过API去access(访问)这些public(公开)的数据。举个例子,在AI来临之前,reddit的用户可以直接通过API去读取平台上大部分的数据。甚至还有很多第三方的软件会调用这些API,让你通过第三方软件去聊天。

  但如果大家看过两年前我们发的关于《从loser文化到AI数据金矿:美国贴吧Reddit的19年爱恨史,及新资本故事》,就会知道:在AI时代,Reddit变成了一座“数据金矿”,官方显然不愿意让第三方软件再免费获取这些数据,于是态度强硬地限制了API的使用。现在人们担心,Github也会面临一样的命运。

  一旦你的代码无法提供百分之百的access(访问),总是会带来一些局限。如果它是一个代码分享平台,但是却需要用户付费才能使用他人代码的话,就会带来不好的用户体验。

  CEO的离开,象征着那个承载着开源与黑客精神的独立Github时代的落幕。但话说回来,Github作为一个历史悠久、全球最大的开发者社区,要让用户舍弃现存的机制,搬移到其他开发者社区,几乎是不可能的事情。

  通过刚才的分析我们也知道,对于微软来说,让Github成为微软AI版图的一部分不失为一个合理的举措。但在这种情况下,微软还能否继续保持对开源精神的尊重和对开发者的开放性?这将是全球数千万开发者最关心的问题。

  就像Satya Nadella自己说的:我们内部的组织架构,对我们的用户和竞争对手都没有任何意义。或许,正如十七年前那个旧金山酒吧里诞生的想法一样,Github的真正价值,不在于它属于谁,而在于它能否继续成为全世界开发者的共同家园。

相关应用