开源社区

AI开源新思:数据开放与开放架构驱动具身智能落地与创新

AI开源新思:数据开放与开放架构驱动具身智能落地与创新

  • 发布:
  • 人气: 11
  • 评论: 0

应用介绍

  markdown 在2025年世界人工智能大会(WAIC)余温未散之际,2025CCF中国开源大会于上海召开,再次点燃了对AI技术发展与开源协作的关注。本次大会上,与会专家学者们将目光聚焦于AI时代的核心议题——

  中国工程院院士、清华大学计算机系教授郑纬民指出,AI大模型的生命周期中,数据获取、预处理与模型训练环节成本高昂,开源模式有望让小公司专注于模型微调和推理。同时,AI的进步依赖于“不断试错、持续优化”,开源能让全球开发者共同“找茬”、协同改进。中国科学院院士、南京大学教授吕建更是强调:“开源决定规模,规模决定涌现,涌现成就颠覆。”开源的本质在于共享、协作与透明,它不仅影响软件领域,更延伸至教育、科研、硬件等领域,推动技术普惠。

  当前,AI发展正经历从“模型中心”向“数据中心”的范式转变。高质量、高效率的数据基础设施是降低AI落地门槛的关键。然而,数据作为企业核心资产,在价值日益凸显的同时,也面临着数据安全与合规的挑战。中国科学院院士、北京大学教授梅宏解释道,即便大模型参数公开,若外界没有相同的训练数据,也难以复现其能力。因此,数据开放成为AI开源能否真正发挥作用的关键。传统开源模式在数据封闭的困境下,面临着“无米之炊”的窘境。

  面对AI时代的挑战,构建一个更高维的“开放”解法成为当务之急。开放数据的核心是“数据资源的有条件共享”。从开源到开放,并非倒退,而是数据管理的升级。开放数据通常附带场景限制,如禁止商业滥用、需脱敏处理,目的是释放数据价值以支撑AI训练与科研分析。中国工程院院士、中国工程院原副院长陈左宁指出,AI时代,设计精良的“开放架构”可能比完全公开的源代码更有意义。从“给代码”到“给接口、给标准、给合作框架”,将能让不同创新者在各自擅长的领域便捷接入与贡献,构建高效创新生态。这种模式能够有效降低协作门槛,加速具身智能等前沿技术的落地与应用。

  从本次开源大会的讨论来看,数据开放与开放架构已成为推动AI技术发展的重要引擎。在AI工具链日益完善的今天,如何平衡数据价值与安全,构建一个更加开放、协作的生态,将是决定未来AI发展高度的关键。你认为,在AI大模型时代,除了开源,还有哪些关键因素能够推动技术创新与应用落地?

相关应用