
全面开源!星海图全球首个开放场景高质量真机数据集登陆魔搭社区
应用介绍
Galaxea Open-World Dataset是星海图专为具身智能基础模型训练打造的超大规模开放世界数据集,数据集依托星海图 R1 Lite完成采集,在真实的人类生活与工作场景中完成采集任务,覆盖住宅、厨房、零售和办公室等。与大多数在模拟环境或受控实验室采集的数据集相比,Galaxea Open-World Dataset 在
Galaxea Open-World Dataset是一份面向未来的资源,也是构建多任务、多技能、多环境泛化智能体的重要基石,从复杂场景感知到高频决策执行,Galaxea Open-World Dataset为研究者和开发者提供前所未有的真实数据支持。
Galaxea Open-World Dataset开源后,迅速成为具身智能领域的 “焦点资源”,开发者热度与行业应用案例共同印证其价值:
项目在魔搭社区上线后一周以内,迅速登顶数据集推荐榜单之一,一周内累计下载量超 2 万次,断层领先其他同类项目在魔搭社区的下载量;在 AI 模型与数据集共享平台 Hugging Face 上,该项目累计下载量超5万次。
星海图将持续完善开源生态体系,服务更多的开发者,加速具身智能从实验室创新迈向普惠性社会价值的转化。
G0模型采用“双系统”架构,以“慢思考、快执行”为核心理念,借鉴生物进化中大脑皮层与小脑不同频率运作的分工机制,实现能量利用效率更优。
与当前主流开源模型相比,G0模型在多项任务中表现优于π0,并在部分任务上实现了高达 20% 的性能提升。在仅使用 100 条任务轨迹进行微调的条件下,结合跨本体与单本体预训练的 G0(Full)模型在平均进度得分上表现更佳,全面超越Benchmark模型π0,尤其在物体拾取与放置任务中优势明显。
星海图开放世界数据集(Galaxea Open-World Dataset )作为全球首个开放场景高质量真机数据集,在采集过程中特别强调多视角覆盖和自然光照条件,确保感知信息更加接近真实部署环境,减少领域适配成本, Galaxea Open-World 不仅适合作为具身智能模型的预训练数据源,也能够作为评估移动操作与多模态任务规划能力的高标准基准。
Galaxea Open-World Dataset 与 G0 双系统 VLA 模型的结合,为具身智能的训练与部署提供了高保真、可扩展的技术路径。通过真实世界大规模数据采集、规划与执行分离的架构设计,以及分阶段课程学习策略,机器人在非结构化环境中展现了更强的泛化性与稳定性。
星海图团队致力于推动具身智能生态的发展,此次入驻魔搭社区,是星海图深耕具身智能开发者生态的重要举措。魔搭社区作为国内极具影响力的 AI 模型与数据集开源阵地,汇聚了数以万计的开发者、研究人员及行业从业者,形成了活跃且富有创造力的技术交流氛围。
在魔搭社区,国内开发者无需再受跨平台访问、资源适配等问题的困扰,开发者可以大幅缩短数据获取、模型调试的周期,能够更便捷地接入Galaxea Open-World Dataset的 *** 资源,有效降低技术应用的入门门槛;另外,星海图G0完整模型即将在魔搭社区开源,敬请期待!