找回密码
 立即注册
科技快报网 首页 科技快报 业界资讯 查看内容
百店开业 千店同庆!联想十一购机福利大放送:打卡门店送贴膜服务、到店购机抽奖必中得力集团就"跛脚员工入职被辞"事件致歉并公布整改措施一群“数贸新生代”即将从义乌搅动全球鲸鸿动能发布“Family Reach”家庭场景化解决方案,撬动营销新增量猜诺奖赢百万京豆!京东图书开启“2025文学预言”狂欢KWL新店继上海后落子重庆,酷特智能“逆周期动力”从何而来?易车研究院洞察报告:自驾游成车市新增长极?旅游复苏带动汽车消费结构性变化东软以“可信、可控、可持续”路径,引领AI医疗进入深水区多筒洗衣机新品9月扎堆首发 京东已成核心销售阵地发布全新太阳能智能杀虫灯,以绿色科技守护农业未来赛意信息以工业AI验证技术价值,向物理AI开启进阶之路高通专家:在“混合AI”的未来,6G 将成为连接云与边缘的核心纽带打响AI价值落地第一枪,天润融通携ZENAVA亮相2025云栖大会首驱发布“智能出行机器人”,三大行业首创技术重塑两轮赛道宜信公益基金会深化帮扶合作,共筑卓资县学子成才之路出海寻增量,东南亚凭什么成商家 “必争之地”?讯飞星火秋招“整活”,呼兰的星火奇妙夜“空降”高校!高通安蒙谈未来愿景:让AI真正无处不在海尔、格力、康巴赫限量5折抢 京东家电家居好物国庆惊喜大放价HC2025丨高校创新力量“花开”开发者日,鲲鹏昇腾使能科研创新

智元机器人姚卯青:以世界模型驱动飞轮,解锁具身智能规模化应用

2025-08-13 17:28:12

 8月10日,2025 世界机器人大会在北京举行。智元机器人合伙人兼具身业务部总裁姚卯青在会议上发表了题为《通向具身智能大规模突破之路——智元的本体数据算法飞轮》的演讲,系统阐述了智元在具身智能领域的探索成果与未来方向。

 姚卯青介绍,上海智元机器人成立于 2023 年 2 月,自创立起便致力于推动 AI 与机器人的深度融合。至今,智元已取得一系列扎实成果:发布全系列多款机器人产品,建成规模化生产产线与机器人训练场数据采集中心,在具身智能相关算法领域实现多项创新,并在多个实际应用场景完成探索验证,为技术落地筑牢根基。

 姚卯青强调,机器人企业要让软硬件产品在行业有效落地,核心在于构建 “本体 - 数据 - 模型 - 场景” 紧密耦合的全栈布局。这四者形成相互驱动的飞轮迭代逻辑:优质本体产生高质量数据,海量高质量数据支撑算法持续突破,算法结合场景试错后,又为本体优化、数据采集方向、算法迭代提供新指引。这种闭环循环不断加速,未来智元将分享更多飞轮迭代成果。

 “进入飞轮循环的首个挑战是数据。”姚卯青指出,与大语言模型从业者不同,机器人从业者需直面物理世界强交互特性,既要调试硬件,又要将模型部署到工业级系统测试,这使得数据需求与互联网数据存在本质差异。

 “然而,现有互联网数据对机器人训练远远不够,” 姚卯青解释道,“机器人需要大量动作类、长程规划类数据,这类数据在网络上极为稀缺。” 为此,智元希望 “种下第一棵树”,吸引更多同行加入数据建设,共同形成数据海洋,目前这一探索已取得阶段性成果。

 为破解数据难题,智元于2024年底开源了AgiBot World百万真机数据集。姚卯青表示,该数据集旨在提供工业级高质量数据支撑,包含百万条机器人数轨迹,每条数据都经过多轮审核,确保场景贴近现实、任务复杂多样。

 姚卯青还表示,AgiBot World数据集只是起点,智元在数据采集方式上有两项关键创新:

 对抗式采集数据:在常规数据采集过程中主动引入干扰,例如改变语言指令、制造视觉扰动等,以此提升数据信息密度。实践证明,这种方式能提供数倍于常规数据的信息量,有效加快机器人训练收敛速度,且已在多任务和多构型机器人上验证效果。

 自主进化式的数据采集:针对机器人在真实环境中自主执行任务时难以提前枚举的 “长尾失效” 问题,智元引入自主进化式采集方案。 当机器人执行任务失效瞬间,系统自动接管并打断进程,回退到失效前状态,再通过人工接管完成数据采集。这一方式能将难场景下的高价值数据补充到训练集,有效拓展数据分布边界,依托数据扩增提升机器人能力上限,其逻辑类似 Dagger 算法框架。

 姚卯青说,围绕数据消费,智元于今年 3 月推出具身智能基座模型GO-1 。该模型在架构上实现双重创新:依托 VLM 基础模型和 MOE 混合专家架构,其中 “隐式动作专家” 融合多源数据形成通用动作表达,“显式动作专家” 则将通用描述精准落实到特定本体控制,让机器人既能从人类视角学习动作规律,又能掌握物理世界交互逻辑。

 姚卯青指出,GO-1 模型发布后,其在生活、零售、工业三大场景的评测中表现尤为亮眼。相较于 3 月时的海内外开源模型,成功率提升 10%-30%。同时,智元发布的AgiBot World数据集,能够很好的验证 Scaling Law,研究揭示了预训练关键规律:数据量、多样性及质量对模型性能影响显著,且实验证明,单一本体预训练数据的后训练迁移效果优于多本体数据。这表明,机器人预训练的核心在于数据场景的多样性、质量,以及适配的模型设计。

 “除 GO-1外,智元团队深耕世界模型方向,秉持 “生成理解一体化” 理念。正如人类做事前会在脑海中规划推演,机器人也需依托世界模型精准推演,缩短与实际操作的差距。测试显示,在智元自身本体的多任务测试中,GE-Act 效果优于近期开源的 UniVLA 和 NVIDIA 的 GR00T 模型;针对跨本体迁移能力,以AgiBot World数据集训练的 GE-Base 模型,在 Franka 等本体上表现优异,在开源 Benchmark 和真机测试中,成功率显著高于现有开源模型。”姚卯青说

 姚卯青强调,基于世界模型生成的动作,智元机器人能完成叠衣服、组装纸盒等复杂双臂灵巧操作,也能在工业传送带上精准执行物体抓取和打包任务。值得注意的是,相较于 VLA 等短时序输入输出模型,具备长时序推演能力的 GE-Act 在动态场景抓取定位精度上优势明显。

 GE-Sim 以动作序列为输入,如同高精度仿真器,能在杂乱真实环境中渲染画面,且具备时空一致性和语义合理性。对比测试显示,其与真实机器人的推理效果高度一致,量化成功率接近。姚卯青说,依托该仿真器,可快速迭代机器人策略,极大缩短模型研发周期,减少实际评测中的复杂流程与损失。

 姚卯青表示,为规范世界模型评测,智元推出 GE Bench 并已在 GitHub 和 HuggingFace 开源,成为 IROS 世界模型挑战赛的重要准备工具。 该 Benchmark 从轨迹遵循度、语义合理性、因果一致性等多维度评估模型,而基于机前数据预训练的 GE-Base 模型,在各维度表现均优于主流视频生成类模型。

 姚卯青分享了智元在机器人研发中的实践心得:机器人本质要回归执行器,优质执行器是性能基础;传感器虽重要,但调教与量产一致性是行业难题;若聚焦单一机器人类型,人形是较合理的选择;具身智能应是 “机器人 + AI”,需深度结合硬件本体;此外,必须追求量产和一致性,以减少各环节误差。

 姚卯青表示,智元计划将上述 “苦涩教训” 融入飞轮迭代,并于今年下半年推出新一代机器人 AgiBot G2。该平台采用更灵巧的本体设计,对传感器、执行器提出更高标准,搭载英伟达 Thor 高算力量产域控制器,被定义为 “工业级交互式具身智能作业全球标杆平台”,引发行业广泛关注。

 姚卯青强调,“数据 - 模型 - 本体 - 场景” 飞轮的转动,最终是为赋能千行百业。过去一年,智元在多场景取得突破:柔性制造中,用具身智能解决专业设备无法应对的高精度、力控、泛化性操作问题;物流分拣上,具身智能通用机器人与专用设备配合,处理传统视觉定位 + 规划难以完成的杂乱物品分拣;此外,还实现了安检岗点人力清零、电力通信机房巡检操作等场景的人力替代与降本增效。

 “具身智能赛道广阔,” 姚卯青呼吁,“希望全球同行携手,共同探索这一智能边疆,让技术真正创造价值。”

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:sophia

相关阅读

微信公众号
意见反馈 科技快报网微信公众号