广告
加载中

智元机器人姚卯青:以世界模型驱动飞轮 解锁具身智能规模化应用

龚作仁 2025/08/13 15:00
龚作仁 2025/08/13 15:00

邦小白快读

智元机器人强调“本体-数据-模型-场景”飞轮逻辑驱动具身智能落地。

1. 数据是核心挑战,智元开源AgiBot World数据集解决稀缺动作类数据问题,包含百万条高质量轨迹。

2. 创新数据采集方法如对抗式采集引入干扰提升信息密度,以及自主进化式采集应对长尾失效问题,提高训练效率。

模型应用实践成效显著。

1. GO-1模型基于VLM和MOE架构,在生活、零售、工业场景测试中成功率提升10%-30%。

2. 世界模型如GE-Act优于开源UniVLA等,实现复杂操作如叠衣服或工业抓取。

实践心得提供可操作指南。

1. 强调执行器是性能基础,传感器需解决调教和量产一致性难题。

2. 人形机器人是合理选择,结合硬件追求量产以减少误差。

应用场景实现突破。

1. 柔性制造中解决力控和泛化操作问题,物流分拣处理杂乱物品。

2. 安检、巡检场景实现人力清零和降本增效。

智元机器人通过产品创新和品牌合作推动具身智能发展。

1. 品牌营销体现在开源AgiBot World数据集和发布GE Bench评测工具,吸引全球同行,奠定行业领导地位。

2. 产品研发涉及GO-1模型多重创新架构,整合多源数据提升泛用性,以及新推AgiBot G2平台搭载高算力控制器。

消费趋势和用户行为观察聚焦场景应用。

1. 在柔性制造、物流分拣等场景,具身智能解决传统设备问题,揭示消费向高效智能化转型。

2. 用户行为如工业环境长尾失效问题推动数据采集进化,提示需求多元化。

品牌渠道通过开源和合作伙伴扩展。

1. 开源数据集邀请更多企业加入建设数据海洋,形成合作网络。

2. 产品如G2定义工业级标杆,强化品牌在渠道中的竞争力。

具身智能赛道提供广阔增长机会。

1. 智元飞轮逻辑提示可学习点:本体优化驱动数据采集,模型结合场景试错反哺迭代,助力市场扩展。

2. 应用场景如安检人力清零、物流分拣合作专用设备,实现降本增效,为卖家带来正面收益和风险管理启示。

合作方式和机会提示显著。

1. 通过开源AgiBot World数据集和GE Bench,卖家可参与数据共享平台,提升策略。

2. AgiBot G2平台提供新商业模式,搭载先进控制器,帮助卖家应对复杂环境。

风险规避与政策关联。

1. 事件应对如传感器量产一致性难题,提示需关注供应链稳定性以避免负面影响。

2. 数据稀缺问题呼吁同行合作探索智能边疆,降低技术落地风险。

智元实践强调产品生产设计和数字化推进。

1. 执行器基础重要性:优质执行器是性能前提,传感器调教和量产一致性是行业难点,提示生产优化方向。

2. 设计需求聚焦人形机器人合理选择,需结合硬件本体提升效率。

商业机会在场景落地中浮现。

1. 柔性制造应用中解决力控和高精度问题,为工厂提供数字化转型启示,如减少人工误差。

2. 物流分拣合作模式,通过通用机器人处理杂乱物品,开辟新生产需求。

推进数字化依托数据创新。

1. 数据采集中心建成,采用对抗式和进化式方法提升数据质量,启示工厂如何结合AI优化生产线。

2. 量产一致性追求,在G2平台实现更高标准,降低各环节误差带来电商适配启示。

行业发展趋势指向具身智能深度整合。

1. 数据飞轮逻辑揭示:本体驱动数据,支撑算法突破与场景验证,加速行业迭代。

2. 新技术如GO-1模型和GE世界模型,在动态场景提升精度,展示未来方向。

客户痛点和解决方案明确。

1. 数据稀缺痛点,通过开源AgiBot World数据集和自主进化式采集提供解决方案,补充长尾失效数据。

2. 传感器调教难题,服务商可借鉴智元心得,优化模型如GE-Sim加速策略迭代。

服务模式依托工具平台。

1. GE Bench评测工具开源,多维度评估世界模型,帮助服务商量化性能。

2. 数据扩增方法如对抗式采集提升信息密度,启示如何快速响应客户需求。

商业需求呼唤平台支持和技术整合。

1. 平台最新做法:智元开源GE Bench在GitHub和HuggingFace,成为世界模型挑战赛工具,提供多维度评测功能。

2. 平台招商通过呼吁全球同行合作数据建设,扩展如AgiBot World数据集共享网络。

运营管理和风向规避指南。

1. 运营中,GE-Sim仿真器缩短模型研发周期,减少评测损失,提升平台效率。

2. 风险规避如数据分布边界拓展,通过进化式采集解决长尾失效,启示平台如何整合算法。

平台需求匹配场景落地。

1. 数据消费依托GO-1模型验证Scaling Law,揭示预训练规律需多本体适配,指导平台开发方向。

2. 飞轮逻辑强调闭环迭代,帮助平台优化运营流程应对动态需求。

产业新动向集中在数据模型飞轮。

1. 本体-数据-模型-场景飞轮驱动具身智能突破,揭示迭代机制如数据质量影响模型性能。

2. 新问题如物理世界交互差距,世界模型GE-Act通过长时序推演解决动态场景定位难题。

政策法规启示与商业模式分析。

1. 开源策略如AgiBot World数据集发布,启示数据共享法规建设,推动产业合作规范。

2. 商业应用在柔性制造等场景实现人力替代,提供降本增效模式研究案例。

研究方法依托工具和测试。

1. GE Bench Benchmark提供轨迹遵循度和因果一致性评估,开源支持研究验证。

2. 数据预训练关键规律证明多样性和质量优先,多本体迁移效果为算法优化提供启示。

{{loading ? '正在重新生成' : '重新生成'}}

返回默认

我是 品牌商 卖家 工厂 服务商 平台商 研究者 帮我再读一遍。

8月10日,2025世界机器人大会在北京举行。智元机器人合伙人兼具身业务部总裁姚卯青在会议上发表了题为《通向具身智能大规模突破之路——智元的本体数据算法飞轮》的演讲,系统阐述了智元在具身智能领域的探索成果与未来方向。

姚卯青介绍,上海智元机器人成立于2023年 2月,自创立起便致力于推动AI与机器人的深度融合。至今,智元已取得一系列扎实成果:发布全系列多款机器人产品,建成规模化生产产线与机器人训练场数据采集中心,在具身智能相关算法领域实现多项创新,并在多个实际应用场景完成探索验证,为技术落地筑牢根基。

姚卯青强调,机器人企业要让软硬件产品在行业有效落地,核心在于构建 “本体 - 数据 - 模型 - 场景” 紧密耦合的全栈布局。这四者形成相互驱动的飞轮迭代逻辑:优质本体产生高质量数据,海量高质量数据支撑算法持续突破,算法结合场景试错后,又为本体优化、数据采集方向、算法迭代提供新指引。这种闭环循环不断加速,未来智元将分享更多飞轮迭代成果。

“进入飞轮循环的首个挑战是数据。”姚卯青指出,与大语言模型从业者不同,机器人从业者需直面物理世界强交互特性,既要调试硬件,又要将模型部署到工业级系统测试,这使得数据需求与互联网数据存在本质差异。

“然而,现有互联网数据对机器人训练远远不够,” 姚卯青解释道,“机器人需要大量动作类、长程规划类数据,这类数据在网络上极为稀缺。” 为此,智元希望 “种下第一棵树”,吸引更多同行加入数据建设,共同形成数据海洋,目前这一探索已取得阶段性成果。

为破解数据难题,智元于2024年底开源了AgiBot World百万真机数据集。姚卯青表示,该数据集旨在提供工业级高质量数据支撑,包含百万条机器人数轨迹,每条数据都经过多轮审核,确保场景贴近现实、任务复杂多样。

姚卯青还表示,AgiBot World数据集只是起点,智元在数据采集方式上有两项关键创新:

对抗式采集数据:在常规数据采集过程中主动引入干扰,例如改变语言指令、制造视觉扰动等,以此提升数据信息密度。实践证明,这种方式能提供数倍于常规数据的信息量,有效加快机器人训练收敛速度,且已在多任务和多构型机器人上验证效果。

自主进化式的数据采集:针对机器人在真实环境中自主执行任务时难以提前枚举的 “长尾失效” 问题,智元引入自主进化式采集方案。 当机器人执行任务失效瞬间,系统自动接管并打断进程,回退到失效前状态,再通过人工接管完成数据采集。这一方式能将难场景下的高价值数据补充到训练集,有效拓展数据分布边界,依托数据扩增提升机器人能力上限,其逻辑类似Dagger算法框架。

姚卯青说,围绕数据消费,智元于今年3 月推出具身智能基座模型GO-1。该模型在架构上实现双重创新:依托VLM基础模型和MOE混合专家架构,其中 “隐式动作专家” 融合多源数据形成通用动作表达,“显式动作专家” 则将通用描述精准落实到特定本体控制,让机器人既能从人类视角学习动作规律,又能掌握物理世界交互逻辑。

姚卯青指出,GO-1模型发布后,其在生活、零售、工业三大场景的评测中表现尤为亮眼。相较于3 月时的海内外开源模型,成功率提升10%-30%。同时,智元发布的AgiBot World数据集,能够很好的验证Scaling Law,研究揭示了预训练关键规律:数据量、多样性及质量对模型性能影响显著,且实验证明,单一本体预训练数据的后训练迁移效果优于多本体数据。这表明,机器人预训练的核心在于数据场景的多样性、质量,以及适配的模型设计。

“除GO-1外,智元团队深耕世界模型方向,秉持 “生成理解一体化” 理念。正如人类做事前会在脑海中规划推演,机器人也需依托世界模型精准推演,缩短与实际操作的差距。测试显示,在智元自身本体的多任务测试中,GE-Act效果优于近期开源的UniVLA和 NVIDIA的 GR00T模型;针对跨本体迁移能力,以AgiBot World数据集训练的GE-Base模型,在Franka等本体上表现优异,在开源Benchmark和真机测试中,成功率显著高于现有开源模型。”姚卯青说

姚卯青强调,基于世界模型生成的动作,智元机器人能完成叠衣服、组装纸盒等复杂双臂灵巧操作,也能在工业传送带上精准执行物体抓取和打包任务。值得注意的是,相较于VLA等短时序输入输出模型,具备长时序推演能力的GE-Act在动态场景抓取定位精度上优势明显。

GE-Sim以动作序列为输入,如同高精度仿真器,能在杂乱真实环境中渲染画面,且具备时空一致性和语义合理性。对比测试显示,其与真实机器人的推理效果高度一致,量化成功率接近。姚卯青说,依托该仿真器,可快速迭代机器人策略,极大缩短模型研发周期,减少实际评测中的复杂流程与损失。

姚卯青表示,为规范世界模型评测,智元推出GE Bench并已在GitHub和 HuggingFace开源,成为IROS世界模型挑战赛的重要准备工具。 该Benchmark从轨迹遵循度、语义合理性、因果一致性等多维度评估模型,而基于机前数据预训练的GE-Base模型,在各维度表现均优于主流视频生成类模型。

姚卯青分享了智元在机器人研发中的实践心得:机器人本质要回归执行器,优质执行器是性能基础;传感器虽重要,但调教与量产一致性是行业难题;若聚焦单一机器人类型,人形是较合理的选择;具身智能应是 “机器人 +AI”,需深度结合硬件本体;此外,必须追求量产和一致性,以减少各环节误差。

姚卯青表示,智元计划将上述 “苦涩教训” 融入飞轮迭代,并于今年下半年推出新一代机器人AgiBot G2。该平台采用更灵巧的本体设计,对传感器、执行器提出更高标准,搭载英伟达Thor高算力量产域控制器,被定义为 “工业级交互式具身智能作业全球标杆平台”,引发行业广泛关注。

姚卯青强调,“数据 - 模型 - 本体 - 场景” 飞轮的转动,最终是为赋能千行百业。过去一年,智元在多场景取得突破:柔性制造中,用具身智能解决专业设备无法应对的高精度、力控、泛化性操作问题;物流分拣上,具身智能通用机器人与专用设备配合,处理传统视觉定位 + 规划难以完成的杂乱物品分拣;此外,还实现了安检岗点人力清零、电力通信机房巡检操作等场景的人力替代与降本增效。

“具身智能赛道广阔,” 姚卯青呼吁,“希望全球同行携手,共同探索这一智能边疆,让技术真正创造价值。”

注:文/龚作仁,文章来源:Laborer,本文为作者独立观点,不代表亿邦动力立场。

文章来源:Laborer

广告
微信
朋友圈

这么好看,分享一下?

朋友圈 分享

APP内打开

+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0