【亿邦原创】7月26日,北京人形机器人创新中心(简称“北京人形”)携全国首个工业“多本体、多场景、多任务自主协同作业”实战演示亮相,成为真正意义上的“一脑多机、一脑多能”,也意味着其今年3月发布的“慧思开物”,在分布式具身智能体系统能力方面实现全面升级。
北京人形在WAIC展区呈现了一条完整的工业场景任务链:在通用具身智能平台“慧思开物”的统一指挥下,各智能体机器人自主相互通报进展、沟通工作,电控柜操作区模拟精细操作,灯泡质检线完成工业检测,物品封装区执行封装作业,机器人穿梭于三个场景之间,完成搬运工作。
系统通过分布式具身智能体架构,在四个机器人本体上部署了“电工大师”“搬运工”“质检员”“封装助手”四个任务执行智能体,同时在云端部署了任务调度智能体,负责接受指令和整体任务调度,将子任务分发给四个机器人协同完成,现场多个智能体共同构建起一个高效的“任务执行网络”。
而操作员只需在“慧思开物”App上发送“开始”指令,观众便能在大屏幕上见证从任务下发到多个机器人协同完成全链路操作的全过程,直观感受到智能机器人在各类复杂场景的落地应用。
在常见的智能体工作流中,同一时刻仅有一个或部分智能体被激活,只能支持同步工作流,而“慧思开物”系统让所有智能体都处于活跃异步协作状态:机器人根据任务优先级与自身状态自主执行任务,能够像人一样通过自然语言而非程序代码相互沟通,完成后触发下一阶段协作流程,实现真正意义上的“机器决策机器”。
多具身智能体异步协作,要求系统具备实时多任务并发处理能力,包括带优先级的多任务插入、暂停、恢复。相比同步工作流,对整体系统提出更高级别的挑战。每个智能体机器人都配备独立的大脑与小脑,使得它们既可以完全独立工作,同时可以协同作业,具备从认知到执行的全链条能力,构筑起支持未来多场景泛化、跨机器人协同的核心技术底座。
在电控柜操作区,接收到“慧思开物”的指令后,机器人自主完成开柜、点按旋钮、合闸等多工序的灵巧作业。这一操作背后需要35自由度机器人系统与接触密集型长任务双臂灵巧手协作VLA(视觉-语言-动作)模型合作完成。
在电力检修场景下,机器人需要应对长任务误差累积、电气操作逻辑和密集元件接触等复杂挑战。为攻克这一难题,研发团队基于多模态感知系统,采集高质量人工演示数据,开发了基于视觉-触觉-动作模型的双臂-手灵巧操作算法。针对当前机器人无法准确完成长程任务的挑战,采用基于关键帧的多任务串联与预测算法,有效降低误差累积;通过任务自纠错机制,模型可根据电气信号自动判断操作是否完成;结合指尖触觉特征提取,模型能精准感知接触变化,有效应对旋钮和空气开关等复杂元件的应力突变。与主流的单模态感知系统和传统模仿学习相比,这一方法能够显著提升任务成功率至90%以上。机器人凭借这些技术能够实现多场景适应和智能决策,在保障作业安全的同时,推动电力行业智能化升级,减少高危人工操作。
电控柜通电后,灯泡质检区启动的双机协同流程则是更具挑战的柔性展现。机器人从货架抓取灯泡箱体并精准搬运至指定位置,机械臂已同步被唤醒,启动“抓取-插装-点亮-质检-分拣”的标准化作业,视觉传感器结合多模态大模型完成光效检测,实现对灯泡好坏的判断并规划好下一步操作。
整个过程中,机器人基于三维环境感知,实现双机械臂自主规避障碍、动态规划抓取与操作轨迹;结合力位混合控制技术,末端执行器能够灵敏调整力度和位置,确保插装过程平稳且对灯泡无损伤,高精度视觉定位系统同时确保对灯泡的精准定位。此外,机器人通过VLM场景理解能力,能根据检测到的光效和细微特征,实现对每一个灯泡的自主判断和分拣。在“慧思开物”通用具身智能平台的调配下,系统可自主规划流程,灵活调用传感器与工具,实现多设备协同与任务快速重组,为“柔性自动化工厂”提供了高效、可扩展的方案。
在现场的数据采集区,完整呈现了从虚实结合的数据获取到模型训练的全链条技术能力。这些数据不仅支撑了算法的快速迭代,更为行业标准化发展奠定了坚实基础。北京人形发布的RoboMIND数据集已累计下载使用超4万次,成为具身智能研究的重要开源资源。
文章来源:亿邦动力