无疑,在前不久的2024世界机器人大会现场,具身智能人形机器人是最大亮点,大会上27款人形机器人整机亮相。他们能跑能跳能翻跟头,对诗、倒茶、叠衣服,十八般武艺样样精通。
从单纯炫技到进厂打工
对于具身智能人形机器人来说,需要关注的是上半身的灵巧操作能力,和下半身的稳定移动能力。
先来看上半身操作能力。
松延动力的机器人HObbs仿真脸,可以实时仿真人脸表情,做出张嘴、皱眉、表达出愤怒、微笑、厌恶等多种表情;智元远征A2-W机器人展示出动态任务编排、复杂作业执行及双臂协同作业等作业能力;星尘智能AI 机器人助理Astribot S1二指抓夹能熟练地功夫茶,叠衣服,完成一系列高难度、长序列、可泛化任务;
新松Centaur真空机械手两只手臂不受彼此影响独立进行取放片工作,完成不同尺寸规格的晶圆搬运;帕西尼第二代多维触觉人形机器人TORA-ONE,四指灵巧手可以比心、写书法、弹琴、下象棋。智平方Alpha Bot 1S不仅可以握拳,还能制作咖啡,学习操作各种日常电器,实现多场景、多任务的灵活切换。
机器人下半身移动能力和稳定性也有很大进展。
逐际动力CL-1在展会现场接受极限冲击测试,面对持续踢踹,依然能够保持全身动态平衡,展现出强大抗干扰能力和稳定性;宇树科技的机械狗,四足灵巧的上下爬坡,引得众人连连惊叹。
加速进化更是在现场办起了足球比赛,其人形机器人Booster T1凭借手抛球、踢球、叶问蹲等高难度动作,以及与观众互动的俯卧撑比赛,引人注目;优必选在现场模拟出汽车产线,其人形机器人Walker S系列能自主将零部件箱从仓库地板搬运至传送带,并实时记录数据,实现与智慧工厂仓库系统无缝对接。
单从展会看,人形机器人正在从炫技走向服务,具身智能似乎马上要迎来iPhone时刻。可事实上,进入现实世界,人形机器人还有很多技术和产品问题尚待解决。
灵巧手是“构型”C位
当下,发展通用智能型人形机器人,正在逐渐成为行业内的共识。人形机器人最大的优势在于具备通用的移动操作能力。其中下肢负责稳定移动,上肢负责灵巧操作。而相比下肢“移动”能力,要解决具体场景中的问题,更需要的是上肢的“灵巧操作”能力。
自20世纪50年代自动控制技术的兴起至今,“上肢”机械臂和工业机器人已有较长发展历程,但是能力仅限于进行机械、重复且较为简单的动作,如今人们对机器人上肢的要求已不仅仅是能自主运动,更重要的是实现精准操作,成功完成指定操作任务。
因此,上肢末端的灵巧手的精准操作能力更是成为当下业内关注要点。
灵巧手可以粗略分为电动夹爪及多指灵巧手。
相比技术难度低、鲁棒性高的电动夹爪,多指灵巧手的开发也在逐渐成为共识。多指灵巧手作为高性能、高灵活性末端执行器,可供客户在特殊及复杂场景中使用,同时对提高机器人的柔性和易用性有着更为重要的作用。
至于手指数量,并无定论。多数灵巧手是五指的,但也有四指的。对此,帕西尼CEO?许晋诚认为“四指或五指,要以目的为导向,四个手指可能在很多情况下已经足够使用,因为人类其实在现实生活中很少用小指。”
帕西尼的触觉灵巧手就是四指,主动自由度达13个,可以实现抓、握、捏、按手指开合等各种人手复杂动作。
四指或五指并不仅仅是数量多少,更关乎技术难度选择和成本高低。
北京具身智能机器人创新中心大模型负责人鞠笑竹表示,“当下,灵巧手多是模拟人手关节,一个关节对应一个电机,也对应一个自由度。手指越多,关节越多,电机就越多,自由度就越高。而在一只手的有限尺寸内,电机越多,结构越复杂,对其可靠性和灵敏度的挑战就越大,当然成本也更高。”
可以说当下,如何在有限的空间内集成多个自由度,对于灵巧手硬件来说,是一个巨大的技术挑战。
除开在硬件层面的难题外,要实现灵巧操作,手部也必须与环境进行交互。当关注到物体的形状、大小、位置等几何特性时,就离不开人形机器人核心感知部件-传感器,对操作环境和对象进行实时多维感知。然而当下,除业内视觉传感器应用较为普遍,触觉传感器也有落地外,目前行业仍缺乏视、触、听、力一体多维传感器。
要具备足够的通用性,在几何特性外,还应该关注物体的语义特性,例如物体是什么,用途是怎样的。只有这样,人形机器人才能在未知环境中进行有效交互,实现真正灵巧操作。
相比上肢灵巧手灵巧操作能力,下肢移动能力从技术进展上似乎更快。这大概得益于软硬件结合与人工智能技术尤其是强化学习的发展。
在展会现场接受极限冲击测试的逐际动力CL-1,展现出极强的动态平衡能力。而在其早前的演示视频中,CL-1还可以在山野里徒步,下碎石坡、爬草坡、走沟渠。创始人张巍曾表示,“腿部也就是下肢这部分不需要新的物理发现,但是一个需要不断尝试的工程迭代的过程。”这大概能解释为什么人形机器人下肢能力的进度更快。
人形机器人下肢分为轮式、四足、双足。其中,四足机器人,侧重于解决“通用移动能力”,也就是实现对各种地形的泛化适应。两足机器人则是为实现直立行走,以便前两肢(即双臂)进行操作。
双足,相比四足的稳定性和平衡性难度都要加倍。这也是为什么,我们能够看到四足灵巧狗,上下爬楼梯超级丝滑,而大多数双足人形机器人走起路来依然颤颤。
不过可以确定的是,从轮式到四足到双足,技术难度和成本都是递增的。从成本来看,轮足方案几乎是双足的零头。不同选择代表着不同技术难度及不同成本,也影响着人形机器人公司们的商业化进程。
总体来看,人形机器人本质上是代替人去运动,或移动或操作。有的机器人着重做移动,有的着重做操作。所以,我们会看到大多数着重发展灵巧手的公司,下半身多为轮式,而双足机器人,则上半身末端配抓夹者居多。
先工业,后商业,最后进入家庭
聊完产品构型问题,再来聊聊大家更关心的落地场景问题。当下,没有成熟、刚需的场景是人形通用机器人面临的最大问题之一。
据虎嗅智库调研,工业制造、科研创新、商业服务、家庭服务是四个目前更有可能落地应用人形机器人的领域。
进一步来看,四个领域中的那些环境相对封闭,能力需求较为单一,人工成本更高,或者危险系数较高的场景会更快落地,比如汽车工业产线中的搬运、质检,超市换、补货等场景。
关于不同场景的落地顺序,更普遍的观点是先工业,后商业,然后进入家庭。
逐一来看,从付费能力和意愿上分析,工业场景的确是更有可能最先落地。一方面因为工厂的自动化水平更高,并且厂商在部分场景有明确需求,更具付费能力。
比如优必选就在会上首次聚焦汽车、3C等制造业重点领域推出“人形机器人工业场景解决方案”。其Walker S系列人形机器人可以面向多任务工业场景,完成智能搬运、智能分拣、智能质检、螺丝拧紧、零件安装、过程材料操作等多种任务。
在谈到为何聚焦工业场景时,优必选人形机器人技术专家秦文龙博士表示,相比于服务场景和家庭场景,工业场景相对结构化,厂区环境和任务内容都是确定的。除开结构化外,工业产线对于自动化、智能化的升级需求也更迫切,亟需新形态的高端智能制造设备来弥补现有工业机器人、协作机器人、复合机器人等智能设备任务执行范围之外的空白区。
在工业之外,这一波具身智能机器人公司在寻找商业化路径的时候,也有不少率先从家庭场景切入。
因为对于新入局的具身智能机器人来说,相比跟传统专用机器人卷精度和速度,更可行的是在通用性上去找一些替代价值高的场景,比如养老、带小孩等家庭看护场景。这些场景,更强调跟人的交互、对人的服务,而不是精度。
另外,因为家庭场景,市场规模巨大,天花板也更高,但技术落地也更难。
鞠笑竹表示,“一开始大家可能都会先考虑家庭场景先落地。但实际上做下来之后,发现每个家庭,每个人的需求都是千奇百怪的,过于随机和非结构化,对人形机器人的泛化性和智能要求很高,落地就不会很快。”
除了家庭非结构的环境特征之外,机器人本身的技术成熟度、安全性、及家庭成员对人形机器人的接受度等都是人形机器人要落地家庭,待解决的问题。
而在一些商业服务场景中,比如营销服务、前台接待等,专用传统机器人已经发力已久。似乎当下,相比于人形不人形,大家比拼更多的则是对该场景下企业需求的理解。这一点上,显然早已入局的商用机器人玩家们更有优势。
此外,对于科研教育场景,目前也有多家人形机器人企业入局,竞争激烈,但该场景天花板比较低,量产规模也达不到市场期待,所以更像是大家的短期无奈之举。
关于在各场景的具体落地时间,在虎嗅智库的调研中,大多数厂商的共识是1-3年,人形机器人将迎来在工业场景的落地,3-5年落地于商业服务场景,5-10年在家庭场景落地。
虎嗅智库认为,这一判断可能依然过于乐观。因为新技术在商业化上的进度普遍是偏慢的,要商业化,前提是必须要找到有非常明确的产品需求场景。尽管优必选等企业,在汽车制造等一些场景已经进入进厂实训阶段,但考虑到解决通用性和成本问题,相关场景的市场需求尚待进一步验证。
或许在尝试保持技术研发高度的同时,逐步把技术拆解出来,降维去找到一些能够落地的场景,探索产品化的方向,解决通用性问题,似乎是商业化的一条可行之路,但这并不容易。
况且如果要成功商业化,产品也至少要做到80分,并且能够与竞争对手拉开质的差距。但当下,大家的产品不管是从外观还是到功能,差异化都不太明显。
总体来看,目前,人形机器人虽然热度很高,但技术路线,商业场景等都仍未明确,离量产还有距离,商业化也有很长的路要走。当下谈具身智能迎来iPhone时刻,还为时尚早。
注:文/冀玉洁,文章来源:虎嗅智库服务,本文为作者独立观点,不代表亿邦动力立场。
文章来源:虎嗅智库服务