9月25日,在刚刚过去的中国国际工业博览会第十届中国机器人高峰论坛上,各个机器人企业的行业领军人物都在围绕"机器人+Al"展开激烈的讨论和畅想。
生成式Al,作为人工智能领域的新兴技术,以其强大的数据生成与理解能力,为人形机器人的自主性提供了新的可能。传统人形机器人在面对复杂多变的现实场景时,常因缺乏足够的自主决策能力和环境适应性而受限。那么,生成式Al如何成为人形机器人提升场景应用能力的关键?
本文将从人形机器人自主性能力的重要性出发,深入探讨生成式Al技术如何赋能人形机器人,并通过实际案例,分析这一技术进步对产业和应用场景的影生成式Al成为提升人形机器人自主性能力的关键响。
生成式Al成为提升人形机器人自主性能力的关键
在人形机器人自主化技术迭代的进程中,面临着诸多技术痛点和挑战。当前面临的主要挑战在于复杂环境中的自主行动能力受限。表现为机器人在识别多变障碍物、理解复杂指令、以及在没有明确预设路径下做出合理决策时的困难。其中,限制因素包括环境感知的精度与实时性不足、决策算法的复杂性与鲁棒性欠缺,以及缺乏足够的自主学习与适应能力来应对未知或变化的环境。
除了自主能力受限之外,感知和决策能力的不足、运动控制精度的提升、情感理解和语言交互、以及续航问题等,也是制约也是影响人形机器人自主性提升的关键因素。暴露的问题主要表现为:
感知能力上,如何准确识别并理解复杂环境中的物体、人脸、场景等多模态数据是一大难题;决策能力上,如何在不确定环境下进行动态路径规划和实时决策是另一大挑战;而续航问题则直接关系到人形机器人能否持续稳定地执行任务,语言和情感的交互则是直接影响人形机器人的服务质量。
生成式Al是一种利用机器学习算法,特别是深度学习技术,使计算机能够模拟人类的创造性行为,生成全新的、具有实际意义的数据或内容的技术。
生成式Al技术能够显著提升人形机器人在环境感知、自主决策、学习与适应等方面的能力。
通过生成式Al的创造性生成能力,人形机器人能够更智能地应对复杂多变的场景,实现更高效、更自然的交互与任务执行。关于生成式Al对人形机器人的赋能,不少企业已经在深入探索中。虎嗅智库通过调研,获取了几个生成式Al赋能人形机器人的具体案例:
生成式Al技术可以增强多模态数据处理能力。生成式Al技术能够有效处理和分析来自传感器、摄像头等多源异构数据,实现物体、人脸、场景等复杂环境的精准识别与理解。以他山科技的人形机器人指尖传感器为例,数据的处理有两点。数据在单个传感器上完成时,会强调在单个芯片上快速从感知到执行全程数据处理的能力。第二,当执行抓取动作时,中间的快速反应需要在前端的硬件上完成,即边缘端要有分布式的数据处理能力。
在数据处理之外,生成式Al技术能够帮助人形机器人进行行动路径的动态规划与实时决策。通过深度学习和强化学习等算法,机器人能够不断学习并优化其行动策略,以应对复杂多变的环境和任务需求。例如,优必选搭建了面向人形机器人的工业制造的任务规划大模型,通过深入结合大模型与语义VSLAM导航,人形机器人可以识别场景与地图并选择导航的最优路径。通过深入整合运动控制技术,让人形机器人可以更加准确的执行抓取。
生成式Al技术也可以促进人形机器人在情感理解和语言交互方面的进步。通过模拟人类的语言习惯和情感表达方式,机器人能够更加自然、流畅地与人类进行交流,甚至能够理解和回应人类的情感需求。例如,得益于生成式Al技术在自然语言处理和情感计算方面的应用,未来人形机器人能够通过语音和面部表情与人类进行自然流畅的交互,理解并回应人类的情感和需求。这种能力不仅提升了用户体验,还为人形机器人在家庭陪伴、医疗护理等场景中的应用提供了更多可能性。
同时,生成式Al技术也为人形机器人的仿真数据训练与模型优化提供了强大的支持。通过生成大量高质量的仿真数据,机器人可以在虚拟环境中进行反复的训练和学习,从而不断提升其感知、决策和行动能力。他山科技利用其在仿真技术领域的深厚积累,结合生成式Al算法,为人形机器人提供了高效的模型训练与优化方案,显著降低了研发成本和时间周期。
从以上不同的案例中,我们能够看到,生成式Al和人形机器人的结合从多个维度提升了人形机器人的自主性能力,直接推动了人形机器人在家庭服务、工业制造、医疗辅助等多个领域的应用与发展。
大小脑结合,破解"数据处理、技术融合、实时精准响应"难题
虽然,生成式Al技术能够在诸多方面为人形机器人带来自主性能力的提升,但是从技术融合的角度来看,仍然存在一些挑战。
首先,数据是一个很大的制约因素。生成式Al开始应用的时间较短,对于模型理解执行的含义来讲,对目标的解构能力提升较强,但是数据要素依然不全面。另外,庞杂数据对模型训练也有弊端,需要多数据重筛选才能精准训练,单层数据叠加训练模型的方式才是最好的。他山科技CE0马扬如是说。
另外,如何有效地将生成式Al的能力与人形机器人的感知、执行和控制能力相结合,是一个复杂的技术问题;如何平衡二者的计算与存储资源,确保系统的高效运行,也是一个重要挑战;如何提升生成式Al的响应速度和准确性,以满足人形机器人的实时性需求,更是一个技术难题。
面对以上的技术难题,优必选选择自主研发人形机器人的大模型智能体框架。
优必选的大模型智能体是以大模型和小模型结合的方式为基础架构建而成,用于提升机器人的智能化水平和应用效能。其中,小模型主要作用于仿真数据、视觉感知、灵巧操作等环节,为机器人赋予了更敏锐的"感官"和初步的"动手能力"。大模型负责文本、图像、语音三大领域数据优化和训练,为人形机器人构建了全方位、多维度的信息处理能力。
优必选副总裁、优必选研究院院长焦继超表示,生成式Al技术在人形机器人领域的应用呈现出一种"大脑+小脑"的先进架构。小脑部分,即端侧小模型,在研发阶段发挥了关键作用。而大模型则更多地聚焦于交互层面,与决策规划深度融合,为用户带来更加自然流畅的交互体验。
特别值得一提的是,触觉传感器芯片和系统的应用,作为灵巧操作执行类传感器的杰出代表,实现了从感知到计算再到执行的闭环控制,以低延迟、高精准的特点,让人形机器人能够完成更为复杂、理解性的动作,为人形机器人的智能化发展开辟了新路径。
对于生成式Al和人形机器人融合,他山科技CE0马扬有不同的解题思路,他认为,人形机器人自主性能力提升方面的应用主要聚焦两个细分领域,一是通过生成式模型提升人形机器人的感知理解能力,二是通过边缘端和云端共构决策模型提升其快速反应和执行判断能力。
两套模型的结合,使得人形机器人在当前和未来应用领域中,正逐步从执行简单任务向理解复杂情境、自主决策与泛化应用转变。其角色从"保姆"式服务拓展至"知己"式陪伴,尤其在商业及服务业中,将极大提升服务效率与个性化体验。例如,在智能家居中,人形机器人不仅能完成日常清洁、照料等任务,还能根据用户情绪与习惯调整服务策略,实现更深层次的情感交流;同时在紧急情况通过边缘端模型实现快速响应,以保证用户和任务目标的安全。
在工业场景中,人形机器人虽已能取代人力执行固定岗位工作,但其自主性尚属初级阶段,主要集中于流程化任务的执行。但是,未来,随着自主性能力的全面提升,人形机器人将能胜任更多经验依赖型和异常处理的工作,如自主诊断机械故障、灵活应对生产线上的突发状况,从而显著提升生产效率和安全性,减少对人工的依赖。
落实到实际应用中,依然可能会存在一些问题需要业内的企业共同去面对和解决。例如在安全方面,需要确保系统的安全性和稳定性,防止恶意攻击和数据泄露;还要确保人形机器人在执行任务时对人的伤害;在伦理方面,需要保护个人隐私、制定机器人的行为道德准则和运营机制、界定人机之间的界限和关系;最重要的,在经济效益方面,还要持续降低研发、生产和维护成本,并平衡技术进步与就业之间的关系,减少技术进步对就业市场的冲击。
落地实践,须重点关注复杂任务拆解和执行成功率
虎嗅智库在调研中发现,人形机器人在自主化技术迭代中面临的最大技术挑战包括技术路线的多样性与不确定性、数据缺乏与自主学习能力受限等。解决这些挑战需要跨学科的合作、持续的技术创新和大量的研发投入。
因此,量化评估生成式Al对人形机器人自主性的提升效果也需要综合考虑任务拆解与执行、交互与自驱力以及大模型能力等多个方面。尽管当前还没有统一的指标体系,但可以从以下几个方面进行综合考量:
首先,分析任务拆解能力,即Al在输入端和输出端对任务的理解和分解水平;其次,考察Al规划的行动路线是否正确以及执行任务的成功率;再次,评估Al在交互和制造过程中的自驱力,以及在特定任务(如抓捕)中的正确率;最后,综合考量Al模型的规模和复杂性,以及其处理复杂任务的能力。
总的来说,虎嗅智库建议甲方企业着重关注机器人的决策准确性、任务完成度和执行效率的提升程度,以及机器人对复杂环境的适应能力和容错机制的完善程度;再者,是人机协同的响应速度、流畅度和用户体验的改善情况。
总结
生成式Al技术的应用为人形机器人的应用创新提供无限可能,显著增强机器人的自主性、场景泛化能力以及适应性,使其能够在多样化的复杂环境中高效执行任务。同时,通过生成式Al技术的应用还能提升机器人的自主操作能力,降低人工干预需求,进而降低运营成本,提高整体效率。
可以说,生成式Al和人形机器人的结合,不仅可以带来人形机器人企业的可持续发展,也为整个具身智能行业的发展和进步提供动力。
文章来源:虎嗅智库服务