广告
加载中

对话蓝驰创投合伙人曹巍:大模型和工业机器人结合不是伪命题

王艺 2024/08/28 08:30

在刚刚闭幕的2024世界机器人大会(以下简称“大会”)上,国际机器人联合会主席玛丽娜·比尔(Marina Bill)分享了一组数据:2009年,全球工业机器人年度安装量为6万台,而到了2023年,安装量达到了约54万台。她预测,在不久的将来,这一数字将超过100万台。

这种机器人“热”直接体现在了本次大会上,「甲子光年」从大会主办方了解到,本次大会共有近170家企业携600余款展品参展,论坛线上线下听众达160万人次,博览会参观人数近25万人次。

现场的“火热”氛围也是与机器人相关的资本市场的真实写照。

据统计,在本次大会参展的国内创业公司中,VC/PE的渗透率超过75%。星动纪元、宇树科技、帕西尼感知、银河通用、逐际动力、星尘智能等机器人领域的明星创业公司均在2024年获得亿元以上融资,背后涉及投资机构超30家。

大模型的应用显著提升了机器人的复杂任务执行能力,为商业化落地带来可能。最近一年,几乎每家机器人公司的PPT上都出现了具身大模型的身影,PaLM-E、RT1、RT2等论文也展示了大模型直接输出控制信号的愿景。

据IT桔子数据,从2023年1月至今,国内共成立了29家人形机器人创业公司,其中有22家已经获得至少1轮融资;仅2024年1-7月,机器人行业就发生了78起投融资案例,投融资金额53.62亿元。

大会上也少不了投资人的身影,蓝驰创投董事总经理、合伙人曹巍在大会期间表示:“蓝驰创投作为早期投资机构,有信心长期坚定地布局机器人赛道。”

曹巍认为,蓝驰创投的信心来自四个方面:第一,人口结构变化导致需求侧市场巨大;第二,在国内创新浪潮下,政府、高校、投资机构等社会各方,创造了一个充满活力的机器人创投生态;第三,中国制造业完善的产业链形成的产业集群优势是支撑机器人发展的关键;第四,国家和地方长期稳定的政策。

「甲子光年」注意到,作为早期科技投资机构,蓝驰创投从2014年就开始关注机器人赛道,在早期阶段就投资了包括高仙机器人、智元机器人、银河通用机器人、万勋科技、程天科技、云圣智能、蓝芯科技、优艾智合、木蚁机器人、可以科技、筑领科技、帝尔博格等在内的机器人项目。这其中,运用在工业场景的机器人和具身智能机器人相关的项目占据了绝大多数。

为什么蓝驰创投会投这些项目?大模型和工业机器人结合是不是伪命题?工业机器人领域最值得研究的问题是什么?机器人领域还有哪些投资机会?带着这些问题,「甲子光年」在2024世界机器人大会现场专访了蓝驰创投董事总经理、合伙人曹巍,与他探讨了工业机器人与具身智能机器人的现状与趋势。

“一定是需求决定业务流程和产品组合”

甲子光年:我们不妨问得直接一些,把大模型和工业机器人结合,或者把大模型搭载到机械臂上,是真命题还是伪命题?

曹巍:我觉得还是看具体的场景需求。以汽车生产为例,在一些大型的主机厂,他们在传统的编程式/编排式控制体系里面,整个产线的流程是非常复杂的,非常难做产线切换;但是有了大模型之后,产线就可以根据C端的需求做灵活的变化和切换,比如有一款大单品卖爆了,但产能是做了三款产品,我现在就可以把另外两款产品的产能快速切换到这款大单品上。

我们现在看到的是C端的竞争越来越激烈,产品体系的多样性和头部爆款之间的矛盾一定是存在的。这时候如果你有一个更灵活切换的机制,那对于生产厂商,或者品牌厂商来讲,它是利益最大化的。基于需求侧的柔性生产制造可以更好地应对当下的商业模式。

甲子光年:现在工业机器人智能化面临哪些困难?最大的痛点是什么?

曹巍:从整个的技术架构上来讲,工业机器人经典的控制架构体系还是基于编程的(Program-Based),这个技术体系本身就有一定的柔性和延展性的能力了;如果要跟大模型结合,只能以分层、多层的方式。当遇到一些具体问题的时候,向大模型的端口提调用需求。

工业场景强调的是高实时、高响应、高精度,当你的场景有如此之高的相应要求的时候,你的控制模型和大模型之间的调用和连接就非常重要。第一,为了提高调用的响应速度,你的网络环境一定要非常好;第二,如果不是部署在云端,而是部署在本地的话,工业机器人非常强调的是成本,不太可能把非常昂贵的推理芯片部署到每一台工业机器人中,这会造成非常高的成本。

所以我觉得响应速度、算力部署的架构以及对应的整套系统的成本,是工业机器人和大模型相结合面临的一些问题。

甲子光年:机械臂和人形机器人,哪个是智能制造工厂的最优解?

曹巍:这个问题本身就有问题。机械臂和人形机器人解决的问题是不一样的,各自有各自擅长的领域和范畴。我们还是以柔性生产制造举例,比如在工厂里边,它有库存的堆放,拆垛、码垛,这个东西一定是用机械臂的,不可能说我做一个人形机器人,然后到场景里边去抱箱子,搬来搬去。一个是高度不够,另外作业幅度和作业效率也没有机械臂高,所以一定是需求决定业务流程和产品组合

在某些不适合用机械臂的柔性场景里,人形机器人其实是有很大的落地价值的。但是如果是在非常标准化的重载等工业场景里,人形机器人并不一定是好的这种产品形态。

我再举一个例子,叉车底盘上面有四个轮子,可以以每秒3米的速度移动,搬一吨重的物体,在一个巨大的仓库里边高速的移动,然后做分拣。有人说人形机器人来了,你能把叉车替代了吗?替代不了。你不可能做一堆人形机器人,满地跑去搬箱子。

甲子光年:既然你提到了叉车,我们就聊聊你们投过的木蚁科技,他们是比较早做叉车自动化的公司,当时你们的投资逻辑是什么?现在他们有在自己的叉车上搭载大模型吗?

曹巍:他们在自己的叉车上引入智能化并不是从大模型引入,而是从具身智能的感知算法引入,更好地检测场景、更好地感知场景。

比如大模型里有一种算法叫物品分割算法,叉车用上这种分割算法可以更好地理解场景,然后再去做避障、搬运和抓取。同时木蚁机器人会有一套中央集群的调度系统,可以让几百台叉车协作互动,然后再做任务的分解。

我认为未来叉车的形态可能不会发生变化,但是智能能力会显著提升,一定会有大模型,或者更强大的感知能力去赋能这些经典的超级工具,让它们变得更加智能。

“‘小脑’是我们接下来会布局的重点”

甲子光年:你刚才提到了感知算法,在具身智能机器人中,感知和认知是当前技术的短板吗?

曹巍:我不这么认为。如果你从整个机器人来看的话,当前的短板更多的是在底层的控制系统,不管是运动的控制还是精细化操作的控制,都亟待改进。

如果从感知和认知的角度看,因为感知和认知包含一些复杂任务的规划,它是由大脑来做的,而且大脑很多都是大模型在做,大家会基于开源的大模型或现有大模型去改,而这些大模型的能力现在其实是非常强,应该讲现在的机器人是“大脑强、小脑弱”,所以现在关键问题还是在小脑。

目前在小脑领域,我们没有看到特别大的技术变化去驱动它,没有看到代际级的运动能力表现。

甲子光年:在具身智能机器人的“小脑”领域,你有没有看到一些值得投资的公司?

曹巍:“小脑”的话就是在控制侧,比如我们关注的像强化学习方向,我们有一个项目可能会去投资,他们是在强化学习方面做得非常优秀的一个团队,在双手的灵巧操作方面会有非常差异化的能力展现。

甲子光年:具身智能机器人“大脑”“小脑”和“本体”之间如何协同?LLM、VLM、VAM分别是什么?小脑领域的算法分为哪几类?

曹巍:具身智能机器人有LLM(Large Language Model)和VLM(Vision Language Model),上层有一个大脑,下层就是执行,大脑里面包含了LLM和VLM。我们可以简单的理解为,工业机器人的大脑就是长在本体里的,但是它的大脑是非常发育不良的,可能是算力非常弱的。

传统的工业机器人,底层控制能力是非常强的,关键看场景是不是有柔性需求,需要大脑和小脑去做协同。因为如果没有柔性需求的话,现有的方案其实已经能很好地解决问题了。为什么工业场景会引入大模型呢?大部分情况下是因为传统的方案不能够满足我柔性的生产需求。

小脑领域,有一个模型叫做Vision Action Model,这个Action其实就是和小脑对应的。比如像local motion,它是小脑里跟运动能力相关的部分,这个人是个傻子,他没有大脑,但是他依然能走路,对吧?或者有一些条件反射,你一敲膝盖腿会动,这可能是你下意识的举动,也是属于小脑端侧、非常末端的基础模型去控制的。

所以简单粗暴去划分的话,所有和感知、逻辑、决策相关的都是大脑,所有和运动控制、即时的条件反射相关的都是小脑。

甲子光年:你们会投“大脑”还是“小脑”?

曹巍:从投资端来看,现在大部分的投资还都集中在“大脑”,也就是大模型,真正投资在运动控制(“小脑”)上的钱非常有限。所以,“小脑”也是我们接下来会布局的重点。

甲子光年:所以,你们会更看好端到端模型,还是分层决策模型?

曹巍:我们从来不会强调某一个技术好不好,我们更关注的永远是场景需求和技术的匹配度。

甲子光年:有机器人专家认为,机器人的任务其实是一个四维的任务——逻辑任务(Logic)、空间任务(Special)、时间任务(Temper)、互动任务(Interactive),LLM只能解决逻辑任务。那其他的三个任务要靠什么技术解决?

曹巍:我觉得这个定义的划分还是有待商榷的。比如人机交互,或者是机器人和机器人之间的交互,这里面就可以分成“逻辑交互”和“下意识的交互”。逻辑交互肯定要用到LLM的智能,下意识的交互就是条件反射,肯定都在小脑的范畴里。

所以我觉得盲目把它拆开是不合适的,比如你跟一个机器人握手,机器人在决定要不要跟你握手的时候,他可能要先理解你是谁,你握手的意思是什么,你是要从他那拿一个东西,还是要握手表示友好,这都是需要逻辑判断的。

当然交互层面上很多东西都是跟大模型相关的,并不一定说交互的东西全部都在小脑,还是一个综合性的事情,不能一概而论。只是这个拆的逻辑是有一定瑕疵的。交互的很多东西是跟大脑相关的,基础的运动控制和应激这些大部分都是小脑来去做。从空间、时序、交互这个角度去拆,我觉得并不一定是更好的拆法。

甲子光年:工业机器人领域最值得研究的问题是什么?

曹巍:我觉得是如何把交付效率提升、交付成本做低以及能够做到开箱即用,做到真正的工业机器人的智能。

因为现在工业机器人的问题是大家都有生意做,但是不赚钱,不赚钱的本质是因为交付成本过高,个性化的东西太多,不够通用。

一旦工业机器人实现了更加智能的开箱即用,或者是更加智能的轻量化交付。从项目制走向了产品制,那工业机器人会是一个既赚钱、增速又快的超级市场。

甲子光年:现在造成工业机器人交付成本高的原因是什么?是制造的哪一环节成本过高吗?

曹巍:制造是制造,我们说的是成本交付,是费用。

如果你去拆一个机器人的BOM(Bill of Materials,材料清单),它里边分成了感知、计算、各种各样的执行构件。由于需求的不同,不同机器人的BOM是不一样的。但是大部分的成本还是在感知和决策,控制侧的一些成本并不是很高。

甲子光年:也就是说真正的成本还是传感器,以及世界模型上机器人的成本?

曹巍:对。

甲子光年:这块成本有办法做低吗?

曹巍:有办法做低,我们也在持续关注。

甲子光年:工业机器人的下一个发展趋势是什么?

曹巍:就是走向轻交付和智能化。

甲子光年:那怎样把交付做轻呢?

曹巍:把交付做轻,最重要的是不用编程。这就是刚才我们说的它具备更好的交互性,它可能也需要定制,但是只要我跟机器人说,它就能理解我要定制什么,而不是说我再去请人写代码,它自己就能写。

“重工市场一定能跑出来一些非常好的商业机会”

甲子光年:机器人尤其是工业机器人领域,数据是一个大问题。你有没有看到专门给具身智能机器人提供数据的公司?如果有,这类公司有投资的价值吗?

曹巍:当下来讲,专门给工业机器人做数据的公司不是我们关注的焦点。优秀的公司会形成自己的数据闭环、硬件闭环,以及算法侧的算法闭环。因为数据的稀缺性,以及数据和算法之间的迭代速度决定了你的核心能力。这东西如果是外边人给你做,那你的核心竞争力在哪?

这跟自动驾驶不太一样,因为自动驾驶有专门做这方面服务的数据公司,但我觉得机器人在短期内,因为它还是在一个非常早期的产业阶段,很多东西没有定型。

在这一方面,大厂一定会更有优势,这就跟软件生态是一样的,有了大模型,也没有人能够做出Windows;有了大模型,也没有人去做微信。大厂作为生态里的最强者和既得利益者,一定会使用AI增强自己的核心竞争力。强者恒强,小公司只能找一些近路或者弯道去超车。如果你做的公司跟大公司一样的话,肯定是没有机会的。

甲子光年:你们还投了蓝芯科技、优艾智合和帝尔博格,投这三家的逻辑是什么?

曹巍:投这几家的逻辑不太一样。

投蓝芯科技是因为他们团队除了做机器人本体的能力非常强,他们还花了8年的时间持续迭代和研发自己的机器视觉模组,而这个机器视觉模组是未来机器人在增强感知和控制能力方面的数据入口。我们觉得他们在机器视觉模组方面的迭代,和3D感知模型方面的积累非常有价值。这也是为什么国内这些头部的制造业的大客户,像华为、中兴,都非常积极的在拥抱蓝芯科技的产品。

优艾智合把自主移动机器人(AMR)的运动精细化控制做得非常好,现在优艾智合的核心场景是半导体行业的客户。

帝尔博格是做重工的,重工领域的智能化进展是非常慢的,比轻工业落后10-15年。我们走访了一些重工企业发现,大量的重工企业还会打造一些比较传统的、半人工的流水线,而其中有大量小批次、非标的任务,是没办法用传统的编程这种轻工业自动化的方法来实现的,只能用更智能的机器人去实现

帝尔博格的创始人之前是三一重工西安研究院的副院长,他们做了让三一重工最骄傲的“黑灯工厂”。这里面既包含全栈的规划,又包含智能管理;同时他们还做了很厉害的单栈产品,这些单栈产品基于AI实现了真正的智能化,而不是传统的自动化。我们觉得这种背景非常优秀的团队在重工这一巨大的市场里是大有可为的。

重工市场里面包含了很多赛道,包括航空航天、轨道交通、船舶制造等场景,同时还有工程机械,每一个赛道都是千亿级的市场。我们相信这里面一定能跑出来一些非常好的商业机会。

甲子光年:你们还会关注机器人领域的哪些投资机会?

曹巍:我们首先围绕具身智能机器人进行了布局,投资了智元机器人、银河通用、万勋科技等比较优秀的与具身智能相关的企业。

围绕小脑领域的话,我们比较关注的是灵巧操作,在灵巧操作的算法上有创新的团队。

当然我们也比较关注垂直领域的机器人公司,我们投资了一家深圳的公司叫小楠科技,它是做海外末端物流分拣的智能化设备的,非常有特色和差异化。这其实受益于TikTok Shop、Temu、阿里速卖通等海外电商的发展,它们带来了巨大的末端分拣的需求,这些需求基本上用传统的人工方式是没办法满足的。所以他们的产品出来之后,在海外非常受欢迎。

总体来说我们投机器人,一看技术变化,二看产业趋势。除了机器人,在整个的大科技领域,我们还关注AI和智能硬件的结合,同时也关注文生3D、图生3D等基础的底层模型和世界模型。在大模型领域,蓝驰已经投资了月之暗面、西湖心辰等项目,以及做大模型工具集的潞晨科技。

注:文/王艺,文章来源:甲子光年(公众号ID:jazzyear),本文为作者独立观点,不代表亿邦动力立场。

文章来源:甲子光年

广告
微信
朋友圈

这么好看,分享一下?

朋友圈 分享
+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0