广告
加载中

WAIC观察:大模型秀肌肉机器人抓风口 谁为落地负责?

胡镤心 2024/07/08 16:54

文丨胡镤心

【亿邦原创】在上海世博中心举办的2024年世界人工智能大会是一场名副其实的“AI盛宴”,500余家企业参展,国内企业和国际企业占比超50%,展品数量超1500项,首发新品超50件。其中,大模型厂商聚焦于AI助理与视频生成两个方向,机器人厂商则将核心零部件突破当作最佳卖点,人形机器人有热度无应用

一进世博展览馆的正门,18款列队站好的人形机器人向游客招手。H1会场内,蹦跶着各种尺寸各种形态的机器人,宇树科技的机器狗翻着跟头到处卖萌,逐际动力双足机器人摇头晃脑到处溜达,达闼的美人鱼机器人翩翩起舞,穹彻智能的机械臂在叠衣服、削黄瓜。

H2会场则挤满大模型厂商,快手让游客现场使用可灵生成短视频,出门问问通过3D动捕进行二次元表演,周鸿祎的数字人在实时回答游客提问。

二楼纵横排列着众多AI创业企业,有蛋白质设计、工业酶分解、边缘侧计算、3D交互、流程优化等各种AI创新应用。

还有在读博士生来展馆寻找灵感与资源,有一位97年的港大医疗AI在读博士告诉亿邦动力,他本来在教职和创业之间犹豫,来展馆看看现有的AI应用,又对自己的创业方向充满信心,“现在还没有我这个方向(牙科)的AI创业项目,而且很多项目技术含量没我高。”

与企业狂欢相比,在世博中心的论坛中,“可信”、“安全”、“治理”成为关键词。本届WAIC也被冠名为“人工智能治理高级别会议”,9位图灵奖、菲尔兹奖、诺贝尔奖得主以及88位中外院士汇聚一堂,共同探讨人形机器人的法治与伦理、可信产业发展、数据安全与交易等话题。

在40度的高温里,人群不断在世博中心和世博展览馆之间穿梭。

世博中心的咖啡馆从每天上午10点开始爆单,世博展览馆内的墙角墙根坐着众多歇脚的参观者,每个人似乎都坚信AI爆发近在眼前,也有人提醒“变化太快,我们当下的所有判断都有可能是错的。”

“Who care?Come on!”有人在展馆门口大喊。

01

AI应用首发首秀创历届之最

不少厂商将WAIC当作新品发布会,首发首秀的大模型及应用有:

商汤科技“商汤日日新5.5”

科大讯飞“讯飞星火大模型V4.0”

星环科技“基于AIPC的星环无涯大模型”

百川智能“最新一代基座大模型Baichuan 4”

阶跃星辰“Step-2万亿参数语言大模型”

高通“全球首个在Android智能手机上运行的大语言和视觉助理大模型”

联汇科技“多模态大语言模型——OmModel V4及智能体应用”

阿里巴巴“通义灵码”

蚂蚁集团“基于蚂蚁百灵大模型的‘支付宝智能助理’”

金山办公“WPS AI 企业版”

出门问问“短视频自动生成平台「元创岛」”

华为“昇腾AI全流程使能平台”

亿邦动力注意到,本次大模型厂商都将AI助理与视频生成当作重点

阿里云的AI编程助手通义灵码入选WAIC“镇馆之宝”。“通义灵码”上线于2024年4月2日。通义灵码精通200多种编程语言,可以辅助写代码、读代码、查Bug、优化代码,下载量超350万,每日辅助开发者生成代码超3000万次,已广泛应用于金融、制造、互联网、交通、汽车、能源等行业。据了解,阿里云已经在内部推行全员AI编码。

支付宝智能助理同样入选WAIC“镇馆之宝”。今年4月开始,打开支付宝首页下拉就能唤醒智能助理,这是一个精通超8000项数字生活服务的AI个人助理,也是专业AI智能体的入口,一键连接生活、金融、医疗等垂直行业的AI智能体。

金山办公也升级了自己的AI助理WPS AI,在本届世界人工智能大会上,WPS AI全新增加AI写作助手、AI阅读助手、AI数据助手、AI设计助手,进一步提高个人用户的办公效率。

除了AI助理,视频生成赛道也开始起飞。

快手视频生成模型可灵自6月6日以来便引发全球关注。在WAIC期间,快手宣布可灵再次升级,新增高清画质版本功能,首尾帧控制与镜头控制,同时发布可灵AI网页版,限时免费。7月6日中午,所有新功能均会上线。在快手展厅,游客可使用现场提供的可灵账号,输入文字,现场进行生成视频。

商汤也发布首个可控人物视频生成大模型Vimi,也入选WAIC“镇馆之宝”,用户只需上传一张任意风格的照片,就能生成和目标动作一致的人物类视频,比如写真视频、数字分身、表情包等,头发、服饰、背景变化、光影变化等都能自动生成,而且手势、头发和肢体十分合理、自然、和谐,不会显得呆板和失真。

阿里达摩院则推出一站式AI视频创作平台“寻光”,主打视频编辑功能。AI视频内容的可控编辑,包括对复杂剧情的理解、生成对象的一致性等,仍然是当前算法所面临的一大挑战。寻光可以辅助用户创作剧本、分镜图等,支持对生成及上传素材进行丰富的AI编辑,包括人物控制、场景控制、运镜控制、目标新增/消除/修改等10多种功能。并且在交互方面,主打“让视频编辑像操作PPT一样简单”。

MiniMax创始人、CEO闫俊杰现场透露,MiniMax的AI视频生成产品将在下个月面世。

也有厂商将内测中的产品demo带到现场。

展会上,MiniMax展出了内测中的AI音乐生成abab-music,预计下半年发布。

百川智能带来内测版医疗应用AI健康顾问,预计Q3发布。

抖音、月之暗面、零一万物等头部AI企业尚未参加。

02

机器人各显神通

本届WAIC,机器人厂商吸引最多热度,机器人分论坛人满为患。

首发首秀的机器人包括:

特斯拉人形机器人擎天柱二代(Optimus)”

“达闼双足人形机器人XR4”

国创中心“青龙人形机器人”

宇树“Unitree H1”

“星动纪元L2”

卓益得机器人“行者二号 (X02-lite)”

云深处科技“绝影Lite3灵巧型智能机器狗”

机器人在灵敏度上各显神通,亮点聚焦于核心零部件突破。

人形机器人(上海)有限公司自主研发人形机器人“青龙”,身高185cm、体重80kg、全身多达43个主动自由度,手指可以轻拿轻放杯子,即便是柔软的面包,也能在抓起时保证面包外形的完整性。

开普勒的人形机器人身高175cm,体重70kg,全身具备40个关节自由度、80多个传感器,具备复杂地形行走、智能规避障碍等多种功能。

机器人的高端核心零部件长期为日本欧洲企业把控,本次展会上,不少厂商将核心零部件作为主要看点,灵巧手、伺服器、机器人“大脑”等部件均实现突破。睿尔曼工作人员告诉亿邦动力,他们的机械臂产品预计出口日本欧洲,目前以日本为主要市场。

也有三家硬件厂商表示,大模型对硬件研发帮助有限。“大模型的作用主要体现在感知层面,以前我们用雷达感知周围情况,现在可以通过计算机视觉进行感知分析。大模型能力属于单点突破,对于整个硬件的研发与主机开发,作用有限。”

几乎所有人都对人形机器人发展抱有热切期待。

中国科学院院士毛明表示,人形机器人正在迅速成为智能制造、医疗、家庭服务等行业的变革力量。全球市场年增长率超 20%,预计 2025 年达数百亿规模。

宇树科技CEO王兴兴认为,最迟明年年底之前,全球范围内一定会出现比人跑得快的人形机器人,“比如说100米跑进10秒,在体育项目和文艺演出上,人形机器人比做家务应该更得心应手。”

工信部印发《人形机器人创新发展指导意见》指出,我国计划到2025年初步建立人形机器人创新体系,至2027年人形机器人深度融入实体经济,成为重要的经济增长新引擎。

几乎所有从业者都认同,人形机器人的渗透曲线预计与新能源汽车的曲线类似,因为人形机器人和电动车都采用了感知层、决策层、执行层的架构,都以电力为直接能源,人形机器人也可以利用新能源车产业链的资源,例如AI芯片、自动驾驶算法和视觉解决方案。

目前,人形机器人正处于初期硬件先行阶段,硬件性能的提升成为了推动行业发展的关键因素。从成本结构来看,人形机器人核心零部件的成本超过了整机成本的70%,核心零部件的成本降低是满足大规模商用的落地需求的关键。

不过人形机器人热度虽高,落地依然困难。

多位参展的人形机器人厂商表示,人形机器人目前主要出口欧美,使用场景为科研场景。开普勒机器人则计划今年下半年量产先行者K1人形机器人,预计售价在3万美元左右,用于科研。

由于特斯拉的示范性作用,也有厂商将汽车主机厂当作主要落地场景。

王兴兴也认为,人形机器人距离真正大规模应用的主要限制在于机器人人工智能方面尚未突破临界点,随着近年来在人工智能取得快速进步,可能在1-2年内会有一些小突破,3-5年内,有足够潜力实现实质性突破。

03

AI带来的风险远超核武器?

人工智能作为一个新生产力工具已经被打磨好,使用这一工具的人类还没做好准备。

作为一个工具,当AI被正面价值观引导,并置于严格的伦理和监管之下,它能展现出惊人的向善力量;若AI缺乏有效监管和道德约束,也有可能加速网络攻击、侵犯个人隐私、社会不平等社会问题,甚至成为战争工具。

利用AI来犯罪只是时间问题。”中国工程院院士、北京大学博雅讲席教授高文表示。

与展览馆的激情四射相比,世博中心的大会论坛则将目光聚焦于人工智能治理问题,本届WAIC也被冠名“人工智能全球治理高级别会议”。

不少专家学者就此发出预警。图灵奖得主姚期智认为AI风险主要来自三个方面:

它是网络风险的延伸和扩大,AI能力的出现使得传统的网络风险被放大。管理数据难度会放大100倍。

社会风险,AI可能对某些领域带来颠覆式风险,也可能带来新的失业问题。

生存和存在的风险,AI风险相比于核风险可能更严峻,这都需要很多的专家来一起解决,包括科学家、政府人士、律师及经济学家都需要参与进来。

清华大学人工智能国际治理研究院院长薛澜则认为,人工智能带来的风险包括:

第一,技术内在问题,包括所谓幻觉,另外自主人工智能系统长远来讲,可能对人类社会造成威胁;

第二,基于技术开发带来风险,包括数据安全问题、算法歧视、能源环境等等问题;

第三,技术应用,包括误用或者滥用,长远对社会就业带来影响。”

“我们对AI系统的理解仍然不够深入,用于评估和降低风险的方法存在局限性,目前还没有很好的方法去阻止风险的发生。”图灵奖得主约书亚·本吉奥指出,通用人工智能非常有用,可以应用于许多伟大的应用中,但前提是必须妥善管理。

“我们目前的教育体系没办法培养未来了解AI的一代人。”另一位图灵奖得主罗杰·瑞迪认为,AI风险确实应该得到高度关注,同时我们也不能因噎废食。现在的教育体系跟不上AI时代,年轻人需要学习用AI做好自己的工作。

智源研究院理事长黄铁军则建议对AGI进行分级。目前 AI 仍处于 L0 级的生成式人工智能(GAI)阶段,认知低于人类,只能替代部分人类智能,存在善用、误用、滥用与恶用的可能。L1 认知超人的阶段并不遥远,这意味着彼时人类可以躺平、理性信任 AI。黄铁军推测,未来3年,大模型将扩展到视觉、听觉、具身、行动等通用智能,规模变大,尺寸变小,成为具身智能的大脑。

在大模型安全对齐的过程中,主要有两种策略,一种是直接监督微调,收集大量高质量、正面、安全的信息引导大模型,让它在学习过程中逐渐形成正确的判断和安全的行为模式;另一种是基于人类偏好和价值观,侧重理解和模拟人类思考方式,不仅告诉大模型哪些行为是安全的,还尝试让它理解为什么是安全的,让大模型更好地理解和遵循人类的偏好和价值观。

AI安全之所以成为严重问题,在于对安全的投入远远落后于对性能的投入。上海人工智能实验室主任首席科学家周伯文倡导,AI研发应遵循“AI-45°平衡律”原则,即在长期发展中,要大体上沿着45度安全与性能平衡发展,保持性能与安全的同步提升,允许短期波动,但避免长期偏离这一平衡线。

文章来源:亿邦动力

广告
微信
朋友圈

这么好看,分享一下?

朋友圈 分享
+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0