数字人二分身、虚拟主播、工业互联网……
如果不是亲眼得见,你或许不会认为百度正和这些新潮词汇产生千丝万缕的关联。
面对数字产业创新大潮,互联网大厂备受瞩目。回溯去年12月份,百度Create大会(AI开发者大会)率先揭开虚拟现实“希壤”的面纱,李彦宏也再次提及人工智能,并指出未来十年是AI产业大爆发的黄金十年。
然而,人工智能也好,虚拟现实也罢,到底是技术引擎熄火后,人类在黑暗的洞穴中聊以自慰的八卦?还是真正开启一段拓展未来生存空间、重构千行百业的“阿凡达”之旅?
这一幕,必须亲临百度,才能得以验证。
而亿邦则有幸以百度智能云为尺,去丈量未来到底有多远?
1、
为什么要做高精度的“二分身”?
在这次探访过程中,给我们留下印象最为深刻的,是“二分身”概念。
狭小的茶舍里用投影展开人类技术发展史,百度智能云数字人团队相关负责人将百度做数字虚拟人这件事的意义,定位在人类正在迈入的智能化元宇宙时代,与“虚实共生”的生活方式之中。
在百度的认知范畴中,在元宇宙、数字人技术的推动下,未来的互联网和社会生活形态与当下有根本性区别。
当下用户对互联网的需求是一元二次方,即围绕着用户在有限的空间里实现更广的体验和能力。
但对移动互联网时代出生的用户来说,他们的生活形态是二元分离的。他们将真实生活和网络生活横隔开来,并且网络生活在日常生活中所占的比例越来越大,重要程度已经远超真实生活。
对于新一代用户来说,真实生活反倒更像是客居他乡。虚拟网络才是他们真实情感的承托之地。
由此,网络上的一个账号逐渐成为大家的“分身”,每个人所拥有的数字虚拟人就是自己的二分身。
二分身的意义在于网络世界中的虚拟分身可以不休止的交互、成长。比现实世界的真人更具可塑性。
那么,在虚拟现实的场景中,怎样利用技术将数字人做出比真实人类更好的体验?
这里最大的一个难题就是做到足够真实。不仅让二分身长得和真人极度相像,还能还原真实场景的交互。
这无异于要copy一个高仿真的数字环境,其中需要融合大量的芯片技术、算法算力、人工智能、数字孪生。即便是大厂,难度可想而知。
百度智能云团队打造数字人自信的根源是什么?
是数字人团队背后又拥有整个百度的技术团队(如语音技术、视觉技术、自然语言处理技术、云工程等团队)的支持。他们不仅拥有国内最顶尖的数字人技术能力。而且而与那些提供一站式虚拟人方案的企业相比,百度是集团军作战。
这一点,也体现在百度智能云曦灵打造的数字人,已经最大程度的实现了全链路的AIGC(AI GENERATED CONTENT)能力,也就是说,通过AI能力使得数字人能听清、听懂、会表达。
目前,数字人行业有很多提供的超写实虚拟人IP,主要通过取巧方式掩盖核心技术的缺乏。如最简单的“P图流”、“AI换脸”,又或者真人动作捕捉与表演相结合的方式。“这背后成本高、难应用,技术含量不足。”
百度拥有独一无二的“拟合驱动”数字人能力。
区别于其他公司普遍采用虚幻引擎或unity来驱动虚拟人,百度自研了基于C++的引擎技术。这套引擎大小仅有十几兆,能在各种设备上流畅运行,使得百度可以做到让超写实虚拟人实施直播互动。此前的火星数字人祝融号即基于这套系统打造。
此外,基于过去人机交互技术研究的基础,百度更加能够理解人的运动和体态。“虽然虚幻引擎团队收购了metahuman,储备了一些关于人的皮肤、肢体数据,但数据极其缺乏,很多只适合欧美形态的虚拟人,而我们所使用的是自己的系统。”
而在虚拟人生成方面,百度云智能的PTA、VTA、TTS技术已经成熟,这些技术支持用户上传个人照片,通过摄像头生成虚拟人。这些虚拟人可以被用户实时体感遥控,还能彼此之间进行自然语音对话。
据透露,百度使用110亿参数模型规模的开放域对话技术,可以实现在没有人工干预的前提下进行自然语音对话,并且正基于此正在研发虚拟人在说话的同时还能完成各种情绪和表情。这是当下技术难以达到的。
今年年底,百度数字人即将实现新一代模型资产融合生成技术,能让数字人表现出各种各样的气质。与当下千篇一律的网红脸数字人有本质不同,新一代生成技术可以做到更加仿真,比如更适合亚洲人种的体貌特征,有着划时代的进步。
2、
隐而不发的虚拟主播带货“杀手锏”
在2018年左右,百度智能云开始研究商业落地场景,为银行打造数字人客服。
2021年3月,百度通过与央视的合作——虚拟主持人“晓央”逐渐扩大了直播场景的商业潜力。
有动力去尝鲜、有资金储备在虚拟人上的客户,大部分是广电、头部品牌等大型客户。
据说,为这些客户服务的虚拟人定制软件系统,可以实现多个3A级的虚拟人实时体感操控,百度智能云曦灵平台已经大幅降低了数字人的生产、制作门槛。
行业内购买同样效果的软件系统,成本至少需要两倍。
技术壁垒注定决定了虚拟人价格不菲。但我们也希望了解,最先进的技术如何通过商业化令其更具普世价值?
百度智能云的数字人团队在这方面的思考非常独到。“我们希望能为企业带来更长久可用的数字资产,如果仅仅只是尝鲜,的确可以选用更普通的产品。但我们为客户打造的是能够适用于任何场景的虚拟人IP(数字资产)。”
百度智能云对未来充满乐观。他们正在尝试与MCN机构达成合作,进行虚拟人直播带货。同时,另有多个虚拟演唱会案例也正在推进中。
真正能够成为中小电商客户降本增效利器的可能是百度智能云曦灵尚未发布的新平台。
据悉,百度智能云曦灵将会在近期发布一套针对虚拟人直播带货场景的工具,该直播带货工具将有效解决品牌方、MCN机构和主播之间的博弈问题。
“市场成熟速度要比想象中快速。”百度智能云曦灵已经搭建了数字明星运营平台,帮助MCN、艺人经纪运营虚拟人主播和虚拟偶像。这既是为将来导入百度元宇宙生态做准备,也是为建立标杆商业案例,再自上而下渗透。
百度智能云自身也打造了希加加虚拟人。日前,希加加已经与麦当劳达成合作,在成都春熙路出街了首个户外数字人广告大片。近期还会有全新虚拟人上线,做为案例向行业展示其技术和商业化能力。
3、
47万个应用,500个算法模型,AI才是基石
在AI技术方面,“百度第一”这样的用语反复出现。
这种自信也体现在工业互联网领域。因为,在百度的视角看来,工业互联网的核心竞争力就是AI。
赛迪发布的《AI+工业互联网平台市场研究》白皮书也认为,嵌入了AI技术或具有AI应用场景的平台比例正在快速增加,预计到2025年超过一半的工业互联网平台将融合AI技术或以AI技术为核心驱动。
据百度智能云相关人士介绍,基于百度自主研发的产业级深度学习开源开放平台飞桨,百度智能云开物工业互联网平台面向制造、能源、交通物流等不同行业、不同领域提供领先的、丰富的AI算法模型,覆盖了质量管控、安全生产、仓储物流等9大领域。
企业可以方便快捷的通过开物平台接入各种AI能力,降低落地应用数字技术和智能技术的门槛。
开物是百度智能云在2021年推出的工业互联网平台品牌,以“AI+工业互联网”为特色。
目前,飞桨平台已经汇聚了406万开发者,创建了47.6万个AI模型,累计服务15.7万企事业单位。
但这些技术积累看不见摸不着,如何落地?这就是百度智能云要干的事情。
“比如质检,这就是一个典型的AI应用场景。”该负责人介绍。
所谓质检,是产品出厂前的最后一关。
对于中国的中小工厂来说,每天出厂产品数以万计,质检也成为工厂内的劳动密集岗。
江苏一家金属材料结构件的企业,每天生产230万件手机充电口的结构件。为此,公司需要投入质检人员200多人,每个月花在质检上的人力成本超过数百万。此外,人工质检还受环境、个体等因素影响大,产品质检质量不稳定。
对于质检员们来说,每分钟检测19件产品,每天都在同一个位置看同样的产品,工作机械、重复、劳动强度大、薪资不高,质检环节往往成为用工矛盾突出的环节。
在百度智能云看来,3C产品的质检,恰好是AI能力,尤其是智能工业视觉发挥作用的重要场景。
AI可以通过大数据建模,做到360度无死角的外观检测,质检质量稳定,不会疲惫不需要休息,一台智能质检设备相当于10多个质检员,节省了90%以上的人力,而且也减少了80%的占地面积。
百度智能云开物平台,方便快捷的接入智能质检能力。这同样适用于纺织、钢铁、印刷、医药、汽车、半导体等行业。
这只是AI能力在工业应用中的一个环节,也是百度深入工厂场景的切入口。
据介绍,百度智能云开物工业互联网平台的发展路径,是按照点线面体的过程,逐渐深入,赋能实体经济。
目前,百度智能云开物己与汽车、电子、能源电力、装备制造、钢铁、化工、水务等超过22个行业的300多家标杆企业建立合作,为超过18万家工业企业提供服务,在贵阳、重庆、桐乡、苏州、广州、宁波等16个区域深度落地。
(百度智能云开物已经在贵阳、重庆、苏州、泉州、桐乡、广州等16个区域落地)
点是设备智能化管理和运维;线是产线流程智能化;面是企业经营智能化;体是产业生态智能化。
质检智能化属于点的部分,通过质检,可以上溯到整个产线智能化;在产线智能化的基础上,可以倒推经营智能化,进而实现整个生态智能化。
“现在我们点线面体所有环节的应用都很成熟。落地项目都非常多,而且非常有意思。”百度智能云上述相关人士介绍,“更重要的是,我们跟合作伙伴是完全开放的态度。”
“云智一体,赋能千行百业”。这也是在交流过程中反复出现的话。
至于工业互联网的市场规模有多大,百度智能云相关人士坚定地表示“不可估量。”
当前,整个行业还处于探索早期,智能化渗透率极低,行业距离终局还有很远。伴随着飞速增长的云计算业务营收,越到后期,百度的AI优势将越愈发凸显。
文章来源:亿邦动力