【亿邦原创】当数字人技术尚困在“动作僵硬”“答非所问”的泥沼中时,基于京东云技术支撑,京东言犀团队已在悄然编织一张覆盖多模态交互的技术网络。
自2021年起,京东连续斩获“吴文俊人工智能科学技术奖”,2024年更是凭借“多模态交互式数字人关键技术及产业应用”项目荣获中国智能科学技术最高奖——吴文俊人工智能科学技术奖的特等奖,也是本年度唯一的特等奖。
在技术突破此起彼伏的2024年,言犀数字人凭什么能博得吴文俊奖的头筹?这个拿下特等奖的数字人,究竟藏着哪些黑科技?让我们掀开它的赛博面纱。
1、“采销东哥”成数字人发展转折点
早期的数字人,受限于高成本和低拟人度(动作僵硬、表情不自然),总会因为“一眼假”的机械感和流量限制,应用极其受限。
2024年4月,“采销东哥”的爆火成为数字人发展的转折点。直播间里的“采销东哥”,不仅复刻了原主标志性的宿迁口音、搓手指习惯,还能分享烹饪心得,实时解答产品技术参数。这场直播首秀吸引了4000万观看量。
这种“CEO+数字人”的混搭模式,也让总裁数字人直播既能传递品牌理念,又让高冷的企业家人设接地气。随后的京东618,格力董明珠、名创优品叶国富等21位大佬化身直播间“福利官”,既能用方言讲段子,又能专业解读产品参数。
此后,京东言犀数字人一发不可收拾,上演现场试妆、双人互动接捧哏、总裁上阵、模特走秀、抱着玩偶坐播、现场品酒等超出想象的玩法。
童装品牌巴拉巴拉依托京东云的技术和平台优势,搭建了近10个垂类直播间同步运营,深夜时段由数字人承接,满足宝妈宝爸碎片化购物需求,精准承接凌晨闲时需求。基于千万级母婴知识库,从防过敏的面料有哪些,到春节换季童装选购指南,数字人已经可以实现专业育儿顾问般的精准应答,促单效率大幅提升。今年2月份,数字人直播在整个GMV占比达到15%,正在稳步提升。
安踏联合言犀数字人,在成都线下旗舰店打造了高仿真的定制数字人直播间,让线下门店变身“云试衣间”,消费者可跨时空体验商品细节。主播数字人讲解卖点,模特数字人无缝切换30余件爆款穿搭,展示跑鞋弯折、羽绒服充绒量等产品细节。2024年京东11.11期间,数字人带动直播间GMV突破2000万,公域成交GMV达140万+,转化率32.06%,相当于每3人浏览即有1人下单,转化率极高。
2、让数字人“真假难辨”
这些活灵活现的“数字分身”背后,是京东言犀团队深耕多年的技术积累。
京东言犀相关人员向亿邦动力介绍:首先,言犀团队提出了低成本、高保真人体建模技术,解决了人体建模成本高、观感差难题。通过扩散模型和柔性仿真引擎,将数字人生产成本大幅降低,只需1秒视频/照片就能生成4K超清形象。
其次,提出了语义一致多模态应答技术,解决了多模态语义难对齐、应答弱难题,实现语音、表情、动作的精准同步;同时,支持复杂场景理解,例如用户说“显瘦”时,自动推荐“深色系+H型剪裁”。
第三, 提出了多模态自然化行为生成技术,解决了多样化行为难协调、交互假难题。
这背后是首创的语音驱动表情算法,即数字人什么时候该怎么动,什么时候该喊,什么时候该轻声细语,要通过声音来驱动。通过多模态驱动,最后呈现出一个整体形象。
“每一代技术创新都需要有自己的代表性的产品。我们说起PC就会想起微软英特尔,说起移动互联网就会想起大厂,说起新一代AI我们会想起什么?数字人就是这样一个可以代表AI的颠覆性产品,有机会成为零售行业下一代交互的新入口。”该负责人表示。
据最新数据,已有超9000个品牌启用言犀数字人,累计创造140亿销售额增量,相当于在虚拟世界重建了30个北京SKP。
3、从“一眼假”到“千人千面”
2025年,京东言犀计划探索“千人千面”的数字人直播间,基于用户画像动态调整话术风格,比如对科技极客侧重参数解析,对宝妈增加育儿知识穿插。在文旅领域,大同“数字花木兰”已实现中英双语讲解古迹,京东计划将总裁数字人经验复制至城市IP打造。
这样的探索不一而足,从“采销东哥”的破圈到9000+品牌的规模化应用,从140亿GMV到吴文俊奖唯一特等奖,我们看到的不仅是技术奇迹,更是一个关于新质生产力的鲜活注脚——在这里,最硬核的AI技术牵手最柔软的沟通情商,一起组成大模型时代新的商业基因。
文章来源:亿邦动力