数字人电商直播正从“成本替代”迈向“价值增值”
2023年底,数字人概念如野火般蔓延,无数技术提供商一夜之间涌现融资PPT里充斥着“元宇宙入口”、“永不疲倦的销售员”等诱人标签旋即陷入同质化竞争与变现困局。行业一度陷入“概念过热、落地不足的质疑漩涡。
当资本热潮退去,市场却悄然迎来价值回归——2025年,全球数字人直播电商市场逼近500亿美元,中国核心产业规模突破400亿人民币,曾经被质疑为“噱头”的技术,如今已在直播间、政务大厅、医疗培训等场景扎根生长。
此前数字人遇冷的核心原因在于技术尚未成熟,表情僵硬、动作怪异、程序化应答引发观众本能的不适。而如今多模态交互和大模型AI技术的突破使得数字人“以假乱真”,高质量的数字人也逐渐赢得品牌信赖,甚至成为直播间标配,创造业务增量。例如,近期罗永浩数字人直播带货开播26分钟,GMV就超越真人直播1小时的业绩。
为了进一步了解数字人技术在直播领域的应用和价值,我们请到了大鲸案例《毛戈平:AI数字人直播解决方案》的技术方——一知智能,围绕该案例的实施过程、技术细节及行业趋势展开,探讨数字人从视听体验到交互能力的优化方向。
1、毛戈平品牌方最初提出数字人项目的核心诉求是什么?
毛戈平(Mao Geping)是中国高端美妆品牌,以“东方美学,精致妆容”为核心理念,产品涵盖底妆、眼妆、唇妆等品类,深受消费者喜爱。品牌希望通过数字人技术打造符合其国货调性的国风虚拟主播形象。并提升线上营销效率包括:填补真人直播空档期,主要针对深夜时段的直播空白,以及提升品牌形象与声量。
2、项目正式启动前,品牌表示了哪些需求及顾虑?
具体包括:
1)形象同质化风险:需避免与其他品牌数字人形象雷同。
2)合规性压力:直播平台对低质内容封控严格,需确保画面质量与互动逻辑符合多平台审核标准。
3)运营深度不足:市面的多数工具交付模式缺乏定制化服务能力。
4)技术适配复杂性:需将AI数字人主动式营销逻辑与品牌货盘结构深度融合。
3、对此,一知智能的解决思路和方案是怎样的?
我们提供的全链路AI数字人直播解决方案,主要包括数字人形象与声音定制、模特妆造及持品视角拍摄、直播SaaS系统搭建和运维服务等。同时整合直播UI设计、节日主题运营、专属投手支持等轻运营服务,形成差异化定制能力,满足品牌对调性统一与高端定位的需求。
项目分为三个阶段:
1)形象设计及内容准备:基于品牌调性筛选模特,定制妆造、服饰及音色,完成产品特写及全景镜头拍摄;同步搭建商品话术库、问答库及直播间UI素材。
2)系统部署与测试:开通SaaS主账号授权,完成数字人形象交付及直播系统联调;通过模拟开播培训确保团队掌握操作流程,并针对问答响应速度、画面流畅度等关键指标进行优化。
3)正式运营与迭代:首期直播期间全程技术护航,实时监控违规风险及用户互动数据;结合GMV、停留时长等效果复盘,持续迭代话术脚本与投放策略。
4、项目的时间周期大概是多久?有哪些技术实现难点?
项目周期是两周。
主要实在定制化和语音合成与编排上。例如,毛戈平项目中使用其产品完成模特妆容,并通过3D运动捕捉算法生成口型和动作同步的数字形象。
对于语音合成与动作编排,我们声音训练采用全栈自研模型(如腾讯、字节合作研发),动作部分则结合基座数字人和视频数字人技术,实现实时讲解与互动。数字人主播不仅可以拿着这个商品去进行讲解,并在讲解的过程中,也可以回复直播间观众的问题。
其实还有一些非技术性挑战。毛戈平项目中,因品牌对美妆手法教学、产品呈现效果的严格要求,团队需克服拍摄角度、光线等复杂问题,最终呈现多步骤、多机位的专业效果。
5、对话系统(NLP/NLU)的核心能力如何?如何处理美容领域的专业术语、用户个性化咨询(如肤质、妆容风格推荐)?知识库构建和更新的机制是怎样的?
首先我们是有针对不同行业的行业知识库,即行业定向模型。有算法工程师做定期的更新和优化。
我们的定向行业库在开源模型基础上,已经具备了很好的泛化能力。您可以这样理解:开源模型如果直接接入Deepseek,其回复会千奇百怪。而我们的定向模型,例如针对美妆行业的定向模型,它的回复是有一定框架性的,且会融入美妆行业的专业感觉和专业术语。
此外,我们还会针对像毛戈平这样的品牌,建立专属的知识库。这个知识库可以包含品牌的专业内容,比如毛戈平美妆学院的信息、毛戈平品牌的一些实时案例等。与毛戈平相关的实时舆论热点等,也会纳入品牌的专属知识库中。
在处理意图理解的精准性方面,我们会采用类似“套圈”的形式,分为大中小三个层级来解决,以确保能够精准地理解用户的意图。
数字人已经90%接近真人主播
6、目前的数字人能力怎么样了?相比真人的优势在哪里?
从视听体验上来看,已经接近真人。目前数字人在视觉和听觉上已达到真人90%的还原度,普通用户难以区分。
从交互能力上来看,超越大部分真人。因为数字人基于AI模型,拥有无限的知识容量和快速响应能力,在母婴、数码等多SKU领域表现尤为突出。
数字人也具有显著的成本与效率优势,真人直播间冷启动搭建费用约20万还要额外支付主播500/小时的费用,全年成本100万左右,而数字人仅需要5-10万元/年即可实现多机位直播,且可全年无间断运行。
综上,相比传统BA,数字人兼具高质量形象与智能化交互,助力品牌升级的同时提高转化率。
7、缺失的10%,是在哪里?
数字人尚无法像真人主播那样精准把握观众情绪节点,尤其是在促单环节的情绪调度上存在不足。
所以我们会围绕视听、交互和数据分析三大方向持续优化。例如,深化意图识别能力,增加投流动作和视觉优化功能。
8、那么对于一些刚起步的新品牌来说,缺少数据积累,也可以使用数字人直播吗?
这个问题非常现实,如果你没有语料,其他Agency都会直接用关键词去写QA。因为是新品牌,从来没有直播过,不知道客户会问什么,就会非常不知所措。
所以需要有行业模型(前面提到的),可以回复很多常规性的问题。而且目前数字人是可以自动上播、下播,一个数字人主播相当于省下了设备师、主播、运营、中控、化妆师、场控,更适合人手不足的小品牌使用。
9、从生意的角度来看,数字人的最核心价值是什么?
通过嵌入直播环节,数字人能够提供连续不断的内容输出,不受主播语言能力和精力的限制,从而有效降低运营成本并提升品牌影响力。
基于货架电商的角度来讲,客户消费者需要一个顾问解答诸多产品问题。高质量的数字人,可以在停留,转化,用户问题回复,覆盖率上面都能有了明显的提升。
10、目前消费者(观众),对数字人最集中的吐槽和建议,体现在哪些方面。
目前的槽点主要还是智力。简单来说,就是数字人现在能代替200块钱每小时的主播,它代替不了300块钱,400块钱以及KOC和KOL。
缺少独立思考能力和多轮内容泛化能力,在意图理解、智能操作以及交互上面还是有很大的发展空间。
所以,我们未来的选代方向,一是围绕着视听上面,我们会有更新的技术升级,它可以更像一个真人一样进行互动,和更像一个主播一样跟观众进行卖货。然后第二个就是交互上面,我们会去更深化这个叫做意图识别的能力。
11、结合毛戈平项目的经验,您认为未来1-3年,数字人技术在品牌营销、用户服务、零售体验等领域会呈现哪些重要趋势?
首先是下沉市场普及,在中国有约80%的企业或者个体户,缺乏内容营销的能力,未来AI能力会更普及,帮助中小企业利用AI内容营销链接用户。
其次是基于用户体验升级,改善客服机器人僵硬的回复模式,提供更多情绪价值。
最后,通过多模态融合——结合文字、图片、视频等形式,提升零售行业的信息传递效率。
12、对于其他品牌(尤其是美妆品牌)想要开展类似的数字人项目,您会给出哪些关键的建议?
两年前数字人因工具化概念迅速兴起,但因效果不佳导致负面评价增多。如今,数字人的能力已经较为成熟,成本低、搭建快,也能让中小企业得以平等享受技术红利。
总结毛戈平的项目,该项目打造了“高定数字人+智能营销中枢+合规运营体系”全链式直播生态,突破传统直播同质化困局,为生成式AI如何从工具性应用向品牌战略资产进化,提供了新的思路。
我们给直播间设计了独特的数字人形象和美学风格,这样就能更好地符合品牌的个性,避免和其他直播间太像,显得更有高端美妆品牌的感觉。技术上,也确保直播内容完全合规,画面流畅,互动响应也特别快,都比行业标准要好。功能上,我们用主动营销和AI导购相结合的方式,让用户在直播间待得更久,购买转化率也更高,直播间的互动率和用户满意度都达到了很高的水平。而且,还积累了品牌专有的数字资产,包括定制形象、场景素材和标准运营流程,这也为后续在多个平台上的发展打下了技术和内容基础,推动品牌数字化营销向更轻便、更智能的方向发展。
除了美妆,服饰,母婴和3C数码这三个赛道也是直播性价比较高的赛道比如说美妆,客户想要去看一下上色,服装想看一下穿上去的感觉。3C数码想要去对比一下参数,或者是有一些专业性的问题。母婴的话需要-些陪伴的价值,会在弹幕里面进行多元化的互动等。
这些都是我们定义的数字人价值较多的场景。
文章来源:虎嗅智库服务