现在我们看到的主播不一定都是真人了。数字人直播在各个平台已经遍地开花,抖音更是曾在5月的一则倡导中公开提到数字人在抖音内开播的规则,并为数字人直播划上了红线。
随着AIGC能力的升级,数字人直播领域获得了更大的进步。如今,在品牌增效的大背景下,数字人直播成为了品牌关注的重点话题之一。数字人直播不单单是为品牌节省成本,同时他还是一个创收的有力工具。
相同预算下,制作真人直播间的预算可以做5个甚至10个数字人直播间,而每个直播间可能带来的流量就是一个直播间与十个直播间的区别。
这是一知智能创始人陈哲乾在见实的920AIGC大会前,与见实表达的一个基于前沿应用下的观察与思考。
在大会上,陈哲乾更是就人机交互技术向参会人员们展现了真假难分的人机对话表演。接下来就让我们先回到对话现场,去听听陈哲乾对此有哪些理解与思考:
01 从痛点中杀出一条创新之路
首先简单介绍一下一知智能,一知智能是一家致力于帮助品牌通过AI技术多渠道触达消费者的营销工具公司。我们的目标是通过人机交互技术,为企业和用户传递信息和信任。我们的两大主要业务是AI外呼和AI数字人。
作为一家典型的浙大系创业公司,我们成立于2017年,与浙大庞大的AI实验室紧密合作,拥有10多位博士和40多位硕士组成的团队,致力于AI技术的落地研究。
我们的技术基于多模态人机交互技术,过去6年里,我们有幸与1000多个品牌在智能外呼、数字人交互、短视频IP和直播领域合作。
在美妆行业,我们拥有70%的市场份额,同时在大健康行业也有近50%的市占率。在各细分类目下,一知都有着不俗的表现,例如在美妆、护肤、男女装和保健品等领域,我们都在TOP10中占据了多家。
我们的目标是利用技术让更多的人受益,因此,我们公司的使命是“让交互产生更多的价值”。我们的主要任务是帮助企业和他们的用户之间建立更好的互动关系。而作为AI创业者是要在当前的技术水平下面要找到PMF真正的找到可商业化的场景。
许多品牌过去会使用CRM系统进行用户画像分析,并打上各种标签。虽然标签打得很好,但最终在触达用户时却出现了问题。因为在今天,很多企业和用户的互动方式往往是单向的,如发送短信或投放广告。但如今消费者往往不看短信,导致品牌无法有效地传递信息。
因此,我们认识到短信已经不再适用于现代的触达方式。电话则成为了一种更有效的最后一公里触达工具,能够实现更好的效果。基于这个契机,我们开始探索利用电话进行用户触达,以满足品牌的需求,提高用户参与度,并帮助品牌与其目标受众建立更紧密的联系。
而人机交互技术可以拉近企业与用户的距离,增强用户对企业品牌的认可度。通过实现更自然、更真实的交互体验,我们可以帮助企业提升品牌形象,增加用户黏性,从而创造更多的价值。
为了更好的人机交互,在技术方面,我们一直在深耕,主要包括以下两个方面。
第一个技术是我们在对话大模型的研究上取得了显著进展,成功开发出自己的大模型——太一。这个模型基于Llama2的基础,经过大量的对话数据训练,能够在短时间内生成高质量的对话内容。这项技术的突破,使得机器可以更好地理解和模拟人类的语言行为,大大提高了对话的自然度和流畅度。
除此之外,我们在AIGC领域也取得了重要的成果。我们不仅实现了形象的克隆,还攻克了声音的克隆技术。这使得我们的机器人可以更加真实地模拟人类的声音,让用户在通话过程中感受到更加自然和真实的体验。
通过这项技术,我们可以在短短1分钟40秒左右的通话中,让用户几乎感受不到是在与机器人通话。这也是为什么像Gucci、迪奥、纪梵希等高奢品牌选择使用我们的机器人外呼服务,甚至在双十一时,我们还帮助品牌利用明星的声音给粉丝打电话邀请参加活动。
在声音克隆方面,我们有两个值得一提的技术。首先,我们可以通过小样本声音克隆技术,仅需20分钟就可以克隆出罗永浩和董明珠的声音。这种技术相较于传统的声音定制方式,不仅时间成本大大降低,而且克隆出的声音更加真实和自然。
其次,我们还通过数字人方式帮助品牌打造专家IP,提高内容生成效率。相较于普通人录制视频的产出量,数字人可以在短时间内制作出大量的视频内容,为品牌提供了更高效、更丰富的宣传方式。
02 让AI成就更多新创收工具
直播如今已成为大家的痛点,我们与淘宝、拼多多等平台交流过,发现他们的最大痛点是入驻商家的开播率太低。对于平台来说,他们希望用户停留时间更长,所以今年主推淘宝直播和拼多多直播,如何让商家愿意在这些货架电商和内容电商上开播,成为平台非常关注的点。
而品牌想要建立直播间,成本相当高。一个直播间需要请2-3个主播轮班倒,因为一个主播平均播4-5个小时之后就会状态不佳,很累。而每天需要播12-15个小时,再加上助播、场控和场地费用,一年下来成本在50-100万之间。因此,品牌很想做矩阵账号和多个直播间,但成本跟不上。
我们与平台一起陪跑,帮助很多品牌利用数字人结合的方式进行直播。在高速流量场景下,使用真人方式;在低速流量场景下,使用AI混合方式,甚至半夜时段完全用AI方式。
二者交叉并行,实现更长时间的开播,更持久的带动营销。使用数字人后,品牌可以在淘宝、京东等各大平台开设直播间,这是以前无法达到的。
至于为什么要在低速流量下才使用数字人直播,一个主要原因在于,数字人直播间的用户停留时间相对较短,平均只有50秒。即使像一些大主播,平均停留时间也仅为两分半。因此,我们的目标是在这短暂的50秒到一分钟内,让观众的所有注意力集中在货品本身,而不是数字人身上。
我们需要让观众丝毫感受不到数字人的存在。AI必须做到以假乱真,甚至超越人类的表现,才能产生更多的价值。如果AI仍然让用户感觉到其存在,需要用户迁就,那么它的价值还未充分体现。比如客服,很多用户知道是机器人,所以才会迁就它,用更口语化或更清晰的方式提问。
在理想状态下,未来AI有可能取代主播。未来,可能只有一些具有独特才能和魅力的主播能够留下来,而普通平播的主播可能会被AI取代。AI技术的发展可能会逐渐取代中等水平的主播,甚至一些中上等主播,或非常优秀的头部主播才能够留下来。
注:文/见实,文章来源:见实(公众号ID:jianshishijie),本文为作者独立观点,不代表亿邦动力立场。
文章来源:见实