【亿邦原创】10月24日,在由声网和RTE开发者社区联合主办的RTE2023第九届实时互联网在北京举行,本次大会以“智能·高清”为主题,探讨AIGC、出海、数字化转型等时下最热门的话题。
在大会上,声网创始人兼CEO赵斌宣布:“声网在RTE行业首次实现广播级4K超高清实时互动体验。”
4K不仅仅只有分辨率一个纬度,光亮强度的动态范围、色彩的真实度、饱和度,以及色彩渐变的细腻程度,都是真正超高清体验里不可或缺的一环。
大模型在快速发展,但交互界面仍局限于文字聊天互动方式。赵斌提到,通过过去一年的投入和打磨,声网推出行业首创AIGC-RTC能力模块,可支持与任何大模型平台结合,实现更低延时、更自然、更沉浸的实时语音对话,为企业协作、社交 、直播、游戏等多种场景提供新玩法、新机会。
在AI等核心技术驱动下,实时互动QoE体验的变化对于用户留存和使用行为的影响日益增强。
声网合伙人兼客户成功副总裁孙雨润介绍,“根据声网某东南亚头部泛娱乐客户数据显示,当视频从标清升级高清,停留超过30秒观众数提升19%,观众人均观看时长提升30%,同时观众打赏率大幅提升。某国内知名社交出海App,从CDN升级声网极速直播,送礼率增长12.3%。”
1、AI如何赋能RTE未来
AIGC被认为是当前的技术革命,它与RTE的深度结合,又将带来什么改变呢?
Founders Space创始人兼CEO史蒂夫?霍夫曼在分享中指出:“人工智能将对许多领域产生影响,在AI赋能的RTE未来,我们将看到每个人都会拥有更加个性化的体验,更加动态的程序将随着图形、音频、视频的实时变化而变化,AI将为我们带来前所未有的连接方式。在更深层次上,AI还将为人类增加更多的生产力水平,带来动态的虚拟世界等等,让我们感受到更多的沉浸体验。”
蒂夫?霍夫曼表示:“在AI和RTE技术的加持下,新的穿戴设备可能会进入市场,比如新的皮肤电子设备、感官增强设备等,它可以让我们听到人类听力范围之外的频率。此外,脑机接口也将读取我们的脑电波,从而帮助我们实现冥想或对其他设备的控制。”在工业RTE场景应用下,人们可以聚在一起,实时通过虚拟或真实工厂观看流水线运作、产品生产等。在AI陪伴场景中,人工智能伴侣这一概念将成为人们社交生活、娱乐、事业的一部分。
综上,未来可能会有各种类型的伴侣应用以及新的实时接口方式出现,甚至会出现一套为RTE开发的全新硬件,这些都将极大改变RTE领域的发展前景。
2、AI时代 实时互动何去何从
AI时代已经来临,实时互动该何去何从?
声网首席科学家、CTO钟声钟声指出,从2017年的Transformer,到如今的ChatGPT-4,人工智能的发展,让信息传播和消费智能化的趋势越来越明显,万事归于中心化AGI接管的趋势和威胁也越来越明显。大模型在带来发展机遇的同时,也带来了计算需求快速增长、算力受能源供给力限制、大模型数据资源不够、存储需求增长过快等问题。未来,我们除了要做负责任的AI之外,在端上和边缘上的分布式实时智能将成为价值公平分配的重要技术手段,也是减缓中心化AGI对人类威胁的有效途径,这也注定会成为一个新的技术发展趋势。
钟声认为,AGI将走进实时互动,实现人人可分身,帮助在应用场景中复制名师、网红,甚至普通人也将通过AI分身丰富体验、缓解时间稀缺的瓶颈。。此外,他预测,具备端边实时智能的高清实时互动能力将成新趋势和竞争焦点。
钟声介绍到,实时高清需要许多端上实时AI,在Low Level Vision and Audio这一需求层面,声网的SDK 4.1.x,4.2.x版本已经可以支持1080P/4K视频的例如超分、虚拟背景、感知编码、降噪、去回声等底层计算机视觉处理和高音质的计算机听觉处理能力。在High Level Vision and Audio层面,声网已经部分实现对物体、声音、场景的理解和重构能力,包括面捕、动捕、情感计算,物体识别和场景重建等,可以大力改善多种应用场景下的用户体验。
回顾2023年,AIGC大模型驱动着各行业迎来新业务机会,AR、VR、XR等技术能力的迭代为实时互动在各个领域的应用提供了更多可能。在直播社交领域,弹幕玩法成为直播新风口,这些变化都影响着RTE行业的进化,智能和高清正在推动实时互动体验进入全新时代。
文章来源:亿邦动力