【亿邦原创】人工智能苦熬了十多年时间,终于在今年迎来了C端普及的突破。
聊天机器人ChatGPT以及其背后的AI大模型GPT,在2023年引爆全球,随后,ChatGPT背后的投资人微软及其竞争对手以周为时间单位,争先发布相关产品应用。当下,ChatGPT相关服务已经被引入微软搜索引擎Bing、社交软件Snapchat、多合一文档协作平台Notion等等。2023年3月15日,GPT4.0又发布了。
“ChatGPT的大模型是一次产业革命级别的东西,他弥补了人机交互的鸿沟,在意图理解上的高精准度会重构很多产品和行业。”实在智能CEO孙林君告诉亿邦动力,ChatGPT背后的AI大模型技术将会引发互联网产品形态新一轮变革。就电商体验来说,用户可以像在线下店沟通一样,直接跟ChatGPT描述出自己想要的产品样式,就能直接获得线下导购一样的精准推荐体验。这对当下整个电商产品形态业务逻辑都是根本性的改变。
作为国内头部RPA机器人流程自动化服务商,实在智能团队在AI研发应用领域有着长期的积累,也是国内少有的明确表态积极拥抱大模型技术、将其整合进自家产品的企业。
这项技术会怎样走进普通用户的生活?未来大众用到的互联网产品会进化到什么形态?亿邦动力与孙林君就AI大模型应用落地问题,进行深入交流。
多轮对话带来交互革命,大模型服务将成为必备能力
“我们还在复现ChatGPT的过程当中,现在要用少量资源来跑通整个流程。”孙林君表示实在智能正在将ChatGPT产品能力整合进自家的产品业务里。
孙林君的专业出身为实在智能整合ChatGPT产品能力提供了底气。其本科和研究生都是数学系人工神经网络计算专业,拥有长期深度学习理论经验。作为原阿里资深算法专家,孙林君经历了阿里机器学习大数据到深度学习到各种人工智能产品的研发,熟识前沿技术。
事实上,RPA一直被视为人工智能商业化落地的优质载体,AI+RPA曾是资本市场关注的重点企服赛道。实在智能旗下的IDP智能文档审阅、对话机器人、外呼机器人、BI、机器学习平台等等产品都整合了大量AI技术。
“这些跟ChatGPT都有很深的关联。尤其是在多轮交互上面,RPA本来就是流程自动化工具,有了这么好的体验的情况下,在垂直的领域上结合ChatGPT的能力,就可以重构我们整个产品体系。”孙林君兴奋地告诉亿邦动力。
互联网市场的发展一直与人机交互技术的变革息息相关,从PC时代的键盘鼠标提高了全社会的办公效率,到电容触控的智能手机普及深刻改变了社会形态,再到当下XR设备的手势操控正在酝酿新一轮的变革。而在手势操控技术突破之前,智能音箱及其搭配的低成本语音操控技术给市场带来过新的机会,但其“人工智障”表现影响了语音交互的进一步发展。
而ChatGPT及其背后大模型技术的突破,完全解决了语音交互“人工智障”问题,可以深度理解用户意图,多轮对话交互能力甚至高于大部分人类。这种强悍的能力可以快速拆解用户所需的服务步骤,然后交由计算机实现自动化体验。整合了ChatGPT等大模型能力的计算机服务,未来完全可以实现“即说即所得”的体验。
孙林君表示虽然短期内实现“即说即所得”尚不现实,但这是自己接下来努力的目标,实在智能将在部分领域快速实现“即说即所得”的服务能力。
“类似于编程这样讲究流程化的专业领域,实际上ChatGPT可能更擅长。未来的程序员如果不会使用ChatGPT去写代码,他的效率就会比会使用的同行低很多。未来的文创人员不会使用大模型工具,有可能他无法正常完成工作。人们整个工作方式会发生深刻变化。对于行业产品来说,例如我们RPA,无法提供相关能力的产品市场空间就会大幅缩小。”
数据能力拉开差距,基于大模型的小模型应用将迎来爆发
“大模型的性能优化空间很大,谷歌的BERT模型跟后来业内微调简化后ALBERT模型相比,后者用了十分之一的参数却表现更好。事实上,大模型生态里,除了专用高质量数据之外,最重要的工作就是基于预训练大模型跑出来的参数底座,去微调压缩训练垂直领域内的新的专用小模型,然后就可以降低算力和成本,同时提高自身产品的用户体验。”孙林君向亿邦动力透露了实在智能正在进行的工作。
大模型之所以“大”,除了参数量上百亿上千亿之外,更重要的是泛化能力强。所谓泛化能力,可以简单理解为,用户提出的问题,AI模型能力“联想”到的知识和内容更广泛,从而在意图理解和生成能力上都更胜一筹。
当然,在诸多场景下,用户并不需要过强的泛化能力服务,特别是面向专业知识领域,例如:编程。这时针对参数进行精简微调,既能提升用户体验,还能大幅降低模型的运算成本。甚至有望实现PC端、手机端轻量运行。
而纯粹依赖人力搭建的小模型,则会因为人工能够编码的数据量不足,形成过拟合问题,所谓过拟合就是不相关内容被关联在一起,然后给出错误答案。基于大模型没有上限的数据编码能力、海量参数的泛化能力可以解决这一问题。
不过,精简微调后的模型会丢失通用大模型的诸多知识信息,对模型的持续训练提升不利,具有明显的天花板,更适合应用于垂直领域。这在业界尚无完美解决方案,但针对专业领域进行多轮人工反馈训练,将会大幅提高相关模型的可用性,能够推进企业市场落地应用。虽然大模型表现出来诸多方面的优秀能力,但是对于在每一个细分领域的深度应用还是需要精雕细琢的,才能真正满足商用需求,大模型是一个非常好的baseline,通过大模型在应用领域构建的生态,相信会是业内头部厂商非常关注的问题。
“AI模型训练的目标就是,我们在知道输入和输出的情况下,训练一组参数能够在给出输入的情况下自动给出正确的输出。”孙林君表示虽然市场离这一目标还有差距,但差距也正是大模型应用生态发展的核心。
基于大模型底座,面向不同应用领域进行优化而来的小模型应用,将催生出多种多样的业务产品,丰富整个互联网应用。大模型并不像想象中会出现单一寡头独占市场的局面,而是将会迎来百花齐放的环境。由于技术方向确定,数据有足够的基础,并且是复现, 相信国内企业针对ChatGPT模型功能的复现,以及搭建中文模型生态,并不会时间很长。ChatGPT已经开始在垂直行业与相关企业合作做小模型生态。
“国内想要追赶还有个非常大的难点在于数据,ChatGPT并没有公开自己的数据处理方案,这也是影响大模型最终性能和效果的重要部分。”孙林君表示。
大模型重塑互联网,RPA是重要服务载体
“未来的互联网应用开发生态,预计就是所有开发者基于大模型底座。面向专业应用领域训练出一个高效小模型。”孙林君这样描绘未来的互联网市场。
不过当下大模型生态面临的难题是开源技术不成熟,开发者极有可能基于开源模型搭建出一套在专业领域效果更出众的“自有大模型”。开源大模型也无法以自己为底座,搭建一套应用分发生态。同时,大模型也无法保证开发者的数据私有问题。这些是阻碍大模型搭建开放互联网生态应用的核心。
“每个行业都有自己的知识,所以其实每个行业都可以做一个自己的模型,而且未来数据安全,模型都是私有化部署和定制的。大模型生态的市场空间非常大。”孙林君对未来大模型生态RPA的地位非常有信心。“无论企业还是个人,在使用大模型的过程中,肯定不是让聊天机器人回句话,而是完成一项任务。RPA就是执行任务最好的工具。”
事实上,通过打通各应用的API接口,也能更高效的以流程自动化的形式完成用户预想的任务。不过孙林君认为这一模式有很多缺陷。
“利用API接口搭建流程自动化,需要各家应用配合接入,应用每升级一个版本都要针对性修改适配。RPA是基于计算机UI的自动识别,无论什么操作系统、什么设备、什么应用版本都可以运行,而且不需要开发者去一对一适配开发。”
在大模型和RPA的结合之下,当下的PC、智能手机、智能音箱等消费电子产品,都有望迎来全新的应用形态上的全面革新,RPA也可能以另外一种全新的形态出现。
“现在智能手机5G的上行下行速率已经足够,云端运行大模型来服务消费终端体验是可行的,预计国内很快就会有大厂复现出ChatGPT,相关的应用生态落地速度也会比想象中快。”孙林君表示实在智能要赶上大模型的技术大势,推动市场实现“即说即所得”。
文章来源:亿邦动力