这几天,一个名为ChatGPT的聊天机器人彻底破圈了,火遍全网。
它写得了代码,修复得了bug,还能帮你写工作周报、写小说、进行高考答题,甚至你还可以诱骗它规划如何毁灭人类。
尽管市面上已经有了大量的聊天机器人,但马斯克仍然对此感叹:“很多人疯狂地陷入了ChatGPT循环中,我们离强大到危险的人工智能不远了。”
这个看似无所不能的ChatGPT是由美国OpenAI开发的大规模预训练语言模型,马斯克曾是这家公司的创始人之一。
12月5日,OpenAI首席执行官Sam Altman在社交媒体上发文表示,ChatGPT于上周三推出,截至目前已突破100万用户。
甚至免费公测版本的服务器很快就被热情的测试用户挤爆了。
联想集团副总裁、联想创投集团高级合伙人宋春雨告诉创业邦,AI预训练大模型的出现,成为了近三年以来AI算法创新最受关注的投资机会。
睿兽分析显示,2022年以来,国内大规模预训练模型赛道出现多笔大额融资,单笔融资金额高达10亿元,其中不乏联想创投、君联资本、启明创投、创新工场等知名投资机构。
被网友玩坏了的ChatGPT到底是什么?其背后的大规模预训练模型是怎样一条赛道,为何会受到众多投资机构的追捧?融资热背后,又离真正大规模商用落地还有多远?
“新晋网红”ChatGPT到底是什么?
简单来说,预训练模型(Pre-trained Model)是前人为了解决问题所创造出来的模型。后人在解决类似问题的时候,无需再从零开始训练一个新模型,而是可以利用此前在类似问题中训练过的模型来解决现有问题。
与人们熟悉的语音助手不同,ChatGPT在与人们的对话中可以理解较为复杂的语句内容,比如有多层语法嵌套的句子。同时,ChatGPT拥有一定联系上下文理解语境的能力,可以针对一个问题不断深入交流。令人惊讶的是,ChatGPT既能承认错误、质疑不正确的前提,还能拒绝不恰当的请求。
这就意味着,ChatGPT已经可以实现围绕某个话题,与人类展开一段谈话讨论的可能。
OpenAI官方称,ChatGPT是在人类的帮助下创建并训练的,人类训练师对该AI早期版本回答查询的方式进行排名和评级。然后,这些信息被反馈到系统中,系统会根据训练师的偏好来调整答案。这是一种训练人工智能的标准方法,被称为强化学习。
据国盛证券研报,ChatGPT有着多达1750亿个模型参数,OpenAI主要使用的公共爬虫数据集是有着超过万亿单词的人类语言数据集。
该研报指出,ChatGPT在寻找答案、解决问题的效率上已经部分超越了如今的搜索引擎。ChatGPT或许在未来会改变我们获取信息、输出内容的方式,AIGC(AI生成内容)有望成为数字经济时代驱动需求爆发的杀手级应用。
不过,ChatGPT也并非上知天文下知地理的“最强懂哥”。
据官网显示,ChatGPT目前存在着一些局限性,包括有时会给出看上去正确但荒谬的答案、微调提问的方式会得到完全不同的答案、有时会反复使用某些句子等。
网友也发现,ChatGPT有两个明显的缺点:输入不能有错,解释不够人性化。
所以,这个五天用户突破百万的模型突然遭到编程问答社区Stack Overflow的封禁。
目前,ChatGPT的研究团队也表示将根据用户反馈持续改进模型,未来还有很长的道路要走。
尽管如此,OpenAI依然被视为全球AI领域的顶级机构。
OpenAI在2020年推出的上一代GPT-3在当时就被称之为人工智能领域的一个重要里程碑。
在此之后,OpenAI也开始尝试对GPT-3进行商业化。目前,OpenAI以API的形式向开发者客户有偿提供GPT-3模型,并根据token使用量来收费。目前,基于GPT-3产生的App已经达到300多个。
今年大火的AI绘画也与OpenAI密不可分。
最早,OpenAI曾推出一款DALL-E低代码工具,用户只要提出想法、输入参数,电脑就会自动生成艺术级别的画作。在这一波AI绘画热潮中,还涌现了Midjourney、Stable AI等初创公司,有些公司已经成为独角兽。
正是预感到了大模型的巨大价值,在GPT-3推出的前一年,也就是2019年,微软向OpenAI进行了高达10亿美元的投资。
这也为微软大力推进的云战略吸引来了不少客户。
例如,美国最大的汽车零售平台CarMax利用OpenAI的开发工具把10万条客户评论直接进行了分析,根据客户的表达情绪分类成正面、中性和负面,还提取了关键字摘要,对于公司的战略决策起到了很大的帮助。
CarMax首席技术官甚至表示,如果没有人工智能,这项工作靠人工编辑团队需要耗费11年才能完成。
可以说,OpenAI带给了人们巨大的想象空间。
融资火热背后,
离真正大规模商用还有多远?
实际上,不仅是最近破圈的ChatGPT,近两年国内也迎来了“大练模型”和“练大模型”的军备竞赛热潮。
其中,自然少不了行业巨头和高校科研机构。
百度发布了产业级知识增强大模型“文心”(参数规模达2600亿),并基于“文心”模型形成了产业全景图。同时,华为联合鹏程实验室等也发布了“盘古”大模型,阿里巴巴达摩院发布了中文语言模型 PLUG。
此外,由北京智源人工智能研究院牵头,汇聚清华、北大、人大、中科院和相关企业共同研发的超大规模预训练模型“悟道”(悟道2.0参数规模达1.75万亿)也于2021年亮相。
“AI预训练大模型的出现,成为了近三年以来AI算法创新最受关注的投资机会。”联想集团副总裁、联想创投集团高级合伙人宋春雨表示,随着超大规模AI预训练模型的技术突破,在自然语言理解方面已经展现出超高程度的可用性,简而言之就是“机器真的懂人了”。
他认为,大规模预训练模型是AI大数据要走的必然之路。从学术界和产业界的角度来看,AI和大数据技术的变化也会非常大。未来两年、最多三年,AI将会有很大能力的提升。
回溯历史,从最早Deep Learning到Alpha go,到Zero 自训练,到Transformer,再到GPT-3, AI在突飞猛进的发展,并不断落地在应用场景中,比如 AI制药、预测化学分子都极大地提高了所在行业的生产力。
启明创投合伙人周志峰也表示,人工智能过去10年发展集中在感知智能,特别是视觉和语音技术的突破。下一个十年,人工智能将走向认知智能,预训练大模型是其核心技术推动力和关键基础设施,让AI吸收更多的知识去理解和思考,最终实现接近人类水平的认知。同时,预训练大模型使得AI从依赖手工调参建模走向可大规模复制的工业化阶段。
大规模预训练模型被投资人看好,也直接反映在了投融资的热度上。
睿兽分析显示,2022年以来,尤其是下半年,大规模预训练模型领域出现了多笔大额融资。
2月10日,澜舟科技完成近亿元Pre-A轮融资,由联想创投、斯道资本共同领投,创新工场跟投。9月26日,智谱AI宣布获得数亿元B轮融资,由君联资本和启明创投联合领投。11月7日,小冰公司宣布完成10亿元新融资。12月6日,聆心智能完成数千万元天使+轮融资,由连星资本领投,图灵创投和智谱AI跟投。
这些企业均将商业落地作为融资后的发力重点,但其落地的侧重点各有不同。
澜舟科技研发的“孟子”模型,用更小的模型规模(10亿参数量)实现了比肩超大模型的性能,能够具备灵活的领域和场景适应能力,在机器翻译、文本生成、行业搜索等场景更利于快速、低成本地落地。
2021年9月,澜舟科技和传神合作的第一个基于孟子预训练模型的“任度”翻译引擎正式发布上线,截至目前澜舟科技已完成了各行业垂直领域20余个翻译模型的开发,覆盖新闻、金融、汽车等领域。
聆心智能目前则主要侧重于游戏、营销、情感三个领域。
聆心智能在12月推出了图灵世界的首个产品“AI乌托邦”,用户可快速定制 AI 角色,只需要输入简单的角色描述,就可以召唤出相应人设的 AI ,与之进行深度对话,还可以命令AI完成相应的任务。
此外,聆心智能还打造了Emohaa情绪疗愈机器人,并与精神心理平台好心情达成合作,落地了国内首款人工智能心理陪伴数字人;还与高端豪华电动车品牌Beyonca合作,打造了新一代智能驾舱助手。
新一轮融资公布当天,小冰公司启动了对旗下人工智能数字员工(AI Being Employee)产品线的年度升级,其中之一就是加强大模型对话引擎。
据悉,目前小冰框架中运行了30万名数字员工,包括万科集团年度优秀员工“崔筱盼”、红杉中国首位虚拟分析师“Hóng”、虚拟歌手“洛天依”等。由小冰框架生成的“小堂妹”等数名虚拟主播,全网播放量均已破亿。
尽管各家的“大炼模型”已经在商业落地上取得了一些成绩,但实际应用情况如何、能解决哪些实际问题仍然在遭受着用户的质疑。
平安科技前沿技术部门负责人王磊就曾公开指出,当前大规模预训练模型在垂直领域存在“致命”问题。
他认为,大规模预训练模型在垂直领域性能达不到要求的原因可能是:大规模预训练模型的训练语料库规模很大,既包含了该领域的关键信息也包含了其他无关信息,使得模型缺少对关键信息的关注。同时,当前大规模预训练模型的机制改进也很少涉及对关键信息的提取。
不同于网友在ChatGPT上的“自娱自乐”,大规模预训练模型一旦商用,假如出现错误,或将会造成难以挽回的实际损失。这也是客户最大的担心之处。
特别是金融行业的客户对上线模型的精度要求很高,不少场景直接使用预加载模型往往很难满足需求。
有投资人也表示,“尽管可以通过置信度评估方法等方式来提升模型的靠谱程度,但距离商用真正意义上的‘好用’仍有很长一段路要走。”
注:文/巴里,文章来源:创业邦(公众号ID:ichuangyebang ),本文为作者独立观点,不代表亿邦动力立场。
文章来源:创业邦