这两年AI大模型赛道迎来了应用的大规模落地,国内市场涌现出不少面向用户端的优秀应用,比如昆仑万维的天工AI、字节跳动的豆包、阿里巴巴的通义千问、百度的文心一言等。而互联网科技巨头之一的腾讯却显得有些低调,尽管也有推出混元大模型以及小程序测试版本,但仍欠缺一款真正面向用户端的AI应用。
但该来的终究会来,腾讯出品的AI大模型应用浮出水面。
5月30日,腾讯正式发布了基于混元大模型打造的App“腾讯元宝”,安卓、苹果等各大应用商店均可下载体验。至此,国内科技互联网三巨头“BAT”终于齐聚消费级AI大模型产品赛道。
据官方介绍,腾讯元宝提供AI搜索、AI总结、AI写作、AI绘画等特色功能,面向工作场景,它能够解析PDF、Word、txt等多种格式的文档,同时支持超长的上下文窗口,还能一次性解析多个网址、微信公众号链接,使用户处理工作中的复杂信息更为高效便捷;面向生活场景,腾讯元宝也提供了AI头像、角色扮演、口语陪练、同声传译等特色AI功能,用户还可以创建专属自己的个人智能体。
值得一提的是,腾讯元宝的AI搜索极具“腾讯”特色,因为它接入了微信搜一搜、搜狗搜索等搜索引擎,同时内容涵盖了微信公众号等腾讯生态内容及互联网权威信源。借助腾讯的生态优势,腾讯元宝或许能在AI搜索方面做出一定的差异化。
接下来,我们来看看腾讯元宝的实际体验。
腾讯字节AI对决:元宝豆包各有千秋
在登录腾讯元宝App的过程中会提示用户选择是否绑定微信账号。此步骤是为了方便腾讯元宝与微信之间的实时联动,不过或许是为了引流,内容的分享形式是我们熟悉的卡片,其他用户点开是这个样子的。
虽然小雷可以理解设置的初衷,但这种分享形式肯定会对其他用户的观感产生一定影响,不知道官方后续是否会优化,未来腾讯元宝可能还会继续增加与微信等其他腾讯系产品之间的联动,让AI影响整个腾讯生态。
回到正题,腾讯元宝的UI设计十分简洁,一个搜索框+下方浮动的AI功能便是全部。据了解,信息获取、处理以及产出是腾讯元宝重点关注的应用场景,分别对应着App中的AI搜索、AI总结、AI写作/绘图。既然如此,我们就先来体验这几个功能,看看腾讯元宝的实力。
为了体现元宝的AI实力,小雷决定请出之前体验过的豆包,豆包将在下列体验过程中随机出现,或许这样能更好看出双方在AI应用产品逻辑上的差异。
1、AI搜索:豆包总结提炼优秀、元宝连续对话更强
雷科技作为专注AI硬科技的新媒体,谦虚点说在全网范围内还是具有一定知名度的。我们就以雷科技为题,给元宝先热热身。回答还真给小雷带来不少惊喜,对于雷科技的介绍相当全面,从成立时间到主要业务,再到发展过程中的关键节点和行业影响力,都有提及并且有不错的准确度。
唯二的小缺点,一是雷科技的最新Slogan是“专注AI硬科技”,这点元宝没有从我们发布的文章中识别到;二是少了雷科技的最新数据,比如雷科技公众号已经突破180万,行业影响力正不断提升。
总的来说,元宝回答已经相当不错了,让小雷对接下来的体验充满期待。
苹果WWDC 2024临近,小雷就大会开始时间向元宝提问,3秒左右就输出了回答。除了小雷提问的时间外,元宝还扩展了预计发布的新软件版本、活动地点以及与问题有关的推荐文章,同时支持用户直接点击跳转参考资料。
由于小雷昨天刚写了篇相关文章,因此对WWDC 2024信息比较熟悉,核对回答后并没有发现错误。为了继续考验元宝的多轮对话能力,小雷继续提出了将回答整合成文章和扩充文章中关于新软件版本的特性。
第一个指令是“整合文章”,小雷认为是合格的。元宝在原回答的基础上,补充了标题、开头、总结,让回答看起来更像一篇文章,但在新软件版本段落,回答依旧停留在简单罗列的程度,这也是小雷提出第二个指令“扩充文章中关于新软件版本的特性”的原因。
关于第二个指令,元宝的表现则有些让人失望。虽然AI精准识别了指令并针对每个软件系统进行了解读,但解读内容的准确度却不高。以iOS 18为例,最大的看点AI没有提及,相关内容很早之前就全网疯传了,以AI搜索的能力,应该不会发现不了吧。
面对同样的问题,豆包的回答更加精简,时间、软件等信息点都没有出错。对于软件系统可能出现的更新,豆包的回答要准确些,提及了AI、RCS等iOS 18更新热点。
总的来说,元宝回答更丰富全面,可以为用户提供更多思路;而豆包回答重点放在精准上,也就是用户问什么就回答什么。两者并无优劣之分,产品逻辑决定了AI回答的侧重点。
2、AI文章总结:元宝主打言简意赅,豆包主攻信息拓展
既然元宝关于WWDC 2024的扩写还有待提高,那么就让它来总结下小雷写的WWDC 2024文章吧,希望其他用户问同样问题的时候,元宝能想起来雷科技的解读。
输入公众号文章链接和指令,元宝很快给出了文章总结。经过小雷仔细对比,总结精准度值得肯定,对文章的不同部分都进行了归纳,基本还原了文章的大意,在小雷体验过的一众AI应用中,绝对在平均水平以上。
豆包和元宝的总结归纳基本一致,只是在关键信息的罗列上具有些许差异,不影响阅读和理解。双方最大的差别在于,元宝的文章总结更精准,也就是言简意赅。而豆包提供了文章的标题、标签以及拓展讨论。
值得注意的是,拓展讨论并不是小雷文章的内容,而是豆包根据文章自动生成的,小雷认为这点是值得肯定的,虽然总结是用户指令的第一需求,但能在完成A之余,提供B甚至是C的回答,是不错的加分项。相比起豆包,元宝在这方面还有提升空间。
3、AI生成:豆包效率高、元宝风险意识强
图/文创作是用户使用频率较高的AI功能,这往往决定了用户对某个AI应用的直观印象。
在文章创作方面,小雷要求元宝写一篇关于智能手表的行业分析。从文章结构来看,小雷觉得没有太多可挑剔的地方,换作是我来写,大概率也是从行业概述、市场规模、当前竞争格局、行业趋势、行业挑战等方向进行逐步分析。当然也有需要优化的地方,比如文章内容有些太笼统宽泛了,适当增加具体数据和案例会更像人们日常的写作习惯。
不过,优化完全可以在当前对话框进行,小雷尝试要求元宝为文章不同部分增加真实数据、健康管理应用、价格等内容,一番操作下来文章比起最初版本要丰满不少,虽然距离小雷平时写作还有一定距离,但至少可以拿来充当框架,毕竟往里面填充内容可比自己思考要快得多。
图片创作方面,小雷分别尝试生成了不同主体、不同风格的图片,先给大家看看效果。
图源:元宝
不知道大家如何评价元宝的AI绘画功能,小雷个人认为还是挺满意的,至少人像面部特征清晰、背景自然、关键词识别率高这几点的表现相当不错。随着体验的深入,小雷尝试给元宝绘图加入更具体的指令,元宝的表现也没有让人失望,关键词中的动作、服装、场景统统识别。
小雷注意到元宝绘图有一个非常好的设定:版权保护。原本小雷想生成一张恶搞图片,但试了几次元宝都提示无法提供相关信息,起初我还以为是AI识别的问题,但后面切换了“海绵宝宝”关键词,就能正常生成了。后面小雷又试了几个比较出名的IP,发现也是同样的结果。
可以看出,腾讯在版权方面还是相当谨慎的,这样一来,就能降低用户使用AI创作产生的版权风险。
写在最后
一番体验下来,腾讯元宝三大核心AI功能确实带给小雷不少惊喜。但作为面向用户的AI大模型应用,腾讯元宝可能还欠缺一个让人印象深刻的“明星功能”,比如Kimi的长文本处理、Remini的黏土滤镜等等,这些功能相当于应用的记忆锚点,用户只要提前相关功能,第一个想起的必定是它们。
而腾讯元宝目前主打的AI搜索、AI总结解析、AI创作及其他AI智能体,可能在水平上丝毫不逊色于其他AI大模型应用,甚至领先,但确实还未达到巨大差异的程度。
不过,腾讯元宝今天才正式发布,留给腾讯迭代优化的时间还有很多很多。就像腾讯云副总裁、腾讯混元大模型负责人刘煜宏说的那样:“腾讯做大模型不争一时之先。”,这也是过去一年,腾讯混元大模型选择在更多业务场景中打磨技术,洞察用户真实需求的原因。
相关数据显示,当前人们使用大模型相关应用时,有超过65%的需求集中在工作、学习效率场景。腾讯元宝定位准确,接下来要做的就是加强大模型的硬实力,以及找到更多实际的场景化需求。
大模型应用市场仍在快速发展期,一款功能强大、易于使用的AI大模型应用,能在自然语境下提供智能化的回答和建议,能为用户带来了便利和高效的智能体验,小雷相信这也是腾讯元宝的终究目标。
注:文/大月亮,文章来源:雷科技(公众号ID:leitech),本文为作者独立观点,不代表亿邦动力立场。
文章来源:雷科技