广告
加载中

李开复:新模型性能超GPT-4o 高性能白菜价才能做好PMF

胡镤心 2024/10/16 18:16

【亿邦原创】大模型独角兽放弃预训练?

国内外模型层差距拉大?

大模型应用难盈利?

……

2024年大模型领域一直萦绕着关于技术、应用、商业化的阴云,亟待每个参与者给出解答。

2024年10月16日上午,零一万物CEO李开复博士发布了最新旗舰模型Yi-Lightening,也带来他对大模型发展的最新研判。

这款旗舰模型在国际权威盲测榜单LMSYS上取得亮眼成绩,超越OpenAI的GPT-4o-2024-05-13和Anthropic Claude 3.5 Sonnet,排名世界第六。同时零一万物也卖出白菜价:0.99元/100万Token。“将高性能模型给出白菜价,才有望帮客户跑通PMF。”李开复表示。尽管价格喜人,但零一万物依旧有利润,“我们不做亏本生意。”

除了模型层的快速迭代,零一万物在商业化方面也显得老道。李开复相信在大模型时代所有应用都值得重做一边,但从哪个角度切入?零一万物的选择是,在国内做to B,在海外做to C。“国内流量越来越贵,而国外的C端产品,获客成本和变现能力能算得过帐。在国内,优先寻找B端罕见的、少数的、能够收费的场景,不做项目定制。”

看过国内SaaS的崛起又黯然、AI1.0时代的先扬后抑,李开复对大模型的颠覆性抱有极高期待,同时又落子谨慎。

1、放弃预训练?不可能的

随着模型层的门槛从万卡集群向着十万卡集群演进,更大的算力支出,更低的模型价格,更高的技术门槛,大模型的竞争尽管还没来得及取得太多商业化成绩,已经开始进入淘汰赛。

李开复听到不少传言,中国6个大模型独角兽(智谱AI、MiniMax、百川智能、零一万物、阶跃星辰、月之暗面)中,有两家已经放弃了预训练。

这次他在公开场合正面反驳这一说法。首先,零一万物不会放弃预训练;其次,各个独角兽企业的融资额完全支撑得起各自的预训练。“零一万物一次预训练的production run是300多万美金,这笔费用大家都付得起,我觉得中国6家大模型公司,只要有够好的人才,有想做预训练的决心,融资额跟GPU都不会是问题的。”

换言之,预训练模型大逃杀?不存在的。

同时零一万物推出了自己的新款旗舰模型Yi-Lightening,距上次旗舰模型Yi-Large的发布仅过去5个月。

Yi-Lightening再次冲上国际权威榜单。在国际权威盲测榜单LMSYS上,Yi-Lightning超越OpenAI的GPT-4o-2024-05-13和Anthropic Claude 3.5 Sonnet,排名世界第六,国内第一。“零一万物紧随OpenAI、Google之后,与xAI打平,进击全球前三大模型企业。”李开复宣布。

模型能力表现在性能上,就是推理速度的提升和推理成本的降低。Yi-Lightning首包时间(从接收到任务请求到系统开始输出响应结果之间的时间)较Yi-Large提升一倍,目前已上线Yi大模型开放平台,每百万token仅需0.99元,直逼行业最低价。

这一成果的达成有赖于零一万物成熟的训练方法论,比如,与稠密模型架构不同的MoE架构、独特的混合注意力机制(Hybrid Attention)、动态Top-P路由、 多阶段训练(Multi-stage Training)等。

“我们有更成熟的训练方法,只花了xAI成本的1%或2%,做出来的Pre-training模型跟Grok-2-08-13打平。”李开复解释。

2、部署成本更低,有客户GMV增幅达170%

优秀的大模型需要搭配精细的商业闭环,才能取得应有效果。

比如,对于一个连锁餐饮店老板来说,如何在线上有效营销,吸引周围顾客来店里瞧一瞧看一看?有老板觉得,投放KOL成本高,用人直播价格贵。而零一万物的数字人解决方案显得优质高效容易上手——只需要请人来录5分钟视频,就可以收集该主播的形象、声音、大脑。此后店铺只要输入打折内容,选择人声和语调,就可以开始全天候直播。

这个数字人可以进行实时对话,自主生成直播话术,也能够快速、精准地识别直播弹幕的互动意图,给出对应解答。而且数字人不会乱讲话,只在有商家和有授权形象的情况下才会做直播。

这是零一万物推出AI2.0数字人解决方案,其中包含角色大模型、直播声音大模型、电商话术大模型等一整套专用模型基座。其中,角色大模型提供了动作训练、表情生成等能力,直播声音大模型使得数字人迈过了多国语言和情感表达的门槛,电商话术大模型则成为了数字人主播的“AI大脑”,负责链接知识库,完成智能对话。

Yi-Lightning模型接入后, 数字人会对弹幕意图的识别更加精准、生成话术更自然、能够一步到位完成促单。随着与客户合作进程的不断深入,基于模型本身强大的函数调用能力,零一万物AI 2.0数字人还能够丝滑地与客户原有营销、物流系统互动,实现从引流到下单的全流程陪护。

除直播外,零一万物也为数字人客户准备了AI 2.0门店短视频解决方案。客户可通过极简流程,随时生成、超低成本和高品质营销视频视频,解决了传统真人短视频的成本和制作周期问题。

短视频与直播内容相互配合,为商品提供持续曝光,提升转化率。

目前,零一万物的AI 2.0数字人解决方案涵盖了AI伴侣、IP形象、电商直播、办公会议等多个应用场景,合作案例包括全国某著名餐饮连锁、某头部酒旅类客户、全国某知名水果连锁店等,均取得了显著的GMV提升。其中某头部酒旅企业在接入Yi-Lightning全新加持的数字人直播后,GMV较此前上升170%。

3、零一万物和美国顶尖模型之间的差距是5个月

2024年中国大模型行业进入“长跑阶段”,技术侧和产业侧都从燥热变得冷静,也在进一步思考行业的前行方向。

对于近期炸场的OpenAI o1,李开复认为o1带来的最大改变是认知,“o1的思考模式是把预训练里做的工作放到了推理侧。如果说在一年半前,大家觉得大模型最厉害的地方是预训练,一年以后发现post-training同样重要。感谢OpenAI点醒了这一点,我相信中美很多公司都在往o1的方向去狂奔。”

据他了解,OpenAI把o1拿出来一个理由是需要融资,而GPT-5训练不顺利。

对于在算力受限的情况下,中国基座模型的研发能力处在世界什么身位,如何追赶国外顶尖大模型等问题引,李开复给出一个具体数字:GPT-4o在5月13号发布,Yi-Lightening在10月把它打败,零一万物和美国顶尖模型之间的差距是5个月。

“缩短模型层的差距非常困难,谷歌、xAI等企业都是用10万张GPU进行训练,零一万物通过2000张GPU,训练出不逊于xAIGrok的模型,因为团队有成熟的训练方法论,同时也在快速分析新技术内核,将与OpenAI、谷歌SOTA模型的差距保持在6个月内。”

最后李开复指出,在大模型的竞争中,零一万物会坚持“模型+AI基础设施+应用”三位一体的全栈式布局,以国际SOTA的基座模型为基础,积极在ToB企业级解决方案上探索TC-PMF,助力中国打造以大模型为引擎的新质生产力。

亿邦持续追踪报道该情报,如想了解更多与本文相关信息,请扫码关注作者微信。

文章来源:亿邦动力

广告
微信
朋友圈

这么好看,分享一下?

朋友圈 分享

APP内打开

+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0