【亿邦原创】大模型第三年,问题越来越多:算力卡在哪?商业化怎么走?模型迭代什么时候是个头?
6月5日,北京国家会议中心,腾讯云AI产业应用大会主论坛刚结束,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生接受媒体采访,回答了从算力短缺、模型迭代、智能体商业化到竞争格局的几乎所有尖锐问题。
“肯定不是在赛马。”他第一句话就否定了外界对腾讯AI多条线并进的常见解读。过去三个月,腾讯密集推出了WorkBuddy企业版、ClawPro、ADP4.0,加上元宝、CodeBuddy和混元系列,市场上有人戏称“腾讯又在搞内部赛马”。汤道生回应,场景多元,不同团队做不同产品是正常的,不是竞争而是探索。
真正的瓶颈不在组织,而在算力。汤道生承认,过去两三年,腾讯的GPU算力一直处于“不太够”的状态,优先保障了混元训练、微信、腾讯会议和元宝等内部产品。“下半年国产算力到位后,才能同时服务好外部客户。”这也是腾讯云虽已实现全年盈利,却仍对MaaS业务保持克制的原因。
另一个被反复提及的名字是姚顺雨。这位年初从谷歌DeepMind加入腾讯的AI专家,如今是混元与元宝co-Design的关键推手。汤道生评价他“化繁为简”——把北极星指标从外部benchmark转向产品用户体验,砍掉了大量低质量数据,直接推动了混元3 Preview的token调用量翻倍。
至于智能体,汤道生认为还远未到收割的时候。WorkBuddy“像几年前的腾讯会议”,没有商业化考核,投入期会持续。他同时警告,纯按结果收费在AI时代并不现实——“如果产品只贡献部分价值,很难定价”。
当被问及腾讯哪里慢了,他坦然回应:“不同业务阶段性快慢很正常。年初的龙虾热,腾讯是反应最快的。”在他看来,AI是一场马拉松,不是谁短期跑得快就能赢。
以下为对话实录,经亿邦动力整理。
1、算力、模型与姚顺雨的减法
问:腾讯内部做AI产品是“赛马机制”吗?这个策略在AI时代是否适用?
汤道生:首先,我觉得肯定不是在赛马。因为现在智能体服务的场景挺多,需求也非常多元。公司内部有很多团队都在针对特定场景寻找新机会,所以大家今天在市场上会看到很多AI产品、智能体产品,它们都有各自的定位,希望能够针对它们重点要做的场景服务好大家。
腾讯一直有很多应用场景、应用产品,在前AI时代也经常被使用,它们也一样在迭代AI能力,去场景化地使用人工智能,通过使用外部工具连接我们生态内各种产品。
问:大模型价格下降的曲线会怎样?腾讯AI产品会降价吗?
汤道生:我不好点评其他模型厂商的价格策略,但是行业大趋势肯定希望token推理成本不断降低,有助于普及AI能力,解决更多、更难的问题。这是一个大趋势。
同时我也看到一些趋势,根据scaling law,模型在性能上、能力上仍然有所提升,所以很多厂商现在在做不同规格的模型,有参数较小的模型来满足对于性价比要求比较高、ROI更低、推理成本的场景,也有一些特别难的问题需要更大的模型,当然成本就会高,大家的定价策略也会有所不同。
问:混元3 Preview之后,下一代模型什么时候上线?
汤道生: 敬请期待,别给顺雨太大压力,其实是紧锣密鼓中。
问:姚顺雨加入腾讯后带来了哪些改变?当初为什么选择他?
汤道生:为什么选择顺雨应该没有什么悬念,他是这个领域非常有影响力的专家,在来之前的充分沟通中,也感受他的专业,确实AI原生一代的认知,跟我们过去有很多不一样。
他来以后,对元宝带来巨大的价值。主动推动模型跟产品的Co-Design,他自己也提到,从原来混元非常在意外部的benchmark,直接变成以产品用户体验作为北极星指标。同时我们的数据也数量大,但是不够高质量,所以早期他在训练HY3前,很多工作是提升数据质量,包括砍掉很多貌似可以堆量、但实际对模型训练没有太大帮助甚至有害的数据,识别出来不再使用。
我觉得有正确的对于大模型发展的认知,很多决策就能做得更到位。比如如果你不清楚数据质量的重要性,只是盲目奔着有更多T的token,那你就做不了砍数据这个决策。Scaling Law方面,你希望把模型做得特别复杂,有很多技巧在里面,那你就很难scale;或者你要scale很多的复杂架构,只能是把架构做得简单一些,保证有足够的算力、足够的参数,而你的数据能充分体现这些模型大小的潜在能力。
我觉得他做了很多化繁为简的事情,而对于HY3 Preview,虽然今天看不是很大的模型,但是对比以前已经有很大的进步。而且元宝跟混元过去大半年的合作,获得的进展比过去更长时间要更多。
问:在当前的战略之中,基础模型的迭代速度和Agent的工程化落地能力,哪一个对现阶段腾讯云AI的增长贡献更大?在办公协同这样的ToB通用场景和工业、金融这种垂直场景之间,腾讯云的精力和资源是怎么分配的,哪些是必须自己下场去做,哪些是交给商业合作伙伴的?
汤道生: 如果大家平时有用WorkBuddy,也会发现它的自动模式会针对不同问题,调用不同模型。今天的智能体能到这个阶段,帮我们解决很多办公场景遇到的问题,很大程度得益于模型能力发展到今天这个水平。同样的工具,你把两年前、三年前的模型放进去,肯定做不到今天这个效果。所以我仍然觉得模型的迭代对于智能体的发展至关重要。
腾讯对智能体构造、AI产品解决方案,一直采取一个开放态度,我们非常愿意跟不同模型厂商合作,就像去年元宝跟DeepSeek有一个深度融合。
今天,CodeBuddy、WorkBuddy也采取开放模型策略,因为这些通用工具要支持不同企业、不同用户的各种场景,我们希望把模型选择权交给用户。
当然混元也在持续迭代,我们也有模型能力的目标方向,很多时候客户在使用我们智能体的时候,也会对混元的调用特别感兴趣。我们仍然会采取一个比较开放的策略去发展AI智能体业务。
问:今天AI让腾讯的产品开发方式变得不一样了,腾讯一直是做产品的公司,现在整个AI的开发流程都会有变化,能以QClaw、WorkBuddy这类产品为案例讲一下?
汤道生: 现在AI原生的研发模式会比以前更扁平,比以前多角色、有清晰边界、一环到一环的瀑布流式交付,已经有挺大变化。
以前有产品经理把PRD需求文档写出来,然后由交互设计师想好用户应该怎么用,然后由视觉设计师把界面的颜色质感弄出来,然后到实现可能有前台开发、后台开发,有架构设计,然后才到程序编程,后面有功能测试、压力测试等等,以前的研发流程是一步一步滚动下去的。
但是今天当AI能够生产大量的代码,想法变得更重要。
我们有很多角色的融合,比如WorkBuddy,包括QClaw,还有其他同类的产品都是小团队运作,而且这个小团队都有一定的技术背景、能写代码,但他们今天的工作不完全是敲键盘写代码了,更多是写他想要什么,要怎么去做架构设计会更高效、更能满足不同需求、更能规模化。
有很多技术人员过去积累的海量运营know-how,今天大模型生成的代码可能在这方面考虑不足,所以有很多技术人员仍然会花精力在这个地方。
再过一段时间,很多产品研发会更从“我想要什么结果”去驱动,这样也让外面比较流行的“一人公司”成为可能——只要你有想法、你有创意,也许你就可以跟AI协作来把一个完整的产品打造出来。我相信未来的团队应该会越来越小,更多三五成群的feature team去完成一些产品研发的工作。
问: 这个会给内部的产品管理或者流程管理带来哪些挑战吗?
汤道生: 绝对是,我们也都在适应,所以一般这种试点产品其实全流程都要用新的方式来实践。我早上在台上提到,包括从质量、评测、测试的角度也不断在左移,不断在往研发过程中更早的阶段——你在做需求描述的情况下,已经要想最终怎么测试、怎么评估到底生成出来的代码有没有达到我的要求。这一系列的工作在以前可能是最后环节,但是今天都会把它前置。
问:元宝和混元三之间的co-design还是有很多期待的,双方的配合节奏是什么样的,元宝作为一个C端产品,它的核心定位以及增长目标还有KPI是什么?
汤道生: 两边的合作越来越紧密,最近大家还会搬到同一座楼,更方便沟通跟对齐。
我们看到大概80%元宝的用户已经在用HY3 preview了,而且在产品的留存率上面都有明显提升。现在元宝里面很多不同的服务都是由HY3 preview来支持,包括最新的AI语音识别、方言识别,都是以HY3的基模来做训练其他的模型。
问: 元宝的KPI是什么?
汤道生: 一方面肯定是持续在增长,希望能赢得更多的用户,留存率要持续提升。比如我每天都在用元宝,我对于元宝团队最期待的是把搜索服务做得越来越好,引入更多数据源,能很好解答生活中各种疑惑,甚至能接入一些实时数据,让服务不再纯粹基于模型的训练时间,让它的知识就只停留在那个地方。接入更实时、更有权威性的专业数据,给元宝提供有用的、好用的服务、准确的信息,都有非常大的帮助。
问: 最近友商大模型有推出在C端收费的计划,腾讯在C端大模型上,在商业化上有什么样的规划?怎么看友商在C端上的明确的商业化规划?
汤道生: 行业里有不同的商业化路径选择,我觉得当前还是把产品体验做好,能找到元宝的差异化的定位,服务好更多的用户,这是我们当前的目标。
2、WorkBuddy、SaaS与定价难题
问: 云业务板块2025年实现全年盈利了,WorkBuddy普及非常好,腾讯云会对AI Agent产品做利润或ROI考核吗,还是继续做战略性的推广和投入?算力和成本开支都在大量增加,这块会不会有进一步的压力?
汤道生:腾讯有多个赛道,每个赛道都有很多不同的产品,各自会在不同阶段。
对于WorkBuddy、CodeBuddy这样的AI智能体,现在还是投入期,我们并没有给Buddy团队设商业化目标。
不过同时,因为大量企业客户对于WorkBuddy、CodeBuddy感兴趣,在企业的场景是有清晰的商业模式,但那个更多的是云业务本来是服务企业,是一个比较正常的延展。我觉得WorkBuddy今天有点像几年前的腾讯会议,既有To C属性也有To B属性,我们会继续发挥好它C2B的能力,来搭建可持续发展的服务体系。
问: 我们一直使用“好用的AI”的定义,这个定义在WorkBuddy的ToB场景里面有没有具体的定义,怎么服务好企业目前的AI需求,怎么提升或者加强投入是哪一块?
汤道生:非常好的问题。我在这几年做AI产品也一直在想怎么定义好用,当然我们都是用户,用一个产品顺不顺手,能不能解决问题、价格贵不贵,心里都有自己的判断。
但真正在产品执行过程,早上我在跟顺雨的对话里面也提到,好的AI原生产品需要产品、模型、评测、数据四个能够对齐。
这四个维度就是我们在使用一个产品,通过一些客观的指标,尤其针对一些比较开放式的问题,要能够既达成产品的目标,有清晰的评估体系——其实就是评测部分,怎么通过能满足这个要求的数据,大家多方对齐,才能训练出能满足这些要求的模型。
所以我觉得好用,一方面从主观的角度,用户自己会用脚投票。WorkBuddy的普及也不是靠硬推广,很多用户给了非常正面的使用反馈,都觉得好用,所以用起来了。但实际我们从做产品研发的角度,就会涉及到刚才说的一整套体系来保证大家从不同的角度去定义:针对某一些问题,到底这个模型的response好或者不好,通过不同用户对于同样问题,他喜欢哪个答案,来做一些相对更泛化的评估。
问: 现在有一种声音说Agent会吃掉一部分传统SaaS的市场,在腾讯云自身的产品矩阵里面,Agent业务和传统云服务之间是否存在左右手互搏的问题?
汤道生: 用户的使用习惯过去30年一直在改变。在企业市场,今天的SaaS跟十年前或者二十年前的软件的形态一直在变化,所以对于我们的产品团队,包括企业办公协作的产品团队,比如腾讯会议、腾讯文档,其实它们也在充分拥抱用户习惯变化。
比如腾讯文档最近这几个月的迭代,其实是把它过去所积累的文档处理能力变成Skill,变成WorkBuddy可以调用的接口,让办公用户仍然获得了多年积累的文档处理能力,但同时也在一个智能体的新的载体上面——比如通过微信提交你的想法、需求,到你的PC上面调用一些文档的能力来最终完成任务。所以我看到的是,腾讯很多过去的SaaS产品或软件类的企业办公产品,也在积极拥抱AI智能体浪潮带来的机会。
问:腾讯云之前判断说单纯按token和API计费不是一个长期健康的生意,如果从资源售卖转向按任务结果和业务价值收费,这个路径是什么?怎么平衡当下按token收入和长期按价值定价的矛盾?
汤道生:我认为两者都会存在可能,其实只是不同的计费方式。
token的API方式也没有说低于成本收费还是高于成本收费,高于成本收费就是一个可持续的商业模式。我相信某一些行业、某一些业务场景是可以通过效果来收费的,但同时要针对某一件事或者一个任务达到某些效果,涉及到的因素是比较多的。如果一个产品厂商对于最终的结果只是有部分贡献,你是很难完全基于效果来charge它所提供的价值,但你不能否定部分价值不是价值。所以在这样的交付情况下,我认为纯粹按结果是比较难、很容易有争议的。
问:腾讯云怎么帮助AI应用公司避免用户越活跃、推理成本越高的毛利陷阱?
汤道生: 移动互联网的边际服务成本相对比较低,所以我们能通过广告或者眼球经济、带货或者带动某些交易行为,就能够建立起一种商业模式,起码你的收入高于成本。
但AI原生服务,以今天的运营成本、推理成本还是非常高的情况下,很难纯通过广告的模式支付用户的使用。尤其用户针对不同的问题、不同的任务可能有不同的消耗,你更难有一个稳定的回报,保证用户不付费的情况下让广告主为不确定的运营成本买单。
所以,以今天token的成本跟任务复杂度有很强关联的情况下,ToC收费——不管是订阅还是按输入token计还是更细化,输入token多少、输出token的价格不一样、有cache没有cache价格不一样,这些很复杂的交易,对于成本的消耗差异太大,很难用同样眼球的模式来变现。所以,我想AI的产品,如果它的推理成本仍然处于这个水平,它还是很可能被使用在那些高商业价值、你能够算得过账,或者它带来的新增生产力能够对标你在没有它的情况下还要花更高成本去完成的场景,那你就可以有一个新的商业模式建立起来。
问:此前腾讯在企业协作套件整合上,入口和中心其实是企业微信,包括文档、会议、网盘都接入到企业微信存在的,而这次新推出的WorkBuddy企业版推出了Agent Suite智能体套件,它的整合逻辑跟之前有什么不同,现在通过One ID、统一度量等,未来还有什么整合?
汤道生: 在移动时代,Chat APP是一个非常具有粘性的APP,企微跟微信的连接延展了我们在Chat APP赛道服务用户,及时获得信息、处理任务。在AI时代,我们同时也发现能力跟入口可以稍微剥离。
在龙虾到来这段时间,很多用户只用Chatbot,比如微信里面的Bot来作为一个入口,但是实际上你的智能体还是跑在其他的设备——PC或者云的Lighthouse都可以。我们过去很多模块功能,要转换成可被智能体调用的能力,才能够把这个工具过去多年积累下来的价值进一步释放,所以今年你会看到企微其实把原来的的一些数据能力通过接口、通过Skill开放,让其他智能体可以调用,这个趋势是越来越明显的。
AI时代,虽然元宝也好、WorkBuddy也好,好像有一个chat界面,但是你的chat不是一个社交连接,这是一种新的产品形态。
我们也发现用户对于在办公的环境,如果不是要跟同事去做交流、开会,CodeBuddy、WorkBuddy这样的界面是更符合用户的需求。当用户有这样的需求,这个产品能提供一个更符合满足他这个需求的交互体验,我们就肯定要持续加强满足用户的覆盖。
所以,我相信企业微信也好、WorkBuddy也好,在办公电脑上、在办公场景都会并存,只是企微会更侧重内部跟人与人沟通、人与服务沟通,或者直接调用OA、有一些审批流程。在原来的流程里面,企微肯定还是一个非常重要的载体。但我们也能设想到未来也有一些工作模式,更多是人跟AI协作,我们希望WorkBuddy能提供一个更自然的AI原生产品体验。
问: 今天发布了覆盖20多个垂直场景的效率智能体工具集,在这个智能体前面加“效率”,为什么要强调这一点?我们现在这个工具集在哪些行业已经取得了比较显著的落地效果,能不能分享一两个典型案例?
汤道生: 我想团队在想这个词的时候未必想得这么深刻,但我觉得我们的一个态度是,智能体是服务于人。我们什么时候会讲效率,其实是讲人的效率,员工花多少小时完成的任务、创造的价值,智能体是能够有一个放大的作用,所以效率的智能体工具其实就是在强调怎么让智能体服务于人,把人的工作效率进一步提升。
案例来说,我是用WorkBuddy把日报里的数据整理成趋势分析报告,以前要找研发同事排期,现在几分钟就能完成。这个版本不错,但我还想再加另外一个指标,只需要在WorkBuddy里面说,可能几分钟之后又有。甚至现在我都会把日报沉淀成为一个Skill。
比如今天在北京出差,我拿着微信在claw bot里面说调用这个Skill完成更新就可以了。所以要达到同样的效果,需要同样的报表,需要的人力、需要时间的等待,是会让我不干这个事儿的,所以效率的提升体现在方方面面。有销售的同学会用WorkBuddy帮他做投标竞标的标书,有销售管理的同学会从系统里面提取数据检测一些异常或者发出一些提醒,运维人员现在有很多机会用CodeBuddy做云环境迁移,其实都是现在这个时代可以做到的。
问: 腾讯云的AI业务还处于投入期,在这场长跑或者马拉松当中,我们如何向市场证明我们的AI投入是一个可量化的预期,AI的Agent投入什么时候能够cover掉成本?
汤道生: 具体时间不好预测,AI业务目前还处于战略投入期。
3、快慢、竞争与马拉松
问: 您刚才提到腾讯缺算力的问题,我们既要做训练,下面有CodeBuddy还有WorkBuddy,云还要服务外部的客户,给客户卖token、卖GPU算力,我们怎么做权衡和考虑?
汤道生: 我刚才提到,过去这两三年还是优先服务好内部产品,其实内部产品也在服务外部用户,所以确实对于腾讯来讲,这个优先级要比把GPU租出去的优先级更高一些。但是随着下半年有更多国产算力进来,既满足内部需求的同时也可以服务外部,这是当前我们的一些计划。
问: 腾讯云的DeepSeek V4是有一个降价,但早期存储、CPU是有涨价的,云的价格是有所上涨的,想问一下是不是这个涨价逻辑依旧存在?
汤道生: 整个半导体行业的上游成本确实有所上升,我们会综合考量市场环境和客户需求,在保持竞争力的同时维护业务健康。
问: 今天上午也提到一些外界的声音,大家关注腾讯是不是慢了。您认为腾讯在哪方面是慢的,哪方面是有优势、有信心的?您认为下半场能称为标志性胜利的维度或者目标是什么?
汤道生: 我记得顺雨在台上提到“下半场”这个词有点被滥用了,现在看更像是一个马拉松、更长时间的竞赛。从ChatGPT发布到今天完整走了三年多,我们在过程中看到非常多的变化。腾讯的业态非常多元,做的事儿也很多,我也觉得很难保证每一个板块都是行业最领先的,所以阶段性、不同的业务走得快一点、走得慢一点,这也很正常。
反过来看,比如今年年初这波龙虾热,腾讯也是公认在国内市场上反应最快的,现在WorkBuddy也是这个赛道上面最受欢迎的产品。
所以,市场不断会有新的机会涌现,哪怕是同一条赛道可以有不同的产品形态,腾讯不同的团队也都在积极拥抱这些机会。
我相信有的团队阶段性会跑得快一点,有的团队阶段性受限于资源、受限于不同的因素,但如果把时间拉长,尤其你看过去腾讯近28年时间里面成功的业务,今天来看成功的业务也不都是一帆风顺的,也都走过高潮走过低谷。我觉得腾讯做服务、做产品的一个理念是,当你判断清楚它是有价值的话,我们是能够坚定坚持走过这个周期。
问: 腾讯拥有丰富产品,在模型层面可以做混元,Agent上有CodeBuddy、WorkBuddy和QClaw,这是三个方向,请问一下未来这三个方向哪个方向投入更大一点,让它更快破圈?
汤道生: 我很难对于十年后去做一个终局的判断,也许不一定是一个终局,可能就是一个阶段性的结果。有意思的是,我在行业也做了很多年,往往大家前期特别看好、特别期待的,十年过后也不一定就跟原来想象的一模一样,有一些大家没有意识到的产品机会也会带给大家惊喜,所以我们会保证不同的赛道、不同的产品都有充分的资源去迭代,同时也不断地观察市场的变化。如果有更多的人对某个产品认可,腾讯也会非常及时做调整来加大投入。
我觉得一个很好的案例是CodeBuddy,三年前也有这个团队,但是做的是一个面向开发者的产品。后来随着AI的能力加强,公司内部也有coding智能体的需求,我们就承担起CodeBuddy的产品。
最早大家只是觉得是给程序员用的一个产品,但是到今年大模型的能力进一步提升,我们看到更多的可能,CodeBuddy就演化成今天的WorkBuddy,内核都是一样,harness里面设计的产品都是一样的。你突然发现一个产品形态打开了一个巨大的机会,不仅限于程序员,而非程序员的很多企业员工都发现WorkBuddy是一个特别能帮助他们工作提效的工具,这个我们在一年前是想象不到的。WorkBuddy今天的普及、受欢迎的程度,并不是我们两三年前规划出来的。所以,及时响应市场变化是一个更重要的能力。
问:现在很多人都在谈token经济,腾讯云会不会有重点考核的商业化指标,比如token的调用量、行业渗透率,会不会有这种指标的考核?
汤道生:Agent的调用量就不是一个商业化指标,它是一个使用指标。当前商业化不是我们的重点,还是要把产品打磨好,服务到更多的用户,能够证明这是一个能为大家创造价值、工作提效的工具。但我们会有商业模式,它是一个调节器,因为算力资源有限,所以到底怎么筛选出对这个产品最有需要的、最认可它创造的价值是值得他们付费来获得算力的,我想也是Agent产品发展过程中需要考虑的地方。
问: 今天道生多次谈到算力供给的瓶颈,WorkBuddy也在涨价,咱们未来会不会考虑自己下场去做算力芯片?沧海芯片也在业内广受好评,现在很多云、模型的厂商都在强调全栈协同,可能会在成本控制上有一些优势,您怎么看?
汤道生: 首先,自己去做芯片设计不解决产能问题。我因为跟很多芯片厂商、合作伙伴都有打交道,我相信没有一家今天有足够的产能去满足今天市场的需求,所以这两者其实是两件事。我们现在的做法或者这样一个生态结合的战略,其实让我们可以跟更多芯片厂商合作,也让大家非常愿意拥抱腾讯作为他们算力的一个展现标杆。
问:MaaS方面,我们最近看到友商推出很多雄心壮志的营收目标,我们怎么看MaaS上面跟其他云厂商的竞争,我们自己的目标是什么?
汤道生: 每家公司有不同的发展风格和节奏,腾讯更倾向于让产品和数据说话。