广告
加载中

对话火山引擎CEO谭待:日均消耗180万亿Token后 火山的下一步是什么?

胡镤心 2026-06-25 17:18
胡镤心 2026/06/25 17:18

邦小白快读

EN
全文速览

这篇是亿邦动力对火山引擎CEO谭待的专访,梳理了当前大模型行业发展阶段、火山引擎核心业务进展,整理了面向普通用户的核心信息与干货。

1. 核心行业数据:豆包大模型日均Token调用量突破180万亿,过去一年增长超10倍,火山引擎在中国公有云MaaS市场以49.5%的份额位居第一,行业已经跨过生产力质变点,大模型正式进入生产场景。

2. 普通用户相关干货:豆包专业版已正式上线,定价为标准套餐68元/月,最高500元/月;基础版豆包会持续保持免费且高质量服务,不会降质为付费版让路。

3. 体验变化:当前大模型工作日调用量已经反超周末,说明大模型已经从早期休闲聊天工具转变为生产办公工具,普通用户可借助大模型提升日常办公效率。

本次访谈透露出大模型行业最新发展态势,为各类品牌商布局AI、开展营销与产品升级提供了多维度参考干货。

1. 消费趋势:当前AI用户基础已经成型,豆包作为国内最大AI应用日活超2亿,消费者对AI赋能产品接受度大幅提升,品牌可借助AI优化用户体验,已有奔驰、特斯拉等多家车企通过AI优化座舱提升车主满意度,硬件厂商通过AI赋能促进产品销售。

2. 营销落地:视频生成模型Seedance可帮助品牌快速制作多语言产品说明、售后培训、营销推广视频,还配备了全球领先的IP版权保护机制,可保障品牌和IP方权益,适合商用。

3. 投入性价比:当前大模型单Token创造价值的增速远快于价格增速,品牌布局AI的投入产出比持续提升,现阶段布局落地时机已经成熟。

本次访谈梳理了大模型行业的最新机会、风险与合作方向,能给各类卖家开展AI相关业务提供明确参考。

1. 机会提示:当前大行业已经跨过生产力质变点,仍处于发展早期,整体市场还有十倍到百倍的增长空间,除了短剧之外,Seedance视频生成模型已经在工业、教育、自动驾驶、零售等多个领域打开需求,新场景增量空间极大。

2. 合作与增长:火山引擎开放MaaS能力,支持第三方卖家基于大模型开发产品,已有WPS、筷子科技等多家SaaS卖家基于豆包新模型实现增收,形成了价值增值的正向循环。

3. 风险提示:行业仍在早期,短期竞争输赢不影响长期格局,不要盲目跟风低价竞争,选择合作方时要结合模型能创造的价值综合判断定价,聚焦落地效果更重要。

本次访谈透露了大模型给制造工厂带来的转型机会与发展启示,对工厂推进数字化、智能化升级有较高参考价值。

1. 生产研发需求:AI Coding已经可以落地到硬件研发环节,现有大模型已经能生成可上线、经过验证的核心代码,有芯片厂商客户通过大模型迭代出1300行可用的RTL设计代码,可大幅提升研发生产效率。

2. 商业应用机会:Seedance视频生成模型可帮助工厂制作多语言产品说明书、售后培训视频,还能为工业智能化、具身智能合成训练数据,解决真实数据获取成本高的痛点。

3. 落地启示:工厂推进AI应用需要兼顾自上而下的管理层推动和底层员工能力培养,可通过培养内部AI先锋复制落地经验,还可借助专门的数字员工管理系统规范AI应用的管理。

本次访谈明确了大模型服务行业的发展趋势、客户核心痛点与发展方向,能给各类AI服务商提供干货参考。

1. 行业发展趋势:当前大模型已经跨过生产力质变点,正式进入生产落地阶段,企业客户变得越来越务实,核心需求从拿到大模型API转变为解决实际业务问题,整体市场仍在早期,增长空间极大。

2. 客户核心痛点:企业客户引入大模型,不光需要优质的模型能力,还需要打通现有内部系统与数据、满足安全合规、版权保护、组织管理等多维度需求,单纯输出模型无法满足客户需求。

3. 发展方向参考:服务商可结合自身行业经验,基于头部成熟大模型开发行业技能模块,如果目标市场规模达不到10亿级别,无需开发独立Agent产品,可降低开发与运营成本。

本次访谈分享了火山引擎作为头部MaaS平台的发展经验,对各类大模型平台、云平台的布局运营有很多参考干货。

1. 用户核心需求:当前平台客户对大模型服务的需求是全链路的,不光需要能跨过生产力质变点的优质基础模型,还需要适配多种国产算力的推理优化能力,还要满足安全合规、版权保护、打通企业内部系统等全链路落地需求。

2. 平台布局方向:平台需要提前做好战略布局,火山引擎三年前就坚定布局MaaS抓住了增长机会,要同时兼顾模型能力和落地服务能力,模型跨过质变点后,落地服务Harness能力的重要性会持续提升。

3. 风险规避:行业仍处于早期阶段,不要过度关注短期市值波动和市场份额输赢,要聚焦为客户创造真实价值,定价要结合模型价值,不要单纯打低价战,靠综合性价比获取长期优势。

本次访谈披露了中国大模型产业的最新发展动向与特征,对产业研究、学术研究都有较高的参考价值。

1. 产业新动向:当前大模型已经跨过生产力质变点,从实验室的演示阶段正式进入企业生产场景,工作日调用量反超周末就是明确的验证信号;目前中国公有云MaaS市场集中度已经提升,火山引擎以49.5%的份额位居第一,头部效应初步显现。

2. 商业模式新进展:C端AI商业化已经启动,日活超2亿的国内最大C端AI应用豆包已经推出付费专业版,B端MaaS商业模式已经跑通,第三方开发者基于头部大模型开发应用可实现正向增收,商业循环已经打通。

3. 产业发展新特征:当前大模型规模化落地已经不再是技术问题,而是商业落地和组织适配问题,需要全链路能力支撑,单纯比拼模型参数无法满足市场需求,产业整体仍处于早期,还有十倍百倍的增长空间。

返回默认

声明:快读内容全程由AI生成,请注意甄别信息。如您发现问题,请发送邮件至 run@ebrun.com 。

我是 品牌商 卖家 工厂 服务商 平台商 研究者 帮我再读一遍。

Quick Summary

This article is an exclusive interview by Yibang Power with Tan Dai, CEO of Volcano Engine. It outlines the current development stage of China's large model industry and the core business progress of Volcano Engine, and extracts key takeaways for general users.

1. Core industry data: Doubao large model's daily average token usage has exceeded 180 trillion, growing more than 10-fold over the past year. Volcano Engine ranks first in China's public cloud MaaS market with a 49.5% market share. The industry has crossed the inflection point of productivity transformation, and large models have officially entered real-world production scenarios.

2. Key takeaways for general users: Doubao Pro has been officially launched, with a standard plan priced at 68 RMB per month, and premium plans up to 500 RMB per month. The free basic version of Doubao will remain free and maintain its high quality, with no degradation to make way for the paid tier.

3. Shifting usage pattern: Large model usage on weekdays now exceeds that on weekends, proving that large models have evolved from early-stage casual chat tools to productivity tools for work. General users can leverage large models to improve their daily work efficiency.

This interview reveals the latest development trends of the large model industry, and provides multi-dimensional actionable insights for brands planning their AI strategy, AI-powered marketing and product upgrades.

1. Consumer trends: China's AI user base is now fully established. Doubao, the largest AI application in China, has more than 200 million daily active users. Consumers' acceptance of AI-enabled products has increased significantly, creating room for brands to leverage AI to optimize user experience. Already, automakers including Mercedes-Benz and Tesla have improved customer satisfaction by upgrading their in-car infotainment systems with AI, while hardware manufacturers have driven sales growth through AI product enhancements.

2. AI marketing applications: Volcano Engine's Seedance video generation model enables brands to quickly produce multilingual product introductions, after-sales training videos and marketing content. It is also equipped with industry-leading IP copyright protection mechanisms to safeguard the interests of brands and IP holders, making it suitable for commercial use.

3. Favorable ROI: Today, the growth rate of value created per token of large models far outpaces the growth rate of token pricing. This means the ROI of brands' AI布局 is steadily improving, and the timing for commercial deployment is already mature.

This interview sorts out the latest opportunities, risks and cooperation directions in the large model industry, providing clear guidance for sellers looking to develop AI-related businesses.

1. Opportunity outlook: While the industry has crossed the productivity inflection point, it remains in an early stage of development, with room for 10x to 100x overall market growth. Beyond short dramas, the Seedance video generation model has unlocked demand across industries including manufacturing, education, autonomous driving and retail, creating huge incremental growth in new use cases.

2. Partnership-driven growth: Volcano Engine opens up its MaaS capabilities to support third-party sellers in developing products based on its large models. Multiple SaaS providers including WPS and KuaiZi Technology have grown revenue by leveraging Doubao's new generation models, forming a positive value-added cycle.

3. Risk warning: As the industry is still in its early days, short-term competitive outcomes will not determine the long-term landscape. Sellers should avoid blindly engaging in price wars. When choosing partners, they should make pricing decisions based on the actual value the model can deliver, and prioritize tangible deployment outcomes above all else.

This interview reveals the transformation opportunities and development insights that large models bring to manufacturing factories, offering valuable guidance for factories advancing digital and intelligent upgrades.

1. R&D and production applications: AI Coding is now ready for deployment in hardware R&D. Current large models can generate production-ready, verified core code. One chip manufacturing client has iterated 1,300 lines of usable RTL design code via large models, greatly boosting R&D and production efficiency.

2. Commercial application opportunities: The Seedance video generation model can help factories produce multilingual product manuals and after-sales training videos. It can also generate synthetic training data for industrial intelligence and embodied intelligence, solving the pain point of high costs for acquiring real-world training data.

3. Deployment guidance: To roll out AI applications successfully, factories need to combine top-down management promotion with bottom-up employee capability building. Factories can cultivate internal AI pioneers to replicate successful deployment experiences, and use dedicated digital employee management systems to standardize AI application governance.

This interview clarifies the development trends, core customer pain points and growth directions of the large model service industry, providing actionable insights for AI service providers.

1. Industry trends: Large models have now crossed the productivity inflection point and officially entered the production deployment phase. Enterprise clients have become far more pragmatic, and their core demand has shifted from simply accessing large model APIs to solving actual business problems. The overall market remains in its early stage, with enormous room for growth.

2. Core customer pain points: When enterprises adopt large models, they require more than just strong model capabilities. They also need to integrate with existing internal systems and data, as well as meet multi-dimensional requirements for security compliance, copyright protection and organizational management. Offering model access alone cannot satisfy client needs.

3. Growth guidance: Service providers can develop industry-specific skill modules based on mature leading large models, drawing on their own domain experience. If the target market is smaller than 1 billion RMB in size, there is no need to develop independent Agent products, which reduces development and operating costs.

This interview shares the development experience of Volcano Engine, a leading MaaS platform, offering valuable reference for the strategy and operation of large model platforms and cloud platforms.

1. Core customer demands: Today, platform clients require end-to-end large model services. They need not only high-quality foundation models that have crossed the productivity inflection point, but also inference optimization capabilities adapted to multiple domestic chips, as well as end-to-end deployment support for security compliance, copyright protection and integration with enterprise internal systems.

2. Strategic direction: Platforms need to make strategic layout in advance. Volcano Engine seized the growth opportunity by committing to MaaS three years ago. Platforms must balance both model capability and end-to-end deployment service capability. After models cross the productivity inflection point, the importance of Harness (deployment service capability) will continue to rise.

3. Risk mitigation: The industry is still in an early stage. Platforms should not overemphasize short-term stock price volatility and short-term competition outcomes. They should focus on creating real value for clients, price services based on actual model value, avoid pure price wars, and build long-term advantages through comprehensive cost-effectiveness.

This interview discloses the latest development trends and characteristics of China's large model industry, offering high reference value for both industrial and academic research.

1. New industry dynamics: Large models have now crossed the productivity inflection point, moving from laboratory demos to formal adoption in enterprise production scenarios. The fact that weekday usage now exceeds weekend usage is clear evidence of this shift. China's public cloud MaaS market has grown more concentrated, with Volcano Engine holding the top spot at 49.5% market share, and the head effect is already emerging.

2. New progress in business models: C-end AI commercialization has officially launched. Doubao, China's largest C-end AI application with over 200 million DAU, has launched a paid professional tier. The B-end MaaS business model has been proven viable: third-party developers can achieve positive revenue growth building applications on top of leading large models, and a complete commercial cycle has been established.

3. New industry characteristics: Large-scale deployment of large models is no longer a technical challenge, but rather a challenge of commercial implementation and organizational adaptation, which requires end-to-end capability support. Competing purely on model parameters can no longer meet market demand. The industry as a whole remains in an early stage of development, with still room for 10x to 100x growth.

Disclaimer: The "Quick Summary" content is entirely generated by AI. Please exercise discretion when interpreting the information. For issues or corrections, please email run@ebrun.com .

I am a Brand Seller Factory Service Provider Marketplace Seller Researcher Read it again.

【亿邦原创】“财务部门现在天天问我是不是藏了(SeeDance)收入。”

6月23日,北京,夏季FORCE原动力大会结束后,火山引擎总裁谭待坐下来跟媒体聊天时表示。他说的是外面疯传的Seedance收入数据——传得太高了,高到公司财务都坐不住了。

这种“被追问”的状态,某种程度上也是火山引擎这一年来的写照。豆包大模型日均Token调用量突破180万亿,过去一年增长超10倍;火山引擎在中国公有云MaaS市场以49.5%的份额位居第一,增长快到来不及低调。

行业的另一面是,资本在狂欢,落地在爬坡。智谱港股盘中市值突破万亿,Anthropic估值持续攀升,AI公司的市值天花板不断被捅破;同时,企业客户变得越来越务实,他们要的是能跑通的活儿,能算清的账。

谭待发现,Seedance 2.0发布前,模型周末调用量远大于工作日;发布后,工作日调用量反超。“说明大家是在办公的时候用,在生产环境里用。”这也意味着大模型能力跨越了“生产力质变点”,真正进入生产场景。

Seedance 2.5更进一步,7月上线,能直出30秒视频,场景从短剧拓展到工业制造、自动驾驶和具身智能。与此同时,豆包专业版在这一周上线,标准套餐68元/月,最高500元/月——日活超2亿的中国最大AI应用开始收费了。

谭待的判断是,市场还处于早期,“去年跑了500米,今年跑了1公里多一点点。”但对于火山引擎来说,这个节点上值得回答的问题不少——定价怎么定的?竞争怎么看?落地怎么推?

火山引擎FORCE原动力大会当天,谭待就定价、商业化、竞争和落地等话题接受了媒体采访。以下是经亿邦动力整理的实录。

1、“短期输赢不是特别重要”

问:如何看待近期AI公司市值不断突破新高的现象?火山引擎未来是否可能有单独拆分上市的计划?

谭待:据我所知,目前并没有相关计划。

问:智谱在港股突破万亿市值,Anthropic最先进的模型被封禁,AI Coding是其中重要因素。火山在AI Coding方面如何拉近与Anthropic、Gemini的差距?

谭待:Coding不只是Coding,它代表模型有很强的泛化能力,同时能自动调用更多工具,甚至可以自己写出软件来弥补没有工具的问题。

Opus 4.6是全球第一个跨过生产力质变点的模型,现在有更多模型也跨过了质变点。豆包2.1 Pro是豆包最新的旗舰版本,在评测上稳定超过Opus 4.6,某些情况下与Opus 4.7或4.8持平。这说明豆包旗舰模型已经跨过质变点,进入真正可用阶段,也意味着AI已经从简单聊天问答变成了复杂的长程Agent。我们对豆包2.1 Pro有非常大的信心和期待,发布前的邀测中,很多企业和开发者的反馈也非常不错。

问:当前中国大模型市场处于什么发展阶段?推动AI规模化应用过程中,火山观察到了哪些关键趋势?

谭待:还是早期阶段。如果说去年是跑了500米,今年大概是跑了1公里多一点点。但这1公里很重要,因为已经跨过了生产力质变点。

趋势就是生产力质变点跨过了,Opus 4.6跨过了,国产模型只要比它好,就说明也跨过了。跨过之后,AI就能在生产场景里用、能创造价值,这是非常关键的一点。

问:上半年友商在推AI Coding产品,火山在视频模型B端商业化的声量更强,怎么看待这种竞争差异?下半年AI Coding有什么增长预期?

谭待:我们一直很重视Coding,去年5月的大会上就发布了TRAE,那时其他友商还没开始讲Coding。上半年大家感觉Seedance声音更多,是因为Seedance是第一个全球SOTA模型,但我们内部一直认为Coding更重要。

我们跟很多半导体公司(如安谋)、硬件公司(如华勤)都有AI Coding的深度合作,字节内部AI Coding的使用率也非常高。下半年我们会在这方面做得更多。

问:火山引擎目前市场份额达到49.5%,在激烈竞争中靠什么守住位置?护城河是什么?

谭待:核心就两件事,第一是模型能力,特别是要跨越生产级质变点。第二是怎么把模型带到企业里去——包括FDE这种模式、对行业的理解、与伙伴的深度合作,以及火山引擎整个组织对AI的理解深度。

我们在三年前就把MaaS作为最重要的事情。那时基本上所有人都觉得Token是赔钱的生意,但我们对未来有预见性和战略确定性。这也是火山保持竞争力的重要一点。

整个市场还在非常早期的阶段,短期的输赢不是特别重要。我们更关键的是能否用更好的AI能力服务更多企业。这个市场本身还有十倍、百倍的增长空间,把这件事做好做到位,就一定能拿到好的结果。

问:最近国产大模型API价格涨跌互现,从火山自身的经营以及行业整体的成本趋势两个维度,如何理解新模型的定价策略?

谭待:我觉得看模型价格不能只看价格,一定要结合价值来看。模型能做更多的事情,创造的价值更大,所以要结合价格和价值来综合判断。

现在看到的趋势是,不管是火山还是业界主流模型,虽然单Token的标价在上升,但单Token创造的价值上升得更快。所以模型的性价比实际上在提升。无论是Coding、Agent还是视频生成,模型都跨过了生产力质变点,因此能创造更多的价值。

问:有用户反映近期豆包质量有所下降,这是否是为了推出付费版做准备?

谭待:我自己感觉没有下降,我每天也在用豆包,用得很深入。

豆包不是火山的业务范畴,我不做专业回答,但据我所知,第一,豆包会持续保持免费且高质量地服务广大用户,这一点不会改变;第二,豆包最近会面向生产力场景推出专业的任务模式,搭载的就是我们最新发布的2.1 Pro模型。

2、“所谓生产级,是代码真正能够上线、跑通测试”

问:从生产力场景看,哪些行业已经把AI从投入项变成回报项?有没有可量化的客户案例?

谭待:横向来看,Coding已经被全球验证过了,我认识的程序员很少有不借助AI辅助的,提效非常明显,这已经无需再证明了。知识库、知识问答、数据分析等领域也都有很多成果。

具体客户案例方面,很多SaaS客户——比如WPS、筷子科技等——基于豆包新模型的能力帮助他们的客户创造了更多价值,他们也获得了更多收入,这形成了很好的正向循环。

消费品行业,奔驰、上汽、东风、特斯拉等车企通过更好的模型在座舱中使用,提升了车主满意度。电视、空调、眼镜等硬件厂商,以及手机、PC厂商,也在用AI帮助硬件销售。

零售行业,有些客户把我们的Acro(企业版工作台)应用到门店管理,让单店效率提升。海底捞也用了很多AI能力。

总之,Coding、问答、企业知识库等横向应用,基本上每个企业都能看到很大价值。垂直领域则要结合行业本身的价值逻辑。

问:Seedance正在成为越来越多视频生产服务商的选择,火山如何看待这个趋势?希望形成什么样的生态定位?

谭待:我们希望Seedance能够渗入各行各业的生产环境,特别是面向高端生产力制造和世界模型方向,这是我们最看重的。

火山方舟在模型推理上做了大量优化,让Seedance能够把各种类型的芯片都用起来,特别是对高带宽HBM要求较低的芯片。Seedance和Coding、Agent模型在算力上完全不冲突,这也是Seedance得到大规模应用的重要原因——我们在模型结构和工程能力上有非常大的优化和创新。

问:Seedance 2.0为火山引擎带来的单日创收能力很强,这个涨势在多大程度上能持续?短剧行业基本被Seedance拿到,视频模型需求侧是否已基本饱和?

谭待:首先,外界所有关于Seedance收入的传言都是不准确的,而且普遍偏高,希望大家不要再传播了,这给我带来了很大压力,财务部门甚至天天问我是不是隐瞒了收入。

其次,影视短剧只是Seedance应用的一个环节,从长期来看可能只是一个小场景。很多行业已经开始使用Seedance了——制造业、零售业用它制作产品说明和面向不同国家人群的视频;制造行业用它做说明书、售后服务和培训;教育行业把知识做视频化转变;具身智能企业用它做数据合成,解决真实世界数据获取的瓶颈;自动驾驶企业用它合成极端天气和边缘路况数据,让算法运行更加稳健。

我们认为Seedance是构建世界模型的基础。通过视频生成,它能够进行无监督的大规模训练,对数据假设最少,是合成世界模型非常有效的方法之一。

所以,各个行业都有了广泛应用,而且面向世界模型的基础,这才是Seedance未来更大的想象空间所在。

问:在打通AIGC商用链条上,火山做了哪些关键动作?安全方面,Seedance 2.5会有哪些调整?

谭待:安全一直是我们最重视的事情。Seedance 2.0春节前就出来了,但正式API开放到4月份,这几个月我们主要在把安全策略做好——包括IP版权保护、用户侧的人脸保护等。这也是为什么我有信心说,Seedance不仅是全球最好的视频生成模型,也有全球最好的IP保护系统。

安全不是限制。能力越强,责任越大。把安全做好,反而让商业创作有更多想象空间。今天我们和周星驰的IP合作就是一个例子——把IP保护好,大家才能放心用你,才能建立IP方、使用者和广告主之间的信任,做更好的商业变现。

问:企业级应用需要人脸授权和数字人分身授权,火山有什么设想?

谭待:我们现在提的方案是一种版权Opt-in的方式——通过正式授权和电子合同,让大家使用你的素材,你也可以获得利益分成。个人方面,剪映上已经可以通过人脸核验创建自己的分身来使用。这个机制现在已经存在。

问:火山在提及多模态生成时,仍会探讨“能生成”到“可商用”的边界,团队如何定义这两种标准?多模态模型大规模商用目前还有什么能力卡点?

谭待:今天我们提的概念叫“生产力质变点”,定义这个边界很难,因为要看每个行业已有的流程,每个流程对模型能力的要求,达到了才能算跨过这个边界。

数据不会骗人,Seedance 2.0出来之前,很多人说视频生成是玩具——周末的调用次数远大于工作日,更多是UGC场景,大家休闲时玩玩。Seedance 2.0出来之后,工作日的负载和调用次数远大于周末,说明大家是在办公时用、在生产环境用、在数据合成时用。这个数据很充分地说明了什么是生产力的跨越。

豆包2.1 Pro也是一样。如果只是做一些简单的MIS系统、简单的demo,这不叫生产级。所谓生产级,是代码真正能够上线、跑通测试,而且是核心模块。比如芯片RTL设计,我们一个真实客户案例中,模型持续运行18小时、迭代9轮,最终交付了1300行真正可上线、经过验证的代码。包括字节内部,很多系统已经大规模用AI Coding上线了。

Agent领域也是一样,能不能让Agent做好长程复杂任务,也是非常关键的一点。

问:企业在引入Agent时面临岗位边界模糊、管理逻辑调整、员工焦虑等问题,有什么管理建议?

谭待:分享几点。

第一,AI需要同时做到Top-down和Bottom-up——CEO要重视并推动AI应用,同时也要建立全员的能力和意识。第二,组织里总有AI先锋能先跑起来,他们可以通过Skill把经验复制给其他人。

我们会在客户的团队里找到这种“超级个体”,一起推进。我们也会和企业联合举办“火山杯”AI Hackathon,今年计划做500场。

另外,对数字员工的管理也很重要。HiAgent 3.0专门发布了这个功能——管人有HR系统,管数字员工需要什么系统?HiAgent来解决。数字员工上岗前要考试、要做监控,绩效就是Token——表现好多给点Token,表现不好就限制一下。

3、大模型不再是技术问题,是商业问题

问:180万亿日均Token调用量中,字节内部业务和外部企业客户的占比结构是怎样的?算力账本如何?

谭待:180万亿是所有豆包大模型的调用量,包括内部和外部,也包括豆包App本身。豆包App占比确实较多。但从经济价值看,外部每个Token消耗的价值比内部更高,因为外部都是在生产级使用。

算力方面,我们没有具体评估过。

问:豆包大模型的Token调用量中,海外占比多少?出海到了哪些地区?有哪些标杆案例?

谭待:不管是哪里用模型,最重要的还是看模型能力能否解决问题。能力越强的模型,在海外的应用就会越多。Seedance有超过三分之一、快一半的调用量来自海外。豆包语言模型在海外也有一些Coding、Agent场景的案例。核心就是只要能力OK、性价比OK,大家就会来用。

我们也在全球建立了MaaS接入点,包括南亚、东南亚、中东、欧洲等地区,方便全球用户使用。

问:火山怎么判断一个新场景值得单独做Agent产品,而不是现有Agent上增加能力模块?

谭待:首先看市场前景,如果收入目标都没有达到10亿规模,就最好别做Agent了,做成Skill就好。当然在这个基础上,也会从技术角度进行评估。

Agent产品本身也在变化,以前可能是独立的Agent,现在模型能力强了可能写成Skill就够了。最重要的还是把模型和Harness做好,把行业理解得更深刻。

问:火山引擎更希望往基础模型能力方向去发展,还是更像Harness模式?模型能力和Harness能力哪个更重要?

谭待:都很重要。

我们的使命是激发创造、释放潜能,最终是帮企业和开发者解决实际问题。他的最终问题不是要一个好的模型或API,而是这套AI怎么在他企业的环境里落地,解决具体的业务问题。

这里面既超过模型,也超过Harness,是一个更大的范畴——跟企业系统打通,让Agent在企业内运行;跟企业数据打通;做好安全;做好身份鉴权;满足合规需求。

所以我们今天讲AI原生架构,从最核心的模型到MaaS,再到Agent开发工具,包括零代码、低代码、高代码的不同工作台,就是为了解决企业里不同角色的不同需求。

问:那优先级呢?

谭待:优先级是交错的,模型没有到质变点时,提升模型能力很重要;模型到了质变点之后,Harness也很重要。而且变化很快,这个月模型提升重要,下个月Harness重要。我们面向的是一个更高层次的目标,每个方向都要努力。

问:火山在自研DPU方面有什么思考和计划?如何看待国产算力替代?

谭待:DPU自研很早就推出了,火山成立不久就推出了。在AI大规模计算中,对网络和大规模网络的需求很高,通过更好的DPU可以把不同负载卸载下来,让整体效率更高。

火山这几年给大家的印象是在AI上非常领先,但这离不开底层基础架构的耕耘。字节最开始能做火山这个业务,也是因为我们当时的服务器规模已经很大、研发实力也很强,这让我们能在较晚的时间点进入云计算市场。

关于国产算力,我们用了很多种,各种各样的都在用。Seedance做了各种适配,能把各种算力都用好,这也一直是方舟做得比较好的地方。

问:火山是否会把自研AI芯片作为全栈布局的一环?

谭待:站在云厂商角度,这事不是特别重要,最重要的是模型能力。你看Snowflake,它也没有自己的芯片。大家不是为你的芯片来买的,是为你的模型能力来买的——你的AI能不能帮他解决问题。底下是不是自研,一点都不重要。

文章来源:亿邦动力

广告
微信
朋友圈

这么好看,分享一下?

朋友圈 分享

APP内打开

+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0