广告
加载中

Token狂飙这一年:巨头踩刹车 打工人用不起|我们和四位从业者聊了聊

懒人 2026-06-25 13:35
懒人 2026/06/25 13:35

邦小白快读

EN
全文速览

本文核心讲当前全球AI Token消耗量持续上涨,但多国科技巨头开始给内部AI使用踩刹车,梳理了企业AI配额管理的现状和可行方案,核心干货如下

1. 核心行业现状:全球大模型总调用量连续九周上涨,中国周调用量连续八周超美国,豆包大模型日均Token使用量已突破180万亿;初期不少企业把Token消耗纳入绩效,催生了“Tokenmaxxing”刷量行为,业内估算约50%的Token消耗完全无用。

2. 可参考的实操方案:企业配Token可以从每人每月100-200美元的低额度起步,设置通用限额,超额需主管审批;不要将Token消耗作为KPI考核指标,按实际产出核定投入,给不同岗位设置差异化额度即可。

本文梳理了企业内部AI应用的发展现状和常见误区,给出了品牌布局AI落地的可借鉴经验,核心干货如下

1. AI落地的常见误区:不少品牌初期跟风强制全员用AI,把Token消耗量作为能力考核指标,反而催生刷量浪费,目前行业数据显示,仅39%的企业AI应用对利润产生实质影响,称得上AI高绩效企业的仅占6%,多数品牌的AI投入没拿到对应回报。

2. 可借鉴的管理方案:可以采用差异化额度分配,额度先进入团队池再按需分配,从低额度起步,用完再申请追加,超额需审批,明确不把消耗作为考核指标,按投入产出比给不同岗位定额度。

3. 长期发展方向:不要盲目拼消耗,要把Token投入转化为可复用的工作流、私有知识库等自有组织资产,才能真正沉淀AI能力。

本文梳理了当前企业AI应用的发展趋势,给出了卖家落地AI的风险提示和实操参考,核心干货如下

1. 行业现状与风险提示:当前AI Token消耗持续上涨,但行业已经从盲目拼消耗转向理性管理,初期盲目将Token消耗作为KPI一定会催生刷量浪费,业内估算超一半消耗是无用的,目前仅不到四成企业的AI投入对利润产生实质影响,大量投入未必能换来对应产出。

2. 可借鉴的落地方法:可以从每人每月100-200美元的低额度开始试点,设置通用限额,超额需要管理者审批,不将Token消耗纳入考核,按照不同岗位的实际产出核定投入,差异化分配额度。

3. 机会提示:未来行业竞争的核心是精准匹配任务与模型、沉淀可复用AI资产,卖家可以提前布局相关能力,建立自身的AI应用优势。

本文分享了头部企业AI落地的经验教训,对工厂推进AI数字化转型有不少启示,核心干货如下

1. 转型要避开的常见坑:工厂推进AI应用时,不要盲目跟风拼Token消耗,更不要把使用量作为考核指标,否则很容易出现大量无用消耗,拉低投入产出比;目前业内数据显示,超过一半的企业内部Token消耗是无意义的,多数企业的AI投入还没产生对应利润。

2. 可参考的落地方法:工厂可以先从低额度试点开始,给不同岗位设置差异化额度,额度统一归团队统筹,由管理者根据实际需求分配,设置超额审批机制,不将使用量纳入考核,只衡量实际产出的投入产出比。

3. 长期转型方向:AI转型的核心不是投入多少成本调用模型,而是要沉淀适配工厂生产、设计需求的可复用工作流、知识库,形成自身的AI应用能力,这才是AI转型的长期竞争力。

本文清晰展现了当前企业AI服务领域的行业发展趋势和客户核心痛点,对服务商调整业务方向有较高参考价值,核心干货如下

1. 最新行业发展趋势:当前全球AI Token消耗持续增长,中国调用量已经连续八周位居全球第一,企业AI渗透率不断提升;但行业已经从初期的盲目扩张拼消耗转向理性管理,企业对AI使用的成本管控和产出提升的需求越来越强烈。

2. 企业客户的核心痛点:当前企业的核心痛点是难以平衡AI使用开放和成本控制,要么放开后浪费严重、账单高企,要么额度收紧影响正常使用;同时多数企业无法衡量AI投入的实际产出,分不清有效消耗和无效消耗。

3. 市场机会和解决方案方向:服务商可以针对性开发额度动态管理、任务-模型智能匹配、AI资产沉淀工具,帮助企业管控成本,提升AI投入的投资回报率,满足企业精细化管理AI使用的需求。

本文梳理了当前企业客户使用AI大模型服务的需求变化,对AI平台商的运营管理和风险规避有参考意义,核心干货如下

1. 企业客户的需求变化:初期企业普遍追求高额度、无限制调用大模型,现在已经转向精细化的额度管理、成本管控,要求能根据团队、岗位灵活分配额度,监控消耗对应的实际产出,避免无效浪费,这对平台的功能设计提出了新要求。

2. 可借鉴的运营方向:平台可以开发灵活的团队额度池管理功能,支持企业统筹分配、超额审批,同时增加消耗产出分析模块,帮助企业区分有效和无效消耗,智能匹配不同任务对应不同性价比的模型,帮助企业降本提效。

3. 风险规避方向:不要一味炒作消耗规模,要引导客户理性使用AI,关注实际产出,避免行业陷入盲目拼消耗的泡沫,同时可以推出阶梯定价方案,适配不同规模企业的需求。

本文展现了当前企业AI落地阶段的最新产业动向和核心问题,积累了大量一手行业观察和数据,对AI产业研究有较高价值,核心干货如下

1. 最新产业动向:当前全球AI大模型调用量连续九周上涨,中国周Token调用量已经连续八周超过美国,稳居全球第一;行业发展从初期的巨头动员全员用AI、比拼消耗规模,转向当前巨头集体踩刹车、管控使用成本,正式进入精细化运营新阶段。

2. 产业暴露的核心新问题:企业将Token消耗纳入绩效评估后,出现了目标异化,催生了“Tokenmaxxing”刷量行为,业内估算超过50%的内部Token消耗是完全无效的;目前仅39%的企业AI应用对利润产生实质影响,仅6%的企业属于AI高绩效企业,多数企业还未理顺AI投入的投入产出关系。

3. 产业新趋势:未来企业AI竞争的核心是把Token投入转化为可复用的组织资产,而非单纯比拼消耗规模,这个新的产业动向值得深入研究。

返回默认

声明:快读内容全程由AI生成,请注意甄别信息。如您发现问题,请发送邮件至 run@ebrun.com 。

我是 品牌商 卖家 工厂 服务商 平台商 研究者 帮我再读一遍。

Quick Summary

This article focuses on the continuous global growth of AI token consumption, while major tech giants around the world are starting to put the brakes on internal AI usage. It summarizes the current status of corporate AI quota management and actionable solutions, with key takeaways below:

1. Core industry status: Total global large model API calls have risen for nine consecutive weeks, with China’s weekly call volume surpassing the U.S. for eight straight weeks. Doubao large model’s daily average token consumption has exceeded 180 trillion. In the early adoption stage, many companies tied token consumption to employee performance, giving rise to the "Tokenmaxxing"刷量 practice, and industry estimates suggest around 50% of all token consumption is completely useless.

2. Actionable solutions for reference: Companies can start with a low quota of $100-$200 per person per month, set a general company-wide limit, and require supervisor approval for over-quota usage. Do not use token consumption as a KPI; instead, allocate investment based on actual output and set differentiated quotas for different positions.

This article sorts out the current status of internal enterprise AI adoption and common missteps, and offers actionable insights for brands looking to implement AI. Key takeaways are as follows:

1. Common pitfalls in AI implementation: Many brands rushed to follow the trend and mandated AI usage for all employees in the early stage, tying token consumption to performance assessments, which only led to wasteful刷量. Current industry data shows only 39% of enterprise AI applications have delivered a material impact on profits, and just 6% of companies qualify as high-performing AI adopters. Most brands have not seen commensurate returns on their AI investments.

2. Actionable management frameworks for reference: Brands can adopt differentiated quota allocation, where quotas are first pooled at the team level and distributed based on actual demand. Start with low initial quotas, allow additional applications when quotas run out, and require approval for overages. Explicitly exclude consumption volume from performance metrics, and set quotas per role based on input-output ratio.

3. Long-term development direction: Instead of blindly competing on consumption volume, brands should convert token investment into reusable organizational assets such as internal workflows and private knowledge bases to build sustainable AI capabilities.

This article outlines current trends in enterprise AI adoption, and offers risk warnings and actionable guidance for sellers looking to implement AI. Key takeaways are below:

1. Industry status and risk warnings: While AI token consumption continues to rise, the industry has shifted from blind consumption competition to rational cost management. Tying token consumption to KPIs in the early stage will inevitably lead to wasteful刷量, with industry estimates putting useless consumption at over half of total usage. Currently, less than 40% of enterprise AI investments have delivered a material impact on profits, meaning heavy spending does not guarantee commensurate returns.

2. Actionable implementation guidance for reference: Sellers can start with a pilot of $100-$200 per person per month, set a general usage cap, require manager approval for overages, exclude token consumption from performance assessments, allocate investment based on actual output per role, and distribute quotas differently across positions.

3. Opportunity outlook: The core of future industry competition will be accurately matching tasks to appropriate models and building reusable AI assets. Sellers can build these capabilities in advance to establish a competitive advantage in AI adoption.

This article shares lessons from leading companies’ AI implementation journeys, and offers key insights for factories advancing AI-driven digital transformation. Key takeaways are below:

1. Common pitfalls to avoid in transformation: When rolling out AI applications, factories should not blindly chase token consumption or tie usage volume to performance assessments, as this will lead to massive useless consumption and drag down return on investment. Current industry data shows more than half of internal enterprise token consumption is meaningless, and most companies have not generated corresponding profits from their AI investments.

2. Actionable implementation approaches for reference: Factories can start with a low-quota pilot, set differentiated quotas for different positions, centralize quota management at the team level for distribution based on actual demand, implement an over-quota approval mechanism, exclude usage volume from performance assessments, and only measure input-output ratio based on actual output.

3. Long-term transformation direction: The core of AI transformation is not how much you spend on model calls, but building reusable workflows and knowledge bases tailored to your factory’s production and design needs, and developing in-house AI application capabilities. This is what builds long-term competitiveness in AI transformation.

This article clearly lays out current industry trends and core customer pain points in the enterprise AI services space, offering high-value reference for service providers looking to adjust their business strategy. Key takeaways are below:

1. Latest industry trends: Global AI token consumption continues to grow, with China’s call volume ranking first in the world for eight consecutive weeks, and enterprise AI penetration keeps rising. However, the industry has shifted from the early stage of blind expansion and consumption competition to rational management, and enterprises have growing demand for AI cost control and output improvement.

2. Core pain points of enterprise clients: The biggest challenge for enterprises is balancing open AI access with cost control: either unregulated access leads to massive waste and sky-high bills, or tight quotas disrupt daily work. In addition, most enterprises cannot measure the actual output of their AI investments, and cannot distinguish between effective and useless consumption.

3. Market opportunities and solution directions: Service providers can develop targeted tools for dynamic quota management, intelligent task-model matching, and AI asset沉淀, to help enterprises control costs, improve AI return on investment, and meet enterprises’ demand for refined AI usage management.

This article sorts out shifting demand from enterprise clients for large model AI services, offering reference for operation management and risk mitigation for AI platform providers. Key takeaways are below:

1. Shifting demand from enterprise clients: In the early adoption stage, enterprises generally pursued high, unlimited large model call quotas. Now they have shifted to demand for refined quota management and cost control, requiring flexible quota allocation across teams and roles, monitoring of output corresponding to consumption, and elimination of useless waste. This puts forward new requirements for platform function design.

2. Actionable operational directions for reference: Platforms can develop flexible team quota pool management functions that allow enterprises to centrally allocate quotas and approve overages, while adding a consumption-output analysis module to help enterprises distinguish between effective and useless consumption, and intelligently match different tasks to models of appropriate cost-performance, to help enterprises cut costs and improve efficiency.

3. Risk mitigation guidance: Platforms should not overhype consumption scale. Instead, they should guide clients to use AI rationally and focus on actual output, to prevent the industry from falling into a bubble of blind consumption competition. Platforms can also roll out tiered pricing plans to meet the needs of enterprises of different scales.

This article presents the latest industry developments and core issues in the current stage of enterprise AI implementation, backed by a large volume of first-hand industry observations and data, offering high value for AI industry research. Key takeaways are below:

1. Latest industry developments: Global large model API calls have risen for nine consecutive weeks, with China’s weekly token call volume surpassing the U.S. for eight straight weeks to hold the top spot globally. The industry has shifted from the early stage of giants mandating company-wide AI adoption and competing on consumption scale, to the current phase where giants are collectively hitting the brakes to control usage costs, officially entering a new stage of refined operation.

2. Core emerging issues exposed by the industry: When companies include token consumption in performance assessments, goal distortion occurs, giving rise to the "Tokenmaxxing"刷量 behavior. Industry estimates suggest more than 50% of internal token consumption is completely useless. Currently, only 39% of enterprise AI applications deliver a material impact on profits, just 6% of companies qualify as high-performing AI adopters, and most enterprises have not yet sorted out the input-output relationship of their AI investments.

3. New industry trends: The core of future enterprise AI competition will be converting token investment into reusable organizational assets, rather than simply competing on consumption scale. This new industry development is worthy of in-depth research.

Disclaimer: The "Quick Summary" content is entirely generated by AI. Please exercise discretion when interpreting the information. For issues or corrections, please email run@ebrun.com .

I am a Brand Seller Factory Service Provider Marketplace Seller Researcher Read it again.

作者|懒人

编辑|张洁

Token消耗量还在狂飙,但关于“该不该让员工放开用AI”,答案变得没那么简单。

过去几个月,我们看到两条时间线同时发生:一边是全球AI调用量继续创新高,中国大模型Token消耗也在快速上升;另一边,亚马逊、Uber、微软等公司开始给内部AI账单踩刹车。

更有意思的是,当这件事落到公司内部,它不再只是一个技术问题,而变成了管理问题:员工该不该自费买AI工具?公司给额度,是福利、基础设施,还是新型KPI?如果有人一个月烧掉几十万、上百万Token,到底是在提效,还是在刷存在感?

带着这些问题,我们也和几位正在一线使用、采购或管理AI工具的人聊了聊。巨额账单之外,真正棘手的问题是:Token到底该怎么配,又该怎么被用好?

根据OpenRouter最新数据,上周(6月15日至21日)全球AI大模型总调用量为46.7万亿Token,较此前一周增长4.7%,连续九周上涨。其中,中国AI大模型周调用量达18.81万亿Token,连续八周超过美国,稳居全球首位。

国家数据局的数据则拉长了这条增长曲线:我国大模型日均Token调用量,从2024年初的1000亿增长到2025年底的100万亿,再到2026年3月的140万亿以上。而据火山引擎6月23日最新披露,仅豆包大模型当前日均Token使用量已突破180万亿。

消耗数字还在涨,但巨头们正在悄悄踩刹车。

就在不到一年前,不少公司还在声势浩大地要求员工使用AI,把“用不用AI”包装成一种新的工作能力指标。而近几个月,亚马逊关掉了内部Token消耗排行榜,微软取消了部分业务线的Claude Code授权,多邻国撤回了“AI使用纳入绩效”的决定。

账单是导火索。

米哈游《崩坏》系列技术负责人郑银河上个月曾透露,公司内部一名工程师测试多Agent系统时忘设消耗上限,一夜烧掉约200万人民币。科技媒体The Pragmatic Engineer曾报道,Meta内部“Claudeonomics”排行榜上,榜首用户30天消耗了2810亿Token;Uber CTO也曾公开确认,公司给约5000名工程师配了Claude Code,4个月烧光全年AI预算。

另一个更极端的案例来自OpenClaw创始人Peter Steinberger,他在加入OpenAI后曾在社媒晒出过账单,一个月消耗了6030亿Token,花费高达130万美元以上。

当“用AI”变成一场比赛

这场浪潮的起点,是硅谷巨头们集体下场动员公司全员用AI。

2025年6月,亚马逊CEO安迪·贾西(Andy Jassy)在全员信中明确要求员工“尽可能用AI”;同月,微软开发者工具业务高管潘正磊(Panos Panay)在内部邮件中宣布,“使用AI已经不再是可选项,而是每个职位、每个层级的核心能力”;2025年11月,Meta首席人力官贾内尔·盖尔(Janelle Gale)宣布,从2026年起“AI驱动的影响力”将正式进入绩效评价。英伟达CEO黄仁勋今年3月在公开场合表示,假如公司年薪50万美元的工程师一年没有消耗至少25万美元的AI Token,自己会“非常担忧”。

最极致的,是Meta内部那个“Claudeonomics”排行榜——追踪超过8.5万名员工的Token消耗,列出前250名,授予“Token传说”“缓存大师”等称号。短短30天内,榜单记录的Token消耗超过60万亿个。

AI使用,变成了一场内部竞赛。而竞赛很快发生了异化。

今年5月底,据《金融时报》报道,亚马逊关闭了一个名为“KiroRank”的内部排行榜——这个由员工自行制作的榜单,用来追踪使用AI工具时消耗的Token数量。报道指出,一些员工开始使用亚马逊内部AI智能体平台MeshClaw运行非必要任务,以提高自己的AI使用数据,这种行为甚至有了专门的名字:“Tokenmaxxing(Token消耗最大化)”。

在Hacker News的相关讨论中,有人直接支招:把AI挂在后台持续分析源代码,Token自然累积。亚马逊高级副总裁戴夫·特雷德韦尔(Dave Treadwell)最终不得不在内部提醒员工:“请不要为了使用AI而使用AI。使用AI,是为了帮助你解决客户问题、解决业务问题、实现创新。”

风险投资人施鲁蒂·甘地(Shruti Gandhi)在X上写道:“花得多不等于产出多。大多数给员工发AI权限的公司,根本不知道员工拿来干了什么,是否改变了任何结果。”AI云基础设施公司Modal的CTO阿克沙特·布布纳(Akshat Bubna)也表示:“内部Token消耗里大概有50%是完全没用的,但现在很难分辨是哪50%。”

Reddit社区类似讨论也不少,有人吐槽公司把Token用量当绩效指标,有人专门发帖问“怎么刷高Token数”,评论区则反复用古德哈特定律来概括这种荒诞——当Token消耗量成为目标,它就不再是一个好指标。因为人们会开始优化指标本身,而不是指标背后真正想衡量的东西。

与员工想办法消耗相对应的,是企业不断膨胀的Token账单。据The Verge报道,微软5月开始取消部分业务线的Claude Code许可证。微软对内解释称,这是为了将工具链统一到自家的Copilot CLI,但The Verge指出,这同时也是一项财务决定——在6月底微软当前财年结束前集中关闭许可证,以削减部分运营成本。

国内公司的动作同样密集,只是说法不同。

今年4月,字节跳动推出AI产品体验费用报销政策,产品/技术序列报销上限为1000美元/人/年;安克创新宣布全员“无限词元”,累计消耗已达5万亿Token;5月初,360向全体员工发放每人1亿Token;58同城创始人姚劲波称,公司每天消耗接近2000亿Token。

另据《经济观察报》报道,自6月起,腾讯多个业务部门开始调整Token额度,从此前的统一发放转向差异化分配:混元大模型团队月度额度约7000元,优图实验室约5250元,部分娱乐业务外包员工仅有1000元。额度也不再直接发放给个人,而是先进入团队额度池,再由管理者根据实际需求分配。

国内社媒上,围绕公司该不该配Token的讨论同样热度不低。网友“燕双鹰猜叶孤城枪里没子弹”写道:“我们小厂只给250刀Claude加150刀Copilot,而我都用不完。”

网友“大红薯NULL”说:“很多Token都是被浪费掉的。就算是一天到晚工作写大项目,Token消耗太夸张也是有问题的……人家希望一个AI加一个你顶两三个,结果一个AI就顶两三个的工资。”

也有人看到了另一面,网友“joke”评论称,这是一种“逆向淘汰”,不断压缩Token量,不太会用、经常浪费多次迭代才完成任务的人就淘汰,一次就出结果的人留下。

当我们看向硬币的另一面,发现并非所有人都等得到公司发配额。在小红书的评论区,有一类更普遍的处境:公司根本不给配,或者配得远远不够,员工只能自掏腰包订阅AI工具。

更尴尬的是,自费提效之后,有人发现项目排期随之压缩。用自己的钱帮公司省了人力成本,本质上是一种隐性降薪。

配了,然后呢

对于到底应该不应该给员工配Token、具体怎么配,“AI新榜”对话了四位正在亲历这场浪潮的人。

国内某科技企业技术总监告诉我们,他们已经给产研团队配置了AI开发工具,设有通用限额,超额需主管审批。“对于研发来说,大部分业务80%的代码都是由AI生成的,”

他说,“但个人生产力的增长还是固化在既有岗位上,最多提升50%或100%。”目前,他所在公司每月在AI工具上的投入在5万到10万元人民币之间。

我们还问了问ColaOS创始人冯雷。他的做法是给每位员工配400美元/月的额度,同时对旗舰模型单独设限,必要时可申请。

他建议,公司可以先从100到200美元额度开始,等用完了再申请,防止滥用。他对无限配额持明确保留态度:“Token无限之后,反而会让人失去判断力。在今天,人的判断力依然重要。无尽的使用loop来优化其实没有ROI。”

他的判断,和美国AI模型评测机构METR去年发布的一项随机对照实验结果颇为吻合。在这项实验中,16名有经验的开源软件开发者,在允许使用AI的条件下完成真实任务。他们预估AI能让自己提速24%;实验结束后仍认为提速了20%。但实际数据显示,使用AI后,完成任务所需时间增加了19%。感觉在提效,不等于效率真的提高了。

OpenClacky创始人李亚飞的态度也很直接:“肯定要配,但不能做KPI指标。”他的逻辑是,让员工自费购买Token来提高工作效率,本身就说不通;但一旦把Token消耗列为考核指标,刷量就是必然结果。

他们目前的做法是给每人每周设50美元的固定额度,鼓励多用,用完可以申请追加,同时定期组织使用技巧分享、邀请外部专家交流。

某科技企业产品经理也表示,她认为这件事归根结底要算账。“有AI帮助,我可以从一个月做20个需求变成40个。那对我、对公司来讲,投入产出比是划算的,公司就应该报销,”她说,“但如果只从20个变成25个,公司为什么要为此买单?”她所在的公司给开发岗的报销额度更高,但前提是产出能对应上去。

麦肯锡2025年11月发布的《2025年AI现状:智能体、创新与转型》报告显示,AI对整个企业层面利润产生实质影响的,只有39%;称得上“AI高绩效企业”的,只有6%。

工程管理分析平台Jellyfish今年5月的数据则从另一个角度印证了这种分裂:重度AI用户的Token消耗是普通用户的10倍,但生产力提升只有约2倍。

钱花出去了,但大多数公司还没算清楚这笔账。

下一个问题:怎么花

过去几个月,行业一度流行“Tokenmaxxing”——谁用得多,谁看起来就更AI优先。员工刷Token,公司晒消耗,Token成了AI转型的进度条。但随着账单快速膨胀,风向正在转向另一个问题:这些消耗,最后有没有沉淀成真实业务能力?

硅谷软件公司Box的CEO亚伦·列维(Aaron Levie)在X上表示,Token成本在持续下降,但企业总支出仍在攀升,因为用量增速盖过了降价幅度。他认为,真正的竞争优势在于知道什么任务该交给哪个模型,能做好这件事的公司,才是下一波的赢家。

另据《商业内幕》报道,Coinbase、Hugging Face等公司的从业者也有类似判断:未来企业真正需要的,不是无差别地调用最强模型,而是更精细地匹配任务与工具,避免“杀鸡用牛刀”。道理不难懂,难的是执行。

这可能也是第一轮AI普及之后,企业必须补上的课。单纯烧Token,只会留下账单;真正值得花钱的部分,是那些能被复用的工作流、私有知识库、评估体系、提示词资产、模型路由经验,以及团队对Agent边界的判断力。

微软CEO纳德拉最近也提到,企业未来需要同时拥有“人力资本”和“Token资本”。换句话说,换了模型还在的组织经验、数据资产和工作流,才是企业在AI时代真正的资产。

也许Token消耗战的下一阶段,不再是谁敢烧,更重要的是谁能把烧掉的Token,变成可复用的工作流、可沉淀的知识库,以及对AI边界的判断力。

配Token只是起点。真正难的是,让每一次调用,都更接近真实产出。

注:文/懒人,文章来源:AI新榜,本文为作者独立观点,不代表亿邦动力立场。

文章来源:AI新榜

广告
微信
朋友圈

这么好看,分享一下?

朋友圈 分享

APP内打开

+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0