
文丨贾昆 编辑丨史婉嘉
【亿邦原创】是时候大胆地下结论了:
Agent就是下一代的平台。
在OpenClaw展示了它非凡的翻江倒海能力之后,如果你还否认这个观点,多多少少会暴露一点古典互联网卫道士般的“登味”。
让我对这个论调坚信不疑的是,就在不久前,我看到了一条令人毛骨悚然的新闻:淘宝在自己的PC客户端,开放了MCP,支持商品搜索、下单、订单产讯、催发货。

展开说,这个MCP启用后,淘宝桌面客户端会自动暴露端口,与安装电脑上的AI Agent进行配对。Agent可以通过模拟点击的方式输入关键词、筛选可交互元素,并在商品搜索结果页、商品明细页和店铺页面抓取信息。

PC淘宝(源自:淘宝官方)
如果这条消息是真的,这就意味着,会有越来越多的平台型公司开始开放MCP,甚至准备迎接以CLI的方式融入OpenClaw(当然也可能是更多的其他版本的Agent中)。
由此,关于下一代流量入口的争夺战也将变得更加焦灼。
悲观一点想:以后也许没有App了,有的可能只是一个Skill、一个CLI,随时准备被Agent调用,而非真实用户。
就像我在《一人公司,正“偷家”大厂丨年度观察》一文中所说的
未来的平台,或者生长出成千上万个Agent,或者在原生Agent上生长出新的平台。
如今种种迹象表明,后者可能更为接近下一个AI时代会出现的状况。
相应的,今天所有的企业都要面临一个决策:你要不要,以及如何接入Agent平台?
01 成为CLI,做牛做马也得活下去
Obsidian是一个类似Notion这样的本地化笔记软件。在此之前,很多人都习惯使用Notion来搭建自己的知识库。但是Obsidian接下来的一个动作,改变了市场格局。

就在不久前,Obsidian宣布推出官方CLI命令行工具。

这些命令行,是对Obsidian这款软件的降维。其目的很简单,就是可以让OpenClaw或者Cloude code这样的Agent工具去随时调用。
今后用户在操作自己的知识库时,不再是打开电脑、点击Obsidian App、搜索查询、翻阅静态笔记。而是对着龙虾,让它来直接接管所有的知识库运行动作。
你可以说CLI才是Agent可以理解的母语。
而Obsidian CLI发布,就意味着,互联网行业要围绕AI Agent时代完成一次格式化的蜕变。
如果你还不知道我在说什么?我再举个例子。
OpenClaw刚火不久,3月15号,香港大学就上线了一个开源项目——CIL-Anything。用户只用敲出一行命令,就可以把任何软件和API快速转化成AI Agent可以直接调用的结构化CLI。
这个开源项目在Github上线仅仅一天,星标就狂飙到2000+,直接登顶开源热榜(目前已经有2万星标)。

还有个更加狂野到没谱的项目——OpenCLI。五天前上线。它追求的是更加激进的赶尽杀绝。不只是网络软件,只要你想,它都把一切都压扁成CLI。
什么淘宝天猫、拼多多、京东、美团……哪怕微信、小红书、B站、YouTube、Twitter,统统概莫能外,化作命令行。
OpenCLI和CIL-Anything的上线,彻底让AI与互联网App之间互联互通——用户也许早就受够了那些臃肿的超级App,更何况是AI。
其实Agent的本质就像是公司里的中层,负责调度、派遣和汇报。Agent本身并不执行任何事情,却可以协调各式各样专职人员来负责产出。
传统App因为过去可以直面用户,所以可以通过直接为用户提供服务,并从用户端赚取利润。
如今,Agent上位了,他成为了用户身边最好的代理。传统软件就只能听他的差遣。
他想利用你就利用你,想架空你就架空你,想鸠占鹊巢就肆无忌惮的占,想搞点阳奉阴违的小动作就搞点小动作。
最重要的,是他还可以直接从用户端获得收益。传统App只能听他的调遣和分配。彻彻底底沦为基层牛马。
如果被扁平化是软件的宿命,那么一个新的时代才刚刚拉开历史帷幕。
因为当数以亿计的Agent喷涌而出的时候,你必须要重新考虑如何为他们设计交互界面。
这也是为什么很多人在探讨GUI将会逐渐失去魅力,取而代之的是CLI。
更恐怖的是,当A2A(Agent to Agent)的时代到来,流转在Agent之间的交互语言,就像车同轨书同文一样,再次被定义。届时,所有的GUI都将坍塌。
其实这样的预警在几个月前就已经发生。
去年12月初,豆包手机横空出世。大部分人的注意力仅仅停留在它能语音直接操作你的手机软件,以及很快因为触犯其他大厂的利益,被围追堵截。
但鲜有人知,豆包手机最大的变革,是这部手机取消了很多现代智能手机的交互界面。它的设计足够简洁,简洁到仅仅一个豆包App似乎就能囊括一切。
换言之,豆包手机就是给Agent设计的界面。如果不能被Agent调取,就不能为用户所用。
设想,如果豆包手机成为市场占有率最大的手机,如果豆包成为市场占有率最大的AI软件,那么还会有软件厂商会选择拒绝被豆包调用吗?当Agent接近于操作系统,甚至是由Agent来决定如何调取操作系统上的应用权,你还会拒绝它吗?
尽管CLI会失去那些你苦心孤诣经营的私域用户,但这也许就是通往未来世界的一片二向箔。
如果简单得像一串命令行,是活下去的通行证,那何须自怜自爱那些失去意义的复杂UI。
如果体量庞大如淘宝(日活过5亿,GMV过6万亿)这样的应用,都愿意将自己接入Agent,那其他公司还挣扎什么?
02 不生孩子了,可以生Agent
当然,这一切都触发了大厂的警觉。
谁不想成为这样的豆包?谁不想号令天下莫敢不从?
钉钉为什么要全量CLI化?
大厂需要C端,今后更需要A端(AI Agent)。
众所周知,C端在国内已经没有人口红利了。从互联网人口规模到使用时长,都濒临天花板。
而A端则可能迎来更大的爆发。一方面这是前所未有的人口增量,另一方面,这些人口的生产机制决定了他们的规模数量没有上限。
如果全球有70亿人,以每个人拥有1-2个Agent为例,那么全球总Agent的量级至少是70亿-150亿的规模。
这还不算即将涌现的“一人公司”豢养的Agent Team。
Agent保有量,也会成为未来统计学里新的名词和关键要素。
所以,企业准备好给Agent输送它想要的一切了吗?
先别着急。把自己降维成CLI只是个技术问题。但如何理解未来的Agent世界,才是胜负手。
大厂的焦虑与迅疾的行动,只是证明了他们要在新的维度下能够延续产品的生命周期和组织的活力。但争夺用户规模,未必是Agent时代的游戏规则。
各个大厂纷纷推出的Claw,用户的Agent显然被分布在不同的平台。但我认为,决胜机制不在于谁的安装量大,而是在于谁能让用户投入的心力和感情度高。
是的,迁移成本才是这轮Agent之战的分水岭。
我在B站视频播客《33天养虾日记,OpenClaw现在成了我的董事长》中解释过,安装了Claw对用户而言只是万里长征的第一步。
后续关于用户与Agent之间的关系的确立,尤其是soul、memory的建造,skill工具库的完善,才是一个Agent真正可以发挥效力的时刻。

识别上方二维码观看完整视频播客 ↑
而这个Agent人设打造的过程,是用户从标准化龙虾,培育成个性化差异化龙虾的演进。这只龙虾的独一无二性,决定了用户如果想在其他平台再养一只龙虾,就必须考虑如何能够完整的平移。
目前OpenClaw复杂的安装以及时常崩溃假死的BUG,令很多新手直接放弃。或者一旦龙虾养死了,就只能另起炉灶。未来,能让用户安心停留的,不再是社交关系链,不再是花边新闻,不再是狗血短剧,而是Agent的稳定性。
因此,Agent平台的护城河,不再是用户广度,而是用户与Agent的交互深度。
那些独一无二的人格.md、记忆.md,将超越基础大语言模型的智力牵引,成为真正意义上的竞争壁垒。
而A2A会让事情变得更加有趣。这种对数函数所带来的幂次增长,让新型的社交关系链变得更加错综复杂。
人们与Agent之间的嵌套与缠绕,更是让这条剪不清理还乱的护城河变得更加深邃。
所以,能养孩子还能让孩子社交的平台,对用户而言,比只能生不能养的平台会更具吸引力。
03 淘宝还是千问?
还是要回到这个经典问题。
未来的入口是淘宝,还是千问?
我并非说其他移动互联网公司或者AI软件就没有机会。只是借用同属一个集团的兄弟产品来比喻,更便于大家理解。
换个问题,终局到底是淘宝+AI,还是千问+电商?
谁统领谁?这是个关键破局点。
大厂喜欢赛马。而中小厂只能单押。
假如你相信,Agent就是下一代平台,那么答案显而易见。
AI Agent将牵引一切。
这也解答了为什么阿里要成立Token事业部。通电了,总得让Agent烧得起电费。
电费目前还得人来交。
人从哪来?淘宝天猫。
电商平台造血机制依然稳定。如果人还不够怎么办?多叫点1元咖啡的外卖。
电商输血,AI Agent牵引一切。
这是你必须重新理解的AI时代叙事。
所以你也知道,蒋凡固然天才,可以赚大消费板块的钱。但由吴泳铭领衔的ATH事业部,要去赚toA(AI Agent消耗Token)的钱。
十年前,张勇做好了天猫就可以升任集团CEO,但AI时代可不是这么简单。
即便如微信这样固若金汤的社交超巨,以及以克制著称的张小龙,最后也要给OpenClaw留有一席之地。

淘宝可以将自己降维成CLI,可以把赚来的钱输送给新的母体。
这个新的母体未来的造血机制会更强。
但多数小厂呢?没有新的母体。
你现在必须做出抉择。
在Agent就是下一代平台的十字路口,让AI来统领一切,逼迫自己转舵?还是延续固有的状态,让自己消失在下一代平台到来之前。
阅读补充:
「1」CLI:
Command Line Interface的缩写,中文译为命令行界面或命令行接口,是一种基于文本的用户交互方式。
CLI天然具备几个Agent友好的特性:
• 输入输出都是纯文本,完美匹配LLM的原生能力
• 参数化调用,语义清晰,不会产生歧义
• 可组合,一个命令的输出是另一个的输入
• 可审计,每一步操作都有日志
「2」MCP:
Model Context Protocol,模型上下文协议,是由Anthropic推出的开源协议,旨在实现大语言模型与外部数据源和工具的集成,用来在大模型和数据源之间建立安全双向的连接。简言之,是AI从思考聊天工具变为可执行的Agent的关键连接。
淘宝桌面客户端3月11日更新到了最新的2.5版本,首次引入对MCP协议的AI工具支持,允许用户在本地启用AI智能体来自动化执行购物操作。
根据官方发布的v2.5.0版本说明,用户在主动授权的情况下,可以配置OpenClaw等AI智能体代替人工完成搜索、浏览对比、加入购物车等一系列操作,不过实际付款环节仍需用户本人确认。
启用后,淘宝桌面客户端会自动暴露本机的指定端口,与安装在同台设备上的AI智能体进行配对。AI可以通过模拟点击的方式输入关键词、筛选可交互元素,并在商品搜索结果页、商品明细页和店铺页面抓取信息。
「3」Skills
一种标准扩展规范,是可以让Agent变得可靠、可控、可复用的技能包。“Skills”这个概念最早由Anthropic公司提出,作为其大模型Claude的一种能力扩展机制。
