【亿邦原创】DeepSeek一石激起千重浪,中美大厂争相卷起推理模型,应用侧重新洗牌,元宝崛起,豆包Kimi尴尬,大模型混战刚刚开始。
深度思考模型成了大厂标配。xAI推出最“全球最聪明”推理模型Grok3,腾讯元宝上线HunyuanT1大模型,Anthropic带来Claude 3.7 Sonnet混合推理模型,阿里云低调上线名为QwQ-Max-Preview的推理模型预览版,并开源万相视频生成大模型;字节的深度思考模型还在酝酿中。
在应用侧,2月22日开始,腾讯元宝超越字节豆包,跃居中国区苹果应用商店免费APP下载排行榜第二位,并一直维持至今。豆包则在小范围测试深度思考模型的不同实验版本,但接入的不是DeepSeek模型。MiniMax成立了一个“MiniMax智能硬件产业创新联盟”,广泛合纵连横。
除了产品升级,近期大厂也在频繁调整AI思路。2月20日,腾讯将QQ浏览器、搜狗输入法、ima等产品和应用也从PCG(平台与内容事业群)转入CSIG,组成全新AI产品组合。字节Seed团队拉来谷歌大牛吴文辉,担任大模型团队Seed基础研究负责人,直接向CEO梁汝波汇报。阿里更是官宣将在未来三年投入超3800亿元,用于建设云和AI硬件基础设施。
风暴的中心,DeepSeek正在加速推出R1推理模型的后续模型。有外媒消息称,DeepSeek原计划在5月份发布R2,但现在希望尽早发布,进度可能会提前。
1、阿里官宣!未来三年将投入3800亿元建设云和AI硬件基础设施
阿里巴巴集团CEO吴泳铭在2月24日宣布,未来三年,阿里将投入超过3800亿元,用于建设云和AI硬件基础设施,总额超过去十年总和。吴泳铭表示:“AI爆发远超预期,国内科技产业方兴未艾,潜力巨大。阿里巴巴将不遗余力加速云和AI硬件基础设施建设,助推全行业生态发展。”
据悉,2025年,全球云计算市场出现历史性转折:阿里云市场份额升至22%,首次超越谷歌云,跻身全球前三(AWS 32%、Azure 25%)。阿里巴巴通义千问大模型已成为全球知名的开源模型,在全球最大AI开源社区Huggingface发布了最新的开源大模型榜单(Open LLM Leaderboard),榜单显示,其排名前十的开源大模型全部是基于阿里通义千问(Qwen)开源模型二次训练的衍生模型。
2、腾讯元宝成为大陆地区苹果端免费榜第二名
2月22日下午,腾讯元宝成为苹果应用商店免费app排行榜第二的应用,第一是DeepSeek,第三是字节的豆包。腾讯元宝能够在这个节点突出重围,一方面与后缀上的“DeepSeek R1”有关,一方面也与加大投放力度有关。
ADX数据显示,2月15日,元宝投放力度小幅上涨;2月18日,大幅上涨,至今单日最高投放素材量超1.1万组。而Kimi投放素材量逐步滑落,豆包也大幅下滑,保持着与1月下旬相似的投放力度。
3、DeepSeek进入开源周,将连续开源五个软件库
2月25日,DeepSeek开源了第一个代码库 ——FlashMLA。这是一款用于Hopper GPU的高效型MLA解码核,仅用了24小时就达到了接近8k的 star量(详情请参见《刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中》)。
2月26日,DeepSeek开源了首个用于MoE模型训练和推理的EP通信库DeepEP。在分布式系统中(如多GPU训练环境),所有处理单元之间需要高效地传递数据。在MoE中,这点尤为重要,因为不同「专家」需要频繁交换信息。并且MoE模型容易在「专家并行」中出现负载不均衡,导致每个「专家」分到的算力不均,不重要的「专家」难以发挥应有的性能。
4、字节Seed大调整:原谷歌DeepMind副总裁吴永辉加入 加码模型层
近日,原谷歌DeepMind副总裁吴永辉博士加入字节,担任大模型团队Seed基础研究负责人,直接向CEO梁汝波汇报。吴永辉主要负责大模型团队Seed基础研究,即大模型基础架构和算法设计,类似首席科学家角色。
Seed团队主要负责AI模型开发,负责人为朱文佳,Seed团队与Stone(技术支持)、Flow(专注AI应用开发)同属Flow部门,Flow则是与抖音、火山、飞书等平级的主要业务部门,由朱俊领导(同时也是豆包的总负责人)。
5、Qwen推理模型“QwQ-Max预览版”亮相 即将推独立Qwen App
近日,阿里通义推理模型低调上线。Qwen团队称,在Qwen Chat中发布的“Thinking(QwQ)”模式,由QwQ-Max-Preview推理模型支持,后者基于更强大的基座模型Qwen2.5-Max而来,在数学理解、编码、agent等方面具有很强的能力。QwQ-Max正式版本近期也将上线,同时发布的还有Qwen Android和 iOS APP。”
6、阿里开源版Sora上线,4070就能跑,免费商用
2月26日,阿里云旗下视觉生成基座模型万相2.1(Wan)开源,此次开源采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在Github、HuggingFace和魔搭社区下载体验。
万相2.1拥有14B和 1.3B两个参数规格。14B版本主打高性能,1.3B小版本适合消费级显卡,仅需8.2GB显存就可以生成480P高质量视频,特别适用于二次模型开发和学术研究。在平台里,1.3B和14B版本分别叫做极速版和专业版,每次消耗5个或3个“灵感值”(新用户默认有50个,还可通过签到等多种方式免费获得)。
7、PixVerse V4正式发布:一键生成匹配的画面、音效和人声
近日,国内AI视频创新企业爱诗科技正式推出PixVerse V4版。据了解,PixVerse V4实现了AI视频创作时一键生成与画面内容匹配的音效和人声,并在人物表情细节、环境物理规则等方面进行了升级,实现了更高效、逼真的AI视频生成效果。
此外,本次PixVerse V4新增了视频风格重绘功能,可将原始视频一键转制成多种炫目的视频风格,进一步提升了视频创作的玩法和专业视频创作的适用可能性。
8、抖音试水AI分身
近日,字节旗下AI智能体开发平台扣子(Coze)与抖音打通,与早期豆包App的简单问答功能不同,Coze允许创作者构建具备复杂逻辑的AI分身。AI分身是基于创作者在抖音的已有内容,通过大模型生成的AI智能体,它能够复刻创作者的对话风格和知识库,面向群聊、私信、评论 、直播、搜索等场景与用户进行24小时的随时互动。
9、腾讯元宝更新,对话内容可一键长图分享
腾讯元宝再次上新,用户可以通过长图一键分享与元宝的对话记录。在最新版本中,腾讯元宝提供了三种展示形式:完整对话长图、对话节选图和微信分享卡片。在腾讯元宝,用户可以使用DeepSeek-R1满血版、推理模型混元T1进行深度思考,也可通过DeepSeek-V3、腾讯混元Turbo快速输出答案。目前,元宝内的所有模型都支持理解图片、解析文件、联网搜公众号、从微信上传文件。
10、Anthropic发布首个混合推理模型Claude 3.7 Sonnet
当地时间2月25日,Anthropic正式发布了Claude 3.7 Sonnet,“这是迄今为止我们最智能的模型,也是市场上首个混合推理模型。”Anthropic官方表示。简单来说,Claude 3.7 Sonnet既能提供近乎即时的响应(标准模式,standard),也可以向用户直观展示其长时间的逐步思考过程(扩展思考模式,extended thinking)。API用户还可以对模型的思考时长进行细粒度控制。简而言之,该模型最大的特点就是用户能控制模型在做出反应前“思考”的时间,这是一项前所未有的技术创新。
Claude 3.7 Sonnet现已全面登陆所有Claude订阅服务,,无论是标准模式还是扩展思考模式,Claude 3.7 Sonnet都保持了与之前版本相同的定价标准:3美元 / 每百万输入token,15美元 / 每百万输出token——该费用已包含思考token的消耗成本。
文章来源:亿邦动力