【亿邦原创】近日,蚂蚁集团正式发布并开源通用语言大模型Ling-1T,这是一个拥有万亿参数并基于MoE架构的非思考型通用语言模型,随后在Hugging Face、ModelScope等平台开源。
Ling-1T用了常见的"大参数储备,小参数激活"的范式,总参数量高达1万亿,但在处理每个具体任务时,仅会激活其中约500亿参数,使模型在保持强大性能的同时,极大地降低了计算开销和推理延迟。
架构还有一个细节:模型的前几层采用了密集结构(Dense),后续层才切换为MoE。这一设计主要是为了缓解浅层网络中专家负载不均衡的问题,从而提升整体架构效率。
在多项高难度基准测试中,Ling-1T都展现了顶尖的性能。例如,在竞赛数学榜单AIME 25上,它以更少的Token消耗(约4000+)实现了70.42%的准确率,优于Gemini-2.5-Pro(平均5000+Token,准确率70.10%),展现出在推理精度和思考效率上的卓越平衡。
Ling-1T并非孤立模型,而是蚂蚁百灵大模型家族中的重要一员。
目前,蚂蚁集团形成了三条并行的技术探索路线:
Ling-Series:基于MoE架构的“非思考模型”,追求响应速度与效率,以Ling-1T为代表。
Ring-Series:“思考模型”,专注于深度和复杂的推理 。预览版Ring-1T-preview已于此前开源。
Ming-Series:全模态模型,旨在打通文本、图像、语音等多种信息处理。
进入2025年,百灵大模型迭代明显提速。
在此前一个月,蚂蚁百灵大模型还连续发布语音AI框架Ming-UniAudio,视觉AI框架Ming-UniVision,开源了Ring-1T-preview(1T预览版,Ring-1T仍在持续训练中),Ring-flash-linear-2.0(思考模型,100B),Ling-flash-2.0(语言模型,100B),Ling-mini-2.0(语言模型,16B),Ring-mini-2.0(思考模型,16B)。
蚂蚁集团拥有金融、生活服务等丰富的业务场景,这为Ling-1T等大模型提供了天然的落地试验场和高要求的业务反馈闭环。
目前,蚂蚁在C端已推出AI健康管家、AI理财管家等"AI管家"系列;在B端则通过"数字蚂力"和"百宝箱"平台,为企业提供AI人机融合服务和智能体开发工具。
文章来源:亿邦动力