广告
加载中

在WAIC上 国产算力不再“斗参数”

丸都山 2025/07/28 11:18
丸都山 2025/07/28 11:18

邦小白快读

重点信息与实操干货

1.国产算力转向务实应用:各厂商重点展示产业解决方案而非参数竞赛,涉及碎片化算力统筹、低功耗技术、垂类整合等领域。

2.核心国产技术突破:沐曦展示全链路国产化服务器(C500系列+C600芯片),中昊芯英TPU能耗降30%并支持1024片集群,华为“384超节点”适配80+大模型。

3.场景应用实例:摩尔线程MTVSR视频超分技术可实现端侧2-4倍实时优化,华为昇腾已覆盖互联网、金融、医疗等8大行业。

技术品牌突围与市场趋势

1.国产技术品牌塑造:沐曦通过自研架构+国产化工具链组合(XCORE架构/编译器/驱动程序),构建全链路技术品牌护城河。

2.差异化技术路径:中昊芯英TPU与主流通用GPU形成错位竞争,其存算一体+Chiplet封装实现能耗降低的市场教育价值。

3.生态构建模式:华为基于昇腾联合伙伴构建跨行业解决方案库,摩尔线程以12项细分场景Demo推动生态协同。

商业机会与合作空间

1.国产替代机遇:沐曦C600搭载HBM3e显存提升大模型训练效率,中昊芯英TPU集群可承载千亿参数模型,符合算力国产化采购趋势。

2.场景化服务需求:华为昇腾覆盖行业解决方案、摩尔线程视频超分SDK等技术接口,为代理销售提供增值服务空间。

3.资本运作信号:沐曦提交上市辅导备案,显示国产算力领域即将迎来资本红利期。

生产优化与技术融合

1.芯片封装革新:中昊芯英采用2.5D封装+Chiplet技术,为代工厂提供异构集成生产新范式。

2.能效比提升方案:TPU芯片通过可重构存储设计降低30%能耗,助力工厂绿色生产改造。

3.端侧技术应用:摩尔线程MTVSR视频超分技术可集成至监控设备制造,提升硬件产品附加值。

行业痛点解决方案

1.算力碎片化统筹:华为昇腾超节点技术实现384卡高速互联,破解分布式算力调度难题。

2.端侧计算优化:摩尔线程实时视频超分技术提供SDK接口,解决终端视频处理带宽压力。

3.能耗控制方案:中昊芯英TPU存算一体设计,为数据中心客户提供PUE优化新选择。

生态构建与风险规避

1.平台技术标准:华为昇腾建立软硬件开源生态,制定大模型适配标准(已支持80+模型),强化平台掌控力。

2.多层次生态策略:通过华为全行业解决方案+摩尔线程细分场景Demo的组合,形成高低搭配的平台吸引力。

3.供应链安全:全链路国产化方案(沐曦C500系列服务器)为平台规避海外技术断供风险。

技术路径与产业启示

1.技术路线分化:GPU(沐曦/摩尔线程)与TPU(中昊芯英)并行发展,反映国产算力多元化创新策略。

2.产学研结合案例:华为昇腾适配涵盖LLaMA等开源模型,显示国产硬件与国际开源生态的融合尝试。

3.封装工艺突破:2.5D封装+Chiplet技术在TPU芯片的应用,为先进制程受限下的技术突围提供样本。

{{loading ? '正在重新生成' : '重新生成'}}

返回默认

我是 品牌商 卖家 工厂 服务商 平台商 研究者 帮我再读一遍。

7月26日,世界人工智能大会(WAIC)在上海正式拉开帷幕。

在展会现场,具身智能无疑是最备受瞩目的行业。从灵活完成格斗动作的人形机器人,到能精准执行家务、康复辅助的服务型机器人,这些具备物理交互能力的智能体凭借流畅的动作、自然的交互赚足了观众眼球。

然而,在这场科技盛宴中,当人们沉浸在具身智能带来的震撼体验时,人工智能产业的核心底座——以芯片、板卡、服务器、计算集群等为核心构成的算力基础设施,依然是整个行业绕不开的关键话题。



与往届大会相比,今年算力基础设施展区呈现出截然不同的风貌。

往年展台上随处可见的“参数竞赛”已悄然淡去,各厂商送展的芯片和服务器展品中,很少再有将某项极致性能参数用醒目字体刻意标记出来的情况。

曾经被重点标注的技术指标,如今更多地融入到具体的产业解决方案中,或是隐藏在真实的应用场景演示里。

现场的讨论也多是基于“碎片化算力资源统筹”、“低功耗与低成本”与“垂类产品软硬件整合”这些非常务实的话题。

全链路国产化进行时

在算力基础设施的务实转型浪潮中,“全链路国产化”的推进节奏尤为引人关注。

过去几年,全球供应链波动引发的芯片断供风险,以及核心技术“卡脖子”的现实挑战,反复挑动着国内人工智能产业的神经。在全行业已默契达成“居安思危”共识的背景下,即便部分产品应用尚未受到外部限制,国内算力基础设施厂商也主动将国产化的边界从单一芯片突破,拓展至从架构设计、软硬件生态到产业落地的全链路自主可控。

这种主动出击的国产化实践,在本届 WAIC 的展台间随处可见。

从芯片底层架构的自主研发,到操作系统、编译器等软件工具链的国产化适配,再到与本土服务器厂商、行业应用企业的深度协同,一条贯穿“芯片—软件—整机—场景” 的国产化链条正在加速成型。

刚刚提交上市辅导备案的沐曦,算是其中较为典型的代表。

本届展会上,沐曦首次公开展示了其最新研发的训推一体GPU曦云C600。据悉,其采用自研的XCORE 1.5架构及指令集,面向云端人工智能训练与推理、通用计算、AI for Science等计算任务,且拥有丰富的标量、矢量和张量计算单元,支持多种混合精度计算。



虽然现场并没有关于曦云C600的性能参数介绍,但据展台工作人员透露,这枚芯片搭载了当前业界前沿的HBM3e显存。这一关键配置势必会大幅提高显存带宽,为大模型训练及推理时的海量数据吞吐提供强力支撑。

鉴于曦云C600在本月刚刚回片,展会上并未出现基于这枚芯片打造的板卡及服务器。

而基于上代产品曦云C500系列芯片,沐曦在现场展示了PCIe服务器、OAM服务器和光互连服务器解决方案,这些服务器基本都实现了“全链路国产化”,即从编译器、驱动程序,再到卡间互联协议完全自研,或是第三方国内合作伙伴打造。

还有厂商则展示了不同于GPU的另一条高性能计算路线,比如国内唯一实现TPU量产的中昊芯英。

该公司打造的“刹那”系列TPU,采用完全可控的IP核与自研指令集、计算平台,其可重构多级存储、存算一体的设计,配合Chiplet技术实现2.5D封装,在相同AI计算任务下能耗可降低三成。


另外,该枚芯片还有较强的集群扩展能力,最高支持1024片芯片高速互联,基于“刹那”打造的“泰则”计算集群系统,单集群最大浮点运算能力在稀疏算力下达400P(TF32)以上,可支撑超千亿参数的AI大模型计算。

据现场工作人员介绍,目前“泰则”计算集群系统,已完成对AIGC大模型计算、高级无人驾驶模型训练、蛋白质结构精密预测在内的各类高强度运算场景的适配。

下沉到场景中

在两个月前的鲲鹏昇腾开发者大会上,作为华为今年来在算力基础设施上的集大成者,“384超节点”被首次公开,基于昇腾超节点技术,实现了业界规模最大的384卡高速总线互联。


本次展会上,“384超节点”真机完成了在公众面前的首次亮相,而该系统在大模型适配上的进度也令人瞩目。据悉,目前业界已基于昇腾适配和开发超过80个大模型,在基础大模型方面多个技术方向均有积累,如讯飞星火认知、DeepSeek、Qwen、鹏城、LLaMA等。


在场景适配上,基于昇腾软硬件能力、训练与推理解决方案及开源开放的软硬件生态,华为联合伙伴展示互联网、运营商、金融、政务、医疗、油气、交通等行业解决方案实践。

另一家国产GPU企业摩尔线程,在现场展示的场景适配上则要更加细致。

在摩尔线程展位,该公司共带来了包括生命科学、物理仿真、空间智能、视频超分在内的12项面对不同行业打造的Demo。

令笔者印象较为深刻的是视频超分技术MTVSR。该技术可在端侧提供2-4倍的视频实时超分,并提供多档质量设定,能够显著提升低分辨率视频在高分辨率屏幕下的播放清晰度,且以SDK形式支持播放器、浏览器等APP集成调用,可为终端用户提供无缝的视频超分体验。


不同于一般的行业垂直解决方案,视频场景中的端则软件技术,由于其广泛的应用性,一方面能够有效调动行业应用,比如降低内容创作者获取高质量素材的成本,提高内容生产效率;另一方面还能够有效刺激产业生态构建,主动吸引视频播放软件、游戏开发商、监控设备制造商等多方协同。

华为以超节点技术夯实大模型训练的算力底座,通过广泛的行业适配构建生态护城河;摩尔线程则聚焦细分场景,用轻量化技术方案打通算力应用的“最后一公里”。两者虽聚焦不同层面,但却很好地反映出了眼下国产算力基础设施所呈现出“高低搭配、全域覆盖”的发展态势。

注:文/丸都山,文章来源:虎嗅APP(公众号ID:huxiu_com),本文为作者独立观点,不代表亿邦动力立场。

文章来源:虎嗅APP

广告
微信
朋友圈

这么好看,分享一下?

朋友圈 分享

APP内打开

+1
+1
微信好友 朋友圈 新浪微博 QQ空间
关闭
收藏成功
发送
/140 0