近日,位于济南高新区的浪潮信息产业园中,一座全新模式的算力工厂悄然亮相——
在一块占地4082平方米的平面上,419个机柜被有序放置在了119个预制化集装箱中,像“搭积木”一样,快速拼接成了一座总功耗达到10MW规模,PUE低至1.1以下的算力工厂。
且不同于传统数据中心动辄两三年的建设周期,通过浪潮信息专为AI时代打造的预制化AIDC解决方案,这座算力工厂仅用120天,就完成了从建设到正式投运的全部过程,工期直接缩短近80%。
这背后,到底潜藏着哪些秘密?大模型时代,预制化又是否会成为智算中心建设主流?
01
一座仅用120天建成的10MW算力工厂
浪潮信息最新亮相的元脑“算力工厂”,坐落于山东济南高新区的浪潮信息产业园内,远远望去,只是一座普普通通的平房建筑。
不同于此前一些更小型的或者分布式的集装箱数据中心,还能从外观上明显看出集装箱的特点,这座算力中心,如果不是现场工作人员特意提及,已经很难感受出是由一个个集装箱堆叠而成。
这些集装箱的单层层高达到4.15米,在底部的高架地板、顶部的走线和管道外,仍有2米左右的剩余高度,走在其中,体感上与传统数据中心并无差别,功能区域的设置上,监控室、机房、配电间、制冷区域等也一应俱全。
在使用时间上,浪潮信息服务器产品线副总经理李金波透露,该算力工厂也对标了传统数据中心楼宇建设的优势——满足九级抗风要求,使用年限可以达到50年。
“有不少客户问我们,为什么选用集装箱?盖楼我可以使用好多年,集装箱可能只用个10年、20年,这一代的基础设施就需要更新换代了。”李金波告诉数智前线,这一问题已经在元脑“算力工厂”的建设中得到解决。
“现在,我们可以以一代的集装箱cover四到五代甚至更多代的数据中心基础设施,每一代的数据中心基础设施又可以再cover两代左右的服务器。”李金波说,在这个过程中,基于元脑“算力工厂”已获得的五十年产权,整个集装箱的地基和箱体是始终不变的,只需到期更换基础设施和服务器,就能继续使用。
对标传统数据中心楼宇建设优势的同时,这座算力工厂更大的改变还在于——仅用120天,就完成了一座涵盖数据处理、AI大模型、业务应用、研发测试等多个集群的10WM规模智算中心的建设,实现了智算算力、通用算力、边缘算力全场景覆盖,并将PUE控制在了1.1以下,可实现全年节省电费近2亿元,大幅降低运营成本。
而这很大程度得益于其采用的预制化AIDC解决方案。据悉,该方案可以实现数据中心模块的高度预制化,所有机电设备在工厂预集成、预测试,接入市电、网络和水源即可独立运行,预制装配率高达90%。在这种情况下,现场土建可以与集成工作同步进行,集装箱发运至现场后,即可快速完成吊装、铺设、拼接、互联、调试、拼缝填充、防水等后续工作。
“我们的算力工厂,120天完成全部建设,较同等规模数据中心18个月的建设周期缩短近80%。”李金波说。目前,该智算中心已迅速支撑起对内对外的各项业务应用。
比如在确保服务器的质量和稳定性上,作为国内首个预制化模式的服务器测试中心,元脑算力工厂已拥有包含风冷服务器、冷板式液冷服务器、浸没式液冷服务器等在内的业界最全的服务器测试产品线,每年可满足150万台的服务器测试需求。
它也支撑了大模型训练和应用,以及包括编程助手、供应链大脑、智能客服、智能工厂等在内的一系列智能化转型服务的开发建设。
而在对外服务层面,随着AI应用在千行百业的普及,该算力工厂正在支持教科研、生命科学、气象、能源、金融、自动驾驶、互联网等众多行业的PoC测试需求,配置100+台设备,可同时承担超30个大规模项目的PoC并发测试需求,目前已为350+海内外客户提供测试支持。
02
智算时代,预制化AIDC将成主流?
数据中心的预制化其实并不是一件新鲜事。
开放计算标准工作委员会(OCTC)在2024年6月发布的一份《算力工厂建设指南白皮书》中就曾提及,预制化数据中心融合了装配式建筑和智能模块化数据中心技术,已有多年发展历史,早期预制化数据中心采用All In One(单个集装箱体内一体化集成数据中心各子系统)形式设计,以满足小规模数据中心快速部署及应急建设要求。
据相关市场分析报告显示,预制模块化数据中心是指根据项目需求,于工厂内部完成数据中心所需基础设施单元的有机组合,到项目现场重新拼装即可投入使用的数据中心。而集装箱数据中心,是其中的典型代表,它将数据中心基础设施部署在一个或多个20或40英尺的集装箱内,搬运方便、部署快速,可移动、可扩容、可更换,安装场地几乎不受自然环境的限制。
当然,早期的预制化,还只是传统土建数据中心的一种“补充”,或满足一些特殊场景的需要。
而最近几年,随着智算的快速发展,预制化开始被愈加频繁地提及。
业界观察,国内一些大型互联网企业、金融机构等都已有不少应用预制化模块建设数据中心的案例,如腾讯推出的T-block模式,就是以标准化、产品化形式实现像乐高搭积木一样快速建设交付数据中心。
在一些新建项目中,也有预制化集装箱模式的身影。比如去年10月在新疆哈密投运的哈密国投算力场1000P项目,机柜就被全部放在了集装箱中,并可拆分移动到风电场站、光伏电站,形成分布式算力工厂布局;12月,哈尔滨也有一个总投资1.5亿元的集装箱分布式算力中心建设项目审批通过,计划投入14台套算力集装箱……
浪潮信息人工智能与高性能产品线副总经理张强也告诉数智前线,最近几年,他们已在高校、科研院所场景,以及海外场景中,积累了不少预制化的集装箱数据中心项目。
“高校的特点是偶发性算力需求多,且需求较为分散,可能一个学院、一个信息中心就有一些需求,但同时空间少,很难一有需求就从头盖一栋楼来建机房。”张强说,为此,很多学校都会选择采用集装箱模式,将两三个集装箱拼接起来,加上制冷、供电,做成一个小的机房,刚好够一个学院在未来几年的使用。
“高校也是我们的集装箱模式目前用得最多的领域之一。”张强补充说。而海外场景,受限于人力建设楼宇的成本高昂,不少海外客户也会选择预制化集装箱的模式实现快速上线。
而大模型的快速爆发,正在进一步加速预制化数据中心的发展。“预制化AIDC将成为未来数据中心的主流建设模式。”浪潮信息服务器产品线行销总监周相峰预测。
尤其是随着算力需求的激增,“和时间赛跑”这件事变得愈加重要,业界观察,这种能将节省的建设时间转化为算力出售运营收益的预制化模式,正在从在中小规模算力中心的采用,逐渐扩展到更大规模的算力中心建设选择中。
一方面,由于涉及设计、土建、机电安装、调试等多个阶段,传统数据中心模式的规划和建设周期动辄3-5年,已经很难跟上大模型时代快速变化的算力需求。毕竟,目前芯片基本一年一迭代,应用创新周期更是压缩至数月甚至数周,如果仍然沿用原来的建设路径,当数据中心建成可以对外出租时,很可能就已经落后了。
另一方面,IT部署环境也在发生变化。过去都是“先机房后IT”,即先按照机架功率确定机房规划,后进行IT设备选型招采,现在却要更多转向“先IT后机房”,只有速度够快,才能更多享受到算力带来的红利。尤其是算力需求的激增,可能带来大量快速扩容需求的情况下,也需要数据中心具有更强大的弹性扩容能力。
此外,绿色低碳的要求,也在不断驱动数据中心向预制化的方向演进。
除了在降低PUE方面的重重动作,近年来,我国装配式建筑规模也呈现持续快速增长态势。《“十四五”建筑业发展规划》中提出,到2025年,装配式建筑占新建建筑的比例将达到30%以上。国内多个地区也都出台了相关政策,鼓励数据中心采用装配式建筑,比如北京要求数据中心建筑面积大于5000㎡需按照装配式建筑实施,上海要求数据中心项目各幢建筑面积总和大于10000㎡,需按照装配式建筑实施。
这些都在加速推动着更加模块化、标准化、绿色化的预制化数据中心建设模式的发展。
《算力工厂建设指南白皮书》中更是一度以一个拥有500台机柜,总IT设备用电容量10WM的项目举例,分析了预制化集装箱数据中心与传统土建模块化数据中心的收益对比,结果显示,虽然前者因采用全钢结构,比后者在基础设施的造价上要高,但由于IT设备的投资是远远高于基础设施的投资的,因此在相同规模算力下,前者和后者的建设总投资实际相差不大,而前者的投资回收期仅为1.9年,比土建模式提前了1.2年。
(图源:《算力工厂建设指南白皮书》)
浪潮信息人工智能与高性能产品线副总经理张强告诉数智前线,2025年将是液冷产品上量的关键一年,“随着液冷的上量、算力集群的上量,未来对于这种大规模预制化数据中心的需求,会越来越大。”
03
元脑算力工厂,如何复制?
面向预制化数据中心这一主流趋势,国内众多厂商都已看到其中的发展潜力,并纷纷加大了在该领域的投入和布局。包括中兴通讯、浪潮信息、中科曙光等,都已有相关预制化模块产品的推出。
“我们建设的集装箱智算中心,已经进入到第三代,也即建筑级、集群式的AIDC。”浪潮信息服务器产品线副总经理李金波告诉数智前线。在此基础上,浪潮信息还正式推出了面向AI时代的预制化AIDC解决方案,包括三种形式:
第一种,“AIO”预制化AIDC,也即第一代产品,是一种一体化的集装箱数据中心,单箱内集成机柜、供配电、制冷、监控、消防等所有数据中心基础设施,适用于小规模需求,通水通电通网即可使用,部分甚至无需做地基。
第二种是“临建级”预制化AIDC,属于第二代产品,是由多个不同功能的集装箱拼接而成的单层临时建筑结构的集装箱数据中心,规模一般在十个集装箱以内。
第三种则是“建筑级”预制化AIDC,是由多个不同功能的集装箱拼接而成的多层具有产权的建筑结构的集装箱数据中心,元脑算力工厂就是这种模式的一个完美打样。
而在这三种不同规模的建设方案基础上,李金波透露,他们还针对智算中心功能进行了细化分区,设计出了IT、电力、集成冷站、集成冷源、办公、走廊、楼梯、电梯八大模块,可根据场景、规模灵活组合,来满足更多客户的不同需求。
比如,元脑算力工厂,就是通过将供配电模块放在智算中心的中间位置,而将机房放在两侧,从而有效减少线缆的路由,提高供电效率的同时,减少了线缆的成本。模块化的方式,也使得后续扩容的需求更易实现,元脑算力工厂目前一期只有一层,而未来计划建设到四期,最终扩容至四层。
相关人士介绍,目前,借着这套解决方案对不同规模数据中心的全覆盖,浪潮信息已在多个行业实现了前两种预制化AIDC的交付。
比如在金融行业,工行上海数据中心通过采用浪潮信息的临建级预制化AIDC解决方案,两个月内建设完成了一个由6个标准集装箱组成的数据中心,并通过在顶部预制光伏木板、间接蒸发冷却技术等先进节能方案,实现了PUE低于1.2。
在能源行业,浪潮信息采用多个集装箱堆叠的方案,帮助国家电网在40多个站点实现了电力中心向算力中心的转化,通过预制化的方式,平均三天就能完成单个站点的部署。
而永久性建筑级的AIDC,元脑算力工厂是一个典型示例,它也是浪潮信息预制化AIDC解决方案的完整实现。
“选择集装箱建设模式去建设如此大的智算中心,对我们来说也是很大的一个挑战。”李金波告诉数智前线,虽然国内之前也有很多集装箱数据中心,但建到10WM以上规模的其实很少,这是因为当需要拼接的集装箱达到几百个以后,对技术的要求将大幅提高。
“这几百个集装箱如何去互联互通,如何保证未来需要扩容时做到在上层施工的同时不影响下层的算力中心正常运行等等,都是我们需要解决的问题。”李金波说,经过元脑算力工厂的建设,浪潮信息在这些问题上实现了经验的积累。
而浪潮信息在智能算力仓和液冷方面的产品积累,也让其在提供预制化AIDC解决方案时,能更大程度满足绿色低碳的需求,有利于成本的节省。
据悉,元脑算力工厂就全面遵循了“高密+绿色”的未来智算中心设计理念,算力节点大量使用高密智算算力仓,将风冷机柜的负载上限提升至50kW,液冷机柜的负载上限则高达130kW。
“在此基础上,我们可以实现一柜顶传统十多柜,节省90%左右的部署空间。”周相峰说,与之相对应的,基础设施的建设成本可降低60%,IB线缆成本随着距离的缩短节省50%,千卡规模集群建设成本直接节省500万元。
而为解决高密度部署带来的散热和能耗问题,元脑算力工厂将液冷、光伏、储能、余热回收等多种绿色技术有机结合,PUE可降至1.1以下,并采用智能管理平台实现IT和机房设备的控制联动,更加绿色节能。
例如,光伏发电技术能够直接将太阳能转换为电能,为智算中心提供清洁的电力来源;储能技术则允许智算中心在电力需求低时储存能量,并在高峰时段使用储存的能量,从而平衡电网负荷并提高能源利用效率。
除了基础设施层的预制化AIDC解决方案外,浪潮信息人工智能和高性能产品线方案架构总监杨振宇介绍,浪潮信息还通过AI基础设施管理平台、企业大模型开发平台元脑企智EPAI(Enterprise Platform of AI)等,在平台支撑层、应用层都形成了支撑,并将这三层打包成了一个完整的算力工厂解决方案,对外提供。
“预制化的风潮最终能持续多久很难预测,但就当下而言,预制化AIDC仍然是大模型和智算中心时代最好最优的一个解决方案,可以通过短平快的方式,让客户获得最大的收益。目前有不少海外客户和国内的互联网等行业客户也都在做这方面的部署。”周相峰说。
文章来源:数智前线