上海市通信管理局等11个部门近日联合印发的《上海市智能算力基础设施高质量发展 “算力浦江”智算行动实施方案》(以下简称《实施方案》)提出,力争到2025年,上海市智能算力规模超过30EFlops(FP16),占比达到总算力的50%以上。算力网络节点间单向网络时延控制在1毫秒以内。智算中心内先进存储容量占比达到50%以上。绿色智算效能方面,力争到2025年上海市新建智算中心PUE值达到1.25以下,存量改造智算中心PUE值达到1.4以下,智算中心内绿色能源使用占比超过20%,液冷机柜数量占比超过50%。
对此,网宿科技子公司绿色云图运营总监徐明微对证券时报记者表示,《实施方案》对液冷的部署比例要求,印证了液冷技术对AI算力的不可或缺,将带动液冷渗透率加速提升。
当前,AI大模型的迅猛发展,引爆了各行业对智能算力的需求。据IDC预计,到2026年我国智算规模将达1271.4EFLOPS,未来年复合增长率达52.3%。伴随着AI计算需求的快速提升,计算芯片朝高算力、高集成方向演进,随之而来的功耗和热量急剧攀升。传统的风冷散热方式已无法满足主流AI服务器的散热要求,液冷技术成为智算的必由之路。
《实施方案》明确,加快智算中心新型节能技术应用。加快发展和部署全液冷、风液混合、高弹性冷却等新一代绿色节能方案应用,推动液冷在智算中心的规模化和规范化发展。推进智算中心利用预制化交付、整机柜工程、集群新背板等融合技术创新。
“在机柜上架率不变的情况下,服务器功率上升导致单机柜功率显著增长,已经逼近风冷15 kW的散热极限。”徐明微表示,而液冷所带走的热量是同体积空气的近3000倍,导热能力是空气的25倍,可实现30kW以上的散热能力,并通过去空调化节省数据中心空间,提升单柜部署密度,提高数据中心单位面积利用率,满足AI时代高密算力的散热需求。能耗方面,液冷技术相较风冷还可节能30%,减少30%的碳排放,实现PUE值从1.4降至1.1左右。
在3月19日召开的英伟达2024 GTC大会上,英伟达CEO黄仁勋发布了更高性能的GPU芯片——基于Blackwell架构的B200以及超级芯片GB200。同时,黄仁勋还公布了由Grace Blackwell超级芯片GB200提供支持的服务器系统。由于功耗太高,液冷的散热方式成为系统标配。正如黄仁勋此前曾提到的,浸没式液冷技术将是未来方向,将带动整片散热市场迎来全面革新。
中信证券研报提到,在数据中心算力提升和能耗降低推动下,液冷技术将加速替代风冷技术,成为新的技术发展方向。在液冷技术中,冷板式液冷技术在性能与成本之间形成平衡,是现阶段最佳的散热方案,建议关注液冷系统及其核心零部件的投资机会。
校对:冉燕青