集成CFD建模与实验验证:用于数据中心热管理的单相浸没冷却技术

《Energy》:Integrated CFD modeling and experimental validation of single- phase immersion cooling for data center thermal management

【字体: 时间:2026年02月04日 来源:Energy 9.4

编辑推荐:

  单相浸没冷却技术通过整合理论分析、CFD模拟与实验验证,建立了冷却液性能评估体系(HDC指数),优化了服务器散热器结构(PEC达2.05),设计了新型储液罐结构降低流动不均85%,并验证了SS110冷却液的长期可靠性。

  
张波|李洪瑞|徐铁晓|王璐|陈亮|李振
教育部热科学与动力工程重点实验室,清华大学工程力学系,北京100084,中国

摘要

随着现代服务器功率密度的不断增加,单相浸没冷却已成为一种关键的热管理方式。然而,目前仍缺乏系统性的方法来选择最佳的冷却剂和组件,这仍然是一个重大挑战。本研究通过提出一个综合框架来应对这一难题,该框架结合了理论分析、计算流体动力学(CFD)模拟和实验验证。首先,利用边界层理论和场协同原理研究了基于油和氟碳的冷却剂的流动和传热特性。同时,我们提出了一种新的散热系数(HDC)来定量评估冷却剂的性能。其次,通过CFD模拟对标准1U服务器的热液行为进行了严格评估,并在专用实验平台上进行了验证。在此基础上,采用混合CFD-遗传算法(GA)方法优化了散热器的几何形状。第三,设计了一种新型水箱结构以减少流体分布不均的问题。分别使用Realizable k-ε模型和SST k-ω模型对服务器流动进行模拟,并对肋状结构进行了优化。结果表明,HDC指数能够高精度地评估冷却剂性能,其结果与CFD数据高度吻合,同时显著降低了计算开销。比较分析显示,氟碳冷却剂的热性能优于硅油。优化后的散热器达到了2.05的性能评估标准(PEC),而重新设计的水箱结构将流体分布不均现象减少了85%。最后,1000小时的兼容性测试证实了SS110冷却剂的长期运行可靠性。

引言

数据中心(DC)是包含分布式服务器阵列、先进网络和关键基础设施的复杂技术生态系统。它们是全球数据存储、传输和处理不可或缺的支柱。得益于大规模集成电路和微纳制造的突破,晶体管密度大幅增加,导致芯片级别的热流量激增。目前,主流处理器的热设计功率(TDP)已达到280瓦,而高性能加速器的功率通常超过700瓦[1]。这种不断上升的功率密度带来了前所未有的热管理挑战,需要先进的冷却方案来确保运行可靠性和能源可持续性。预计到2026年,全球数据中心的能耗将超过1000太瓦时[2]。传统的空气冷却系统依赖于房间规模的计算机房空调(CRAC),由于气流混合损失和低热容量而效率低下[3]。在这些设施中,冷却基础设施通常占总运营成本的40%,是仅次于IT设备的最大能源开支[4]。因此,热管理已成为数据中心发展的主要瓶颈,迫切需要转向高效液冷技术。
先前的研究探索了多种减少数据中心能耗的策略。周等人[5]表明,提高供气温度可以降低能耗,但这往往会影响硬件可靠性。相比之下,液冷剂由于其优异的热物理特性而具有更高的传热系数[6]。此外,液冷技术促进了高级废热回收,提高了整体能源循环利用效率[7]。焦等人[8]提出了一种混合液冷架构,并通过多目标算法对其结构进行了优化。然而,紧凑型服务器机箱内的空间限制仍然是实施的主要障碍。
当前的液冷解决方案主要分为四种类型:间接水冷、直接到芯片(冷板)冷却、单相浸没冷却(SPIC)和两相浸没冷却(TPIC)[9]。与容易泄漏和流体路径堵塞的水冷系统不同,浸没冷却提供了更稳定和全面的热环境。通过将整个服务器浸入绝缘流体中,浸没冷却能够直接从所有电子元件中提取热量,同时保护硬件免受空气中的污染物、机械振动和湿度的影响[10]。这些系统的效率通常通过功率使用效率(PUE)来衡量。值得注意的是,像Green Revolution Cooling(GRC)开创的微模块化浸没系统可以实现低至1.03的PUE值,远优于空气冷却和冷板冷却系统[11]。在浸没冷却领域,TPIC系统利用蒸汽的潜热实现了极高的传热系数[12]。马等人[13]通过使用烧结铜粉多孔结构进一步增强了沸腾传热效果。然而,将这种烧结工艺直接应用于实际芯片表面存在挑战。此外,TPIC的采用目前受到高资本支出和严格密封要求的限制[14]。
与上述解决方案相比,SPIC系统在传热效率、运行稳定性和低噪音方面提供了良好的平衡[15]。使用多种冷却剂(包括Novec 7100[16]、矿物油[17]和Noah3000D[18])验证了SPIC的基本可行性。然而,热性能对冷却剂粘度和流动动力学非常敏感。例如,Gajjar等人[19]发现FC-3283在热性能上优于矿物油,而Hnayno等人[20]观察到当冷却剂粘度从4.6 mPa·s增加到9.8 mPa·s时,性能下降了6%。
最近的研究转向了结构和流动架构的优化。研究表明,反重力配置可以增强散热效果[21],而T型布局相比Z型布局可以降低12.6%的热阻[22]。内部组件如挡板角度[23]、孔径几何形状[24]以及散热器和水箱之间的间隙间距[25]显著影响流动均匀性和旁路效应。具体来说,减小服务器间距[26]和保持较低的冷却剂流速[27]被认为是确保安全运行温度的有效策略。此外,包括集成微泵[28]、[29]或将冷板与SPIC结合[30]在内的混合方法在降低等效热阻方面显示出潜力。从能源角度来看,泵驱动的SPIC系统可以将平均冷却剂温度降低55.5%,并提高PUE 11.6%[31],这与传统水冷系统在高环境温度下的PUE(通常超过1.2)形成鲜明对比[32]。此外,还建立了先进的建模技术,包括灰箱动态模型[33]和基于CFD的参数研究[34]、[35]、[36],以捕捉这些系统内的复杂能量-质量传递动态。虽然Mouromtseff数等指标已被用于评估冷却剂[37],但其基于简单管道流动理论的推导在复杂的高密度服务器几何形状下限制了其准确性。此外,以往的研究往往只关注平均温度,忽略了冷却剂的空间分布及其对局部热点的影响。特别是CPU,由于其极高的功率负载,在非最佳浸没条件下特别容易发生热故障,因此需要更严格的监控。
虽然将热管或冷板集成到SPIC系统中可以有效降低热阻,但这些配置不可避免地增加了结构复杂性和潜在的泄漏风险。相比之下,基于CFD的散热器参数优化提供了一种无需辅助硬件的实用解决方案,以提升热性能。尽管取得了这些进展,但在SPIC系统领域仍存在一些关键的研究空白。首先,缺乏针对服务器热管理场景的专门评估指标。目前的指标通常基于内部管道流动,其适用性尚未在服务器内的复杂热流动力学中得到验证。其次,仍有很大的潜力可以在不增加系统复杂性的情况下提高现有冷却剂的传热能力。第三,对于浸没水箱内的内部流动特性,尤其是冷却剂分布不均的问题,关注不足。为了填补这些空白,本研究提出了四个方面的贡献:首先,我们开发了一个全面的SPIC冷却剂性能评估框架,严格考虑了它们的热液特性;其次,我们进行了系统的传热实验,比较了SS110冷却剂和硅油,结果表明SS110使温度降低了16.5°C,温度不均匀性减少了65%;第三,我们对散热器进行了多目标优化,最终设计出了PEC为2.05的产品;第四,我们提出了一种新型水箱配置,采用对称的进出口布置和具有非均匀孔隙率的多孔板,显著减少了冷却剂分布不均现象,降低了85%。

模型描述

在1U SPIC服务器框架内,对多种冷却剂的热液性能进行了系统评估,如图1所示。计算域包括处理器、散热器、随机存取内存(RAM)模块和PCB,按照Muneeshwaran等人[21]制定的架构规范构建。为了确保高预测准确性,实施了三维共轭传热建模。

理论分析结果

对多种SPIC冷却剂(包括矿物油、硅油和氟碳基液体)的热物理特性进行了系统收集。如表2所示,关键参数包括密度、比热、热导率、动态粘度和普朗特数(Pr)。
基于自然对流原理的理论分析研究了SPIC系统的热性能极限。假设芯片表面积为25平方厘米,并考虑了温度因素...

结论

本研究建立了一个全面的计算和实验框架,用于通过SPIC系统改进高性能服务器的热管理。严格分析表明,氟碳冷却剂SS110具有优异的热物理性能,其粘度比传统油基冷却剂低一个到两个数量级。强制对流模拟显示,在1U服务器配置中,SS110的性能优于FC40,热传递效率提高了11%

作者贡献声明

李振:监督、资源管理、项目管理、资金获取、概念构思。陈亮:研究。徐铁晓:研究。王璐:研究。张波:撰写初稿、可视化、软件开发、方法论研究、概念构思。李洪瑞:方法论研究

利益冲突声明

? 作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

致谢

本工作得到了河北科技计划(授权号:20374506D)、大金工业有限公司的资助,以及国家电网浙江电力公司金水滩水电站(合同编号:20242001533)的科技项目的财政支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号