冷板式液冷--术语、定义和缩略语 (6-1)
本连载主要介绍了冷板式液冷系统内的各个子系统的技术要求,包括液冷服务器、基础设施、测试和验证、监控与控制以及运营维护等内容,对数据中心冷板式液冷系统的生产、部署和运维提供技术指导。也可供从事数据中心基础设施设计、建设、运维等工作的专业技术人员以及相关的高校研究人员阅读参考。
业务量的扩大和计算效率的提升促使高功率密度数据中心逐渐取代低功率密度数据中心,相应的机房IT设备的集成度越来越高,散热需求越来越迫切,传统散热设计和设备都面临革新。如何同时兼顾高效计算和高效散热是数据中心建设要考虑的重点问题,液冷是近年里业内发展最迅速并被广泛推崇的解决方案。
目前数据中心液冷主要有冷板式、浸没式、喷淋式三种部署方式,冷板式是一种间接液冷方式,浸没式、喷淋式则是直接液冷方式。在冷板式液冷系统中,发热器件不直接接触液体,而是通过装有液体的冷板(通常为铜、铝等导热金属构成的封闭腔体)来导热,然后通过液体循环带走热量。由于服务器芯片等发热器件不用直接接触液体,所以该系统不需对整套机房设备进行重新改造设计,可操作性更强,因此冷板式液冷也是三种液冷方式中成熟度最高、应用最广泛的。
但是,液冷相对于传统数据中心部署方式来说仍是一个巨大创新和革命,IT设备等硬件的变革更是需要大量人力和物力的投入,对它的使用、运营和维护也需要采取与传统数据中心截然不同的方式,部署和使用液冷技术需要依靠更多的标准化要求进行规范。由于编者水平有限,不足之处在所难免,希望广大读者批评指正。
本连载规定了冷板式液冷系统的液冷服务器、配套基础设施的技术指标和参数,并对其测试验证、监控和控制、运维管理等具体环节做出了方法说明,适用于冷板式液冷设计、施工、部署、运维等环节的技术指导。
2 术语、定义和缩略语
2.1 术语和定义
2.1.1 液冷 一种采用液体带走发热器件热量的数据中心制冷方式,适用于需提高计算能力、能源效率、部署密度等应用场合。
2.1.2 冷板式液冷 通过冷板(通常为铜铝等导热金属构成的封闭腔体)将发热器件的热量间接传递给封闭在循环管路中的冷却液体,通过冷却液体将热量带走的一种形式。
2.1.3 液冷机柜 提供冷却液体进出,针对电子设备进行冷却的装置。
2.1.4 CDU 英文全称为Coolant Distribution Unit,即冷量分配单元,是指用于进行液冷电子设备间的冷却液体分配的系统,提供二次侧流量分配、压力控制、物理隔离、防凝露等功能。
2.1.5 冷源装置 用于将液体回路的热量带出到室外大气中的装置,一般放置在建筑物的室外。
2.1.6 一次侧循环系统 连接室外冷源装置的循环回路系统,也称CWS Loop,属于液冷系统一次侧。
2.1.7 专用冷却液系统 连接冷量分配单元(CDU)和冷却设备之间的专用冷却液循环系统,也称TCSLoop,属于液冷系统二次侧。
2.1.8 分集水器(Manifold) 用于连接各路加热管供回水的配、集水装置,按进、回水方式不同分为分水器和集水装置,按进、回水方式不同分为分水器和集水器。
2.1.9 快速接头 用于液冷系统中的一种不需要工具就能实现管路连通或断开的接头。
2.2 缩略语
CDU Coolant Distribution Unit 冷量分配单元
UPS Uninterruptible Power System 不间断电源
MTBF Mean Time Between Failure 平均故障间隔时间
MTTR Mean Time To Restoration 平均修复时间
冷板式液冷--液冷服务器(6-2)
3.1 快速接头
根据插拔形式的不同,快速接头可分为盲插快速接头和非盲插快速接头,不同的液冷方式,根据实际需求,选择合适的快速接头,具体指标参数见
表1。
液冷快速接头需满足可维护性、可靠性、流阻性能等多方面的需求:
①需满足免工具维护的需求,可以免工具进行快速接头的断开和接合;
②需满足连接与断开中冷却液的泄漏不影响维护过程以及对服务器和机柜不会造成不良影响;
③需满足和冷却液的材料兼容要求;
④需满足发生故障并需要更换时,能方便更换的要求;
⑤需满足液冷系统的阻抗要求,在指定流量范围内,阻抗应尽可能低,有利于降低液冷系统的能耗。
3.2 液冷机柜
3.2.1 机柜
提供常规机柜功能的同时,需满足集分水器、管路以及其他配件安装固定的需求,宜具备下列要求:
① 建议为标准机柜,尺寸宜为600mm(宽)×1200mm(深)×2100mm(高);
② 分集水器(Manifold)锁附于机柜前侧或后侧,推荐在后侧;
③ 上进水,机柜上层配开孔挡板;下进水,机架底部和地板需留对应开口。
3.2.2 集分水器
①对于分布式(嵌入式)CDU布局,CDU布局在机柜内部,机柜进出水管连通的是CDU的一次侧循环;CDU的二次侧循环是由集分水器以及服务器冷板构成的冷却液循环,冷却液从CDU出来,首先进入进水侧集分水器,然后被“均匀”地分配给各个冷板,经过冷板后冷却液被汇总至回水侧集分水器,最后返回至CDU。
②对于集中式CDU布局,冷却液通过进水管路进入液冷机柜后,首先进入进水侧集分水器,然后被“均匀”地分配给各个冷板,经过冷板后冷却液被汇总至回水侧集分水器,最后通过回水管路流出机柜。
③为了保证各支路流量均匀,需尽可能降低流阻,每个支路的流阻差异不能超过10%的支路流阻,并应尽可能使用大通径集分水器,从而保证内部冷却液的流速低于1.5m/s。
3.2.3 其他配件
不属于液冷机柜的必配件,如排气阀、电磁阀、用于排液的单向阀、积水盘等,可根据实际液冷机柜需求进行设计。
3.3 服务器
3.3.1 液冷系统的能效评价
液冷占比是指液冷系统中直接通过冷却液带走的热量(功耗)与系统总功耗的比值。
液冷占比体现了液冷系统直接利用液体冷却带走热量的效率,液冷占比越高,冷却效率越高,推荐采用高液冷占比的系统提升能源利用效率。
液冷占比计算公式如下。
LPE = PL/P0
式中 LPE——Liquid Performance Efficiency,即液冷性能效率,简称液冷占比;
PL——直接液冷功耗,为直接由液冷带走的冷却功耗;
P0——系统总功耗,包含直接液冷功耗和风冷功耗两部分。
建议液冷性能效率≥60%,风冷具备10%的余量覆盖。
3.3.2 冷板
①冷板之间可以直接通过软管或硬管进行连接,需充分考虑连接的可靠性以及整体冷板的应力。
a.使用软管连接,一般不存在连接应力问题,但是需要保证连接的可靠性,一般会采用“宝塔”接头,可通过过盈连接或者增加卡箍的方式保证连接可靠性。
b.使用硬管连接,连接可靠性较好,但是容易出现连接应力问题,需设计缓冲区来加以解决。
②冷板的设计需要考虑可维护性,对于内存等易维护部件,建议做到免工具维护
③冷板的对外管路接头为快速接头,不同的液冷系统,可选择盲插接头和非盲插接头。冷板指标要求见表3。
|