这也相应地对电力和能源提出了更高哀求。据理解,与 AI 大模型单次交互花费的电量可能相称于低亮度 LED 灯泡开 1 个小时。
AI 的能源花费不仅包括用于为做事器供电的电力,还包括冷却数据中央所需的额外能源。均匀来说,为了冷却系统,可能须要额外花费这些设备正常电力 50% 的能源。

而随着 AI 和高性能打算的发展,数据中央的芯片、做事器和机架的配置变得越来越密集,这种高密集度须要更强大的冷却系统,来确保设备能在安全的温度范围内运行,以坚持系统的性能和可靠性。

据理解,数据中央的冷却本钱已成为其物理根本举动步伐本钱中增长最快的部分,年复合增长率达 16%。数据中央在坚持高性能运行时,冷却本钱增长速率超过现有能力。根据麻省理工学院林肯实验室的数据,到 2030 年,数据中央会花费环球高达 21% 的电力供应。
为理解决 AI 的能耗问题,业界除了开拓专门的 AI 定制芯片来提高能源利用效率,另一方面也采取更高效的冷却技能,以帮助数据中央最大限度地实现可持续性。
近期,一家名为 ZutaCore 的公司展示业界首款用于 NVIDIA GPU 的介电直接芯片液冷冷板。这是一种无水、直接到芯片、两相液体冷却系统,专为 AI 和高性能打算事情负载而设计。该公司已与英特尔、戴尔和威图等浩瀚供应商互助,另有多家做事器制造商正在与 ZutaCore 互助,以完成英伟达 GPU 平台的认证和测试。
图 | 介电直接到芯片的液冷冷板(来源:ZutaCore 官网)
只管传统的基于空气的冷却方法逐渐被淘汰,液态冷却技能为数据中央供应了新的可能性。但基于水的冷却方案会花费大量的水资源,也面临着提高能效和降落环境影响的寻衅。
ZutaCore 公司的“HyperCool”冷却办理方案不依赖于水作为冷却介质,利用的是一种分外的介电液体。这种冷却办法直接将冷却液体打仗到须要冷却的芯片上,与传统的空气冷却或间接液体冷却比较,可以更有效地接管和移除热量。HyperCool 技能还能够回收和重新利用数据中央产生的热量,实现 100% 的热量回用。
下图展示了 HyperCool 系统的运作办法,以及如何将热能回收利用于学校、办公室和家庭中。
图 | 直接到芯片的无水介电液体冷却事理(来源:ZutaCore官网)
个中的 HyperCool Dielectric Cold Plate 是系统的核心部分,直接安装在须要冷却的芯片上。利用无水的介电液体,这种液体具有很好的散热性能且不导电,并具有极低的环球变暖潜值(GWP)和臭氧花费潜值(ODP)。
当介电液体接管了芯片产生的热量后,会变成热蒸汽。HyperCool Heat Rejection Unit 卖力将接管的热量从热蒸汽中排出。这个过程中介电液体会冷却下来并转换成液态,循环返回到冷板中连续接管热量。
从热排单元中排出的热量可以通过举动步伐水系统进行回收。回收的热量可以用于加热办公室和家庭或用于给学校的暖气系统供应热能,实现 100% 的可持续性。
这种直接对芯片的冷却办理方案更为高效,利用的能源和空间不到传统系统的一半。全体系统的设计旨在有效地将数据中央的废热回收利用,减少能源摧残浪费蹂躏,同时也减轻了对环境的影响。
通过采取这种高效的冷却技能,数据中央可以显著减少运营本钱,特殊是在冷却系统的掩护和能源花费方面,从而使总拥有本钱降落 50%。
传统冷却技能可能因温度升高而导致性能低落或须要进行热管理从而限定性能。HyperCool 技能由于供应的冷却效率更高,数据中央可以安装更多的做事器和处理器,从而支持更高的事情负载而不会过热。通过有效掌握温度,处理器能够以靠近其设计上限的性能永劫光运行,从而提高整体的打算输出。
这样不仅避免了水资源的花费和潜在的泄露风险,数据中央的打算性能也有望提升到原来的 10 倍。
值得一提的是,HyperCool 系统能够让运营商在险些不改变现有根本举动步伐的情形下进行升级,提高处理能力的同时也减少能源和空间利用。这有利于常常须要迅速扩展其打算能力的云做事供应商和大型企业。
其余,当前每个英伟达 H100 GPU 的功耗高达 700 W,这对付已经在掌握热量、能耗和空间方面承压的数据中央来说是一个不小的寻衅。据理解,HyperCool 可以将冷却能耗降落 80%,支持超过 1500W 的 GPU,同时将机架密度提高 300%。
总的来说,数据中央的冷却是确保硬件效率和延长设备寿命的关键方面。随着数据中央规模和打算需求的增加,高效的冷却办理方案正变得越来越主要。
行业人士都在关注能知够数据中央爆炸性增长的同时更具可持续性的办理方案,除了 HyperCool 供应的方法,海内也有像兰洋科技这样供应浸没式液冷散热技能的企业,能够为数据中央、PC 主机、新能源汽车、储能电池、5G 基站、投影仪和航空航天等领域供应高效节能的散热终端产品和技能做事。
通过持续供应优化的冷却,数据中央的硬件能够持续运行在较高性能水平,避免了因温度问题导致的性能颠簸,从而实现远超传统举动步伐的打算能力,这对依赖高性能打算的运用(如人工智能和大数据剖析)尤为关键。
HyperCool 等类似技能的引入,可能会改变数据中央设计和管理的办法,推动全体行业朝着更高效、更环保的方向发展。
参考:
https://electronics360.globalspec.com/article/20866/liquid-cooling-technology-to-support-nvidia-s-advanced-gpus-for-sustainable-ai
https://www.scientificamerican.com/article/the-ai-boom-could-use-a-shocking-amount-of-electricity/
https://blog.zutacore.com/zutacore-blog/sustainability







