什么是芯片级直接冷却？

温馨阁 · 发表于 2026-6-24 10:14

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？注册

×

随着人工智能的不断进步，数据中心不仅需要发展，而且需要快速发展。

应对电力需求激增固然令人担忧，但热量也是一大难题。人工智能数据中心会产生大量热量，近期一项尚未经过同行评审的研究甚至表明，它们会形成“热岛效应”，导致周围地区温度升高。

问题的核心在于机架密度——单个服务器机柜内 IT 设备的功耗和发热量——以及被推向极限的传统冷却技术。

传统的数据中心冷却系统主要依靠空调，通常每个机架可处理约 20 千瓦 (kW)的 IT 负载。

但人工智能工作负载由高性能处理器（例如 GPU）组成的大型集群驱动，目前产生的机架密度为 100kW。预计到 2028 年，这一数字将上升到 1.2 兆瓦(MW)。

这促使数据中心转向液冷技术，因为液体能够更高效地吸收和传递热量，从而支持更高的机架密度（超过200kW）。因此，数据中心液冷市场预计将从今年的66亿美元增长到2033年的384亿美元。

数据中心使用的液体冷却主要有两种类型：浸没式冷却，即将整个服务器浸入导热液体中；以及芯片直接冷却。

业界普遍认为，直接对芯片进行液冷是一种有效且可扩展的技术，能够处理 AI 工作负载产生的热量。

这项技术通过安装在最热组件（尤其是 CPU 和 GPU）上的冷板输送冷却剂，这意味着热量会在靠近热源的地方被去除，而不是被空气吸收。

它节省空间，使组件运行速度更快，并且比用于空气冷却的风扇消耗的能源更少，考虑到数据中心高达 40% 的电力消耗都用于冷却，这一点意义重大。

芯片直接冷却有两种类型：单相冷却和两相冷却。

在单相冷却系统中，液态冷却剂流经冷板，冷却其所安装的芯片。加热后的液体通过管道排出，然后利用散热装置（例如风扇）散发热量。这是一个闭环系统，因此冷却液会被送回芯片进行循环冷却。

随着热设计功率的不断提高，需要冷却系统从 CPU 和 GPU 中去除更多热量，数据中心行业正在寻求更先进的解决方案。

同时，两相直接液冷（DLC）技术更进一步——通过蒸发冷板上的制冷剂来散热，比单纯提高液体温度能带走更多的热量。蒸发的制冷剂蒸汽随后在散热装置中冷凝成液体，并泵回系统以重复循环。

芯片直接液冷技术的优势和应用

这种先进的液冷方式具有几个关键优势，尤其是在数据中心环境中，处理器芯片容易受到高温影响：

更高的冷却效率：通过将冷却剂直接施加到热源，与空气冷却相比，这种方法可以实现更高效的热传递。这种效率对于空气冷却可能不足以满足需求的高密度数据中心至关重要。

节能：液冷系统通常比风冷系统运行所需的能量更少。这种能耗的降低可以转化为数据中心更低的运营成本和更小的碳足迹。

性能提升：液冷系统能够降低组件过热的风险，从而保持更高的性能水平。对于需要持续高性能的应用，例如科学计算和大规模模拟，这种性能提升尤为显著。此外，由于液冷系统能够长时间保持 CPU 的低温运行，防止过热降频，从而维持最佳性能，因此 CPU 可以比风冷系统更长时间地以“睿频”频率运行。

空间优化：芯片级液冷技术可实现更高的计算密度，这意味着与风冷系统相比，只需更少的机架或空间即可达到相同的计算能力。这种空间效率在空间寸土寸金的环境中至关重要，它使数据中心能够在更小的空间内最大限度地发挥计算能力。

降低噪音：液冷系统比风冷系统运行更安静，因为它减少了对大型、高噪音风扇的依赖。在对噪音水平有严格要求的环境中，这种降噪优势尤为显著。
芯片级液冷技术的实际应用案例

由于其高效性和可靠性，芯片级液冷技术在各行各业的应用日益广泛。其中一个突出的应用场景是高性能计算 (HPC) 环境，例如科研机构和大学。这些机构运行复杂的模拟和数据分析，需要持续的高性能，而传统的风冷系统在不消耗大量能源和占用大量空间的情况下难以满足这一需求。在需要CPU和GPU以最高频率 24 小时全天候运行的环境中，这种冷却技术尤为重要。传统的风冷系统难以在不消耗大量能源和占用大量空间的情况下维持如此高的性能水平，因此芯片级液冷成为理想的解决方案。

在数据中心，尤其是在大型科技公司和云服务提供商运营的数据中心中，芯片级液冷有助于管理高密度服务器的热负荷。通过提高冷却效率和降低能耗，数据中心能够获得更佳的性能和成本效益。例如，谷歌和微软等公司已经采用液冷技术来支持其海量数据处理业务。

游戏行业，尤其是工作站级别，也依赖于芯片级液冷。高端游戏服务器和工作站需要最佳运行温度，以确保流畅无阻的游戏体验。这种冷却技术对于维持这些系统的可靠性和性能至关重要。此外，一些服务器设计现在还采用了内存 DIMM 的液冷散热，进一步减少了服务器内部风扇的需求。这项进步最大限度地降低了噪音，并提高了系统的整体效率。

此外，金融行业及其高频交易平台也受益于这项冷却技术。这些平台需要极快的数据处理和交易速度，从而产生大量热量。芯片级液冷技术可确保这些系统保持低温运行，减少停机时间并维持性能水平。

芯片直接液冷技术的实施注意事项

在实施芯片直接液冷时，应考虑以下几个关键因素，以确保高效运行：

系统兼容性：确保服务器和组件与液冷解决方案兼容。这包括验证冷板能否正确连接到芯片，以及系统布局是否支持必要的管路连接。

冷却液选择：选择合适的冷却液，该冷却液应具有高导热性和低导电性。冷却液应无腐蚀性，且泄漏风险低。

水泵及流量：选择一款能够提供可靠流量的水泵，以维持冷却液的持续循环。该水泵应坚固耐用，能够在所需工况下稳定运行，无需频繁维护。

换热器容量：确保换热器尺寸足够大，能够处理系统的热负荷。它应有效地将热量从冷却剂传递到外部冷却源，例如散热器或冷却塔。

泄漏检测与预防：实施泄漏检测与预防系统。这包括使用高质量的密封件和配件，以及安装传感器来监测潜在的泄漏。

维护与监控：制定定期维护计划，检查并保养冷却系统组件。持续监控冷却液液位、流量和系统温度至关重要，可防止过热并确保最佳性能。

冗余和备份系统：考虑在冷却系统设计中加入冗余机制。这可能包括配备备用泵或替代冷却方法，以防系统发生故障。

环境与安全考量：评估冷却剂及整个冷却系统对环境的影响。确保系统符合安全法规和标准，以保护人员和设备。

常见问题解答

Q：芯片级液冷比浸没式冷却更好吗？

芯片级液冷和浸没式冷却各有优势。芯片级液冷能够直接在热源处进行精确冷却，对于高密度、高性能系统而言效率更高。它也更容易集成到现有的数据中心基础设施中。然而，浸没式冷却能够提供更均匀的冷却效果，并且在处理极高的热负荷方面通常更有效。对于要求最苛刻的环境，由于浸没式冷却能够更有效地应对极端的热挑战，因此可能是必需的或更优的选择。两者之间的选择取决于具体的应用需求、成本考虑以及基础设施兼容性。

Q：芯片级液冷有哪些缺点？

由于需要专用设备和安装，芯片级液冷的初始设置成本可能较高。其维护也比传统的风冷更为复杂，需要定期检查冷却液和系统组件。此外，还存在泄漏风险，如果处理不当，可能会损坏敏感电子元件。另外，将这种冷却方式集成到现有基础设施中可能需要进行重大改造。

Q：芯片级液冷如何影响能耗？

与风冷系统相比，芯片级液冷通常能降低能耗。它能高效地将热量直接从组件中带走，从而减少了对大型、高能耗风扇和空调设备的需求。这种效率的提升有助于降低数据中心的运营成本和碳排放。

Q：芯片级液冷技术适用于所有数据中心吗？

芯片级液冷技术适用于许多数据中心，但并非所有数据中心都适用。其可行性取决于现有基础设施和数据中心的具体冷却需求。一些老旧设施可能需要进行重大改造才能支持液冷系统。在新数据中心或正在进行重大升级的数据中心，液冷技术的实施则更为容易。

（来源：编译自mhi）
*免责声明：本文由作者原创。文章内容系作者个人观点，半导体行业观察转载仅为了传达一种不同的观点，不代表半导体行业观察对该观点赞同或支持，如果有任何异议，欢迎联系半导体行业观察。

账号		自动登录	找回密码
密码			注册

[科技新闻] 什么是芯片级直接冷却？

马上注册，查看更多内容，享用更多功能，让你轻松玩转社区。

浏览过的版块