AI芯片散热的压力,正在从 H100 的TDP 700W 推到 2300W-2400W。功耗一上来,问题就不只是冷板够不够大,而是热量从裸晶出发以后,能不能少经过几道低效传递。

如果只记一个判断,就是别把散热升级看成单点材料替换。Rubin 把问题推到热阻链前端,微通道和液态金属要分别回答“冷却液能不能更近”和“接触界面能不能更实”这两个问题。

Rubin 之后,散热链最值得看的不是“谁的材料导热率更高”这一句,而是两个更具体的问题:冷却液能不能更靠近热源,裸晶和盖板之间的接触能不能更贴实。

前一个问题指向微通道,后一个问题指向液态金属 TIM。

微通道不是普通液冷板换代,它想把换热位置从冷板端往封装端推。液态金属也不是简单换一种导热膏,它要填掉裸晶和盖板之间那些肉眼看不见的微观空隙。

看这条线,先看热量被卡在哪一层,再看对应的结构和材料名字。

Rubin把散热压力推到了哪一步?

这轮变化有三组数字最硬:功耗跃迁、热点抬升、空间变薄。单看任何一项,都可以理解成散热系统继续升级;三项叠在一起,就会把问题推到热阻链本身。

这次散热升级,不能只问“导热材料够不够强”,还要问“热量离冷却液还有多远”。

热阻链越长,中间每一层接触、每一次传导、每一个界面都会放大温差。

微通道和液态金属的分工也由此变清楚。前者把换热位置往封装附近推,后者把裸晶和盖板之间的微观空隙尽量填平。它们不是同一种技术路线,却都在处理旧路径被功耗放大后的短板。

传统冷板并不会因为 Rubin 出现就立刻失效,它还会继续靠铲齿、流道和材料改良往上顶。

只是功耗跃迁把总热量和局部热点抬起来,0.5U 又把系统端继续堆冷板的空间压下去,散热链必须在更靠前的位置补一段能力。

为什么近中期更该看热阻链?

高导热材料当然重要,远期也会有更激进的路线。

但 Rubin 第一代的近中期落地,主要还是成熟体系的极限改良,再叠加少数靠近封装端的新方案验证。金刚石远期空间先不展开,因为它不是这篇的主线。

传统路径里,热量从裸晶出来,要经过 TIM1、盖板、TIM2、冷板,再进入冷却液。任何一层贴合不好,都会形成热阻。

过去芯片功耗相对可控时,系统还能靠更大的冷板、更强的水冷头、更复杂的流道把问题往后端消化。功耗继续上去,0.5U 又压缩物理厚度,后端可堆的东西变少,前端热阻就不能再粗放处理。

微通道盖板的意义,是把均热盖板和冷板合二为一,减少 TIM2 这一层热阻,让冷却液更靠近热源。

液态金属 TIM 的意义,是填补芯片裸晶与盖板之间分子级的凹凸不平,压低 TIM1 接触层热阻。前者改的是换热发生的位置,后者改的是热量刚离开裸晶时的贴合质量。

判断顺序也要倒过来:先问热量卡在哪一层,再问哪种材料或结构能解决。

先把裸晶和盖板之间的微观接触做实,再把盖板和冷却液之间的距离缩短。两段同时变短,功耗跃迁带来的温差才有机会被工程系统接住。

微通道为什么先卡在加工和堵塞?

微通道听起来像是把流道做细,但难点不在“细”一个字。

流道越细,单位面积换热能力越强,同时对加工平整度、平行度、洁净度和泵压的要求也会急剧上升。

从实际加工要求看,微通道里的流道对加工平整度及平行度要求在 100 微米以内,细微杂质就可能造成堵塞。

一旦堵塞发生,冷却液并不会乖乖穿过最高热流区,而可能绕开局部热点,系统层面的换热反而失效。

Rubin 平台最初规划过 0.05 毫米间距微通道方案,但受加工精度和堵塞隐患影响,近中期选择更成熟的路径。第一代更接近把 GB200 时代 0.15 毫米的铲齿间距进一步压缩到 0.1 毫米,并通过水冷头流道优化,把低温冷却液优先导向热点区域。

这不是方向不成立,而是节奏要看工程边界。

长期看,冷板组件可能从独立服务器配件,上移为先进封装的一部分。近中期的动作,仍是先在成熟冷板、铲齿和水冷头体系内做极限改良,再给封装级微通道留下验证窗口。

顺序不能反过来。不是先宣布封装集成,再倒推制造能不能做到。

加工精度、洁净制造、堵塞控制、泵压和良率逐项过关后,微通道才可能从冷板端继续往封装端移动。产业链判断也要跟着这个节奏走。

产业链上更先被关注的,往往是能把高精度加工、结构件、均热板、流道设计和洁净制造做扎实的环节。它们不一定最有概念感,却决定微通道能不能从样品走到可复制的制造流程。

液态金属解决的是哪一层热阻?

液态金属也容易被误解成普通导热材料升级。它对准的是 TIM1,也就是芯片裸晶和盖板之间那层很薄、却很关键的接触界面。

芯片表面和盖板并不是绝对平整的,两者之间存在分子级微小凹凸。传统导热介质如果无法充分贴合,就会留下微观空隙,热量在这一层被卡住。液态金属的优势在于保形能力和高导热性,能够更充分地填补这些空隙。

它对准的是 TIM1,评价标准就不能只看导热系数。TIM1 离裸晶最近,承担的是高温、高功耗和长周期运行下的第一道接触热阻。

只要这层材料在热循环中流动、溢出或反应失控,后面的冷板和流道做得再强,也会被前端界面拖住。

但它的风险同样直接。镓基液态金属可能带来化学腐蚀,材料一旦泄漏,还会引发 PCB 短路。因此液态金属能不能进入大算力芯片,不只看导热系数,更看封装隔离、长期可靠性和工艺兼容性。

德邦科技控股子公司泰吉诺的方向,正是芯片级 TIM1 材料。其路径是通过聚二甲基硅氧烷软封装构建三维柔性网络,用材料物理隔离降低高温溢出和短路风险,并推进大算力芯片量产验证。

这条线要盯的是“量产验证”,还不是“已经全面导入”。

哪些公司更贴近这条热阻链?

我们不是要整理液冷大全,沿着热阻链去看:谁离换热位置前移更近,谁离接触热阻压低更近,谁提供材料底座和工程配套。

鸿日达更贴近微通道和精密结构加工方向。

微通道要往封装附近走,对结构件、连接件和高精度加工能力提出更高要求。它的看点不在“散热概念”四个字,而在能否进入更靠近封装端的加工链,并跟随客户验证走到更高价值量的位置。

有研粉材和有研复材对应的是材料底座。

有研粉材更偏金属粉体和复合材料配套,有研复材更偏复合材料和高导热材料方向。散热升级不可能只靠流道结构,材料的导热能力、热膨胀匹配、成本和可靠性,都会影响下游能否从传统冷板和传统 TIM 走向更低热阻体系。

德邦科技对应液态金属 TIM 和芯片级导热界面。

它的核心位置更靠近 TIM1,直接面对裸晶和盖板之间的微观接触热阻。后续更需要观察的是软封装、隔离、防腐蚀和大算力芯片验证进度,而不是简单把液态金属写成材料替换。

这几类公司当前更多处在产业位置和工程进展观察阶段。

更靠成熟冷板、铲齿、水冷头和已有客户体系的环节,现金流更近;更靠封装级微通道和液态金属 TIM1 的环节,弹性更大,但也更依赖良率和可靠性。看这条线,先看位置,不提前把验证中的路线写成确定订单。

最后还是回到工程验证

后面最该盯的不是概念热度,而是 Rubin 平台实际怎么取舍。如果第一代仍然围绕成熟冷板、铲齿、石墨体系改良,那近中期就先按成熟路线的极限升级看;如果封装级微通道开始出现更明确的导入窗口,再重新评估价值量和供应链位置。

微通道这边,加工精度、堵塞控制、泵压和良率只要有一项不稳,就很难从样品或小范围测试走出来。

液态金属 TIM1 这边,腐蚀、泄漏、短路隔离和长期可靠性同样绕不过去。导热能力只是入场券,能不能放量,最后看它们能否在高温、高功耗、长周期运行里保持稳定。

Rubin 之后,散热升级最值得看的地方,不是谁的材料名字更前沿,而是热阻链有没有真的变短。

微通道把冷却液从冷板端推向封装附近,液态金属处理裸晶和盖板之间的微观空隙。这两个方向都成立,但落地节奏仍要交给良率、堵塞、泵压、腐蚀和泄漏这些工程问题来回答。


免责声明:本网站提供的所有数据及资讯(包括第三方机构提供的信息)仅作交流学习及参考用途,不构成任何投资建议或交易要约‌。