あるノードがバースト的なジョブを実行し、ファンが暴れ、近くのノードが「正当な」理由もなく熱くなり、スロットリングが忍び込む。それは 熱クロストーク.解決策は魔法ではなく、エアフローを律するだけだ。この記事では、実際のラックライフと結びつけ、わかりやすく、実践的に説明する。また IStoneCase なぜなら、エアフローのルールを尊重するハードウェアは、後で頭痛の種を避けることができるからだ。
注:一般的なDC用語(コールド・アイル・コンテインメント、ΔP、バイパス・エア、リサーキュ、シュラウド、ダミー・ソリ)を使用する。
ノード間の熱クロストーク
隣接するソリが圧力平面を共有する場合、「ハングリー」ノードは次のことができる。 スティールインテーク 静かな」隣人から。閉鎖的な通路では、これは次のようになる。 限られた冷気供給競争.結果:吸気温度の上昇、ファン回転数の変動、ベンチでは再現できない奇妙な性能低下。
コールドアイルの封じ込めとエアフロー競争
封じ込めは素晴らしいが、バランスのハードルを上げてしまう。十分な 静圧 穴のあいたタイル(またはフロントドア)のところにある 逆流 そして 熱風循環.簡単に言うと、供給が追いつかない場合、ノード同士がエアフローを食い合う。ノードAがスパイクしているのにノードBが熱いのはなぜか?

ノード間の気流隔離
孤立 空気を強制的に移動させることでクロストークを減少させる を通して 各ノード 周辺 それ考える:フィットしている エアシュラウド, ブランキングパネル密閉されたケーブルカット ダミー/ブランク・ソリ を空のベイに入れる。そうすることで、卑劣なバイパス経路をカットし、各ノードのインテークを安定させることができる。
エアシュラウド、ブランキングパネル、ダミーソリ
- エアシュラウド CPU、DIMM、NVMe、VRMの上に冷風を送ることができる。
- ブランキングパネル 空いたU字スペースを通る前後短絡の流れを止める。
- ダミーソリ マルチノード・シャーシで空きスロットがリークにならないようにする。
- ケーブルバッフル&ガスケット 大したことではない」ギャップを埋める。
圧力制御と気流方向モニター
温度は一人で見てはいけない。見る 圧力 そして 流れの方向 通路で、できればラックごとに。シンプルな ΔP設定値 コールドアイルとラックフェイスを横切ることで、ヨーヨー効果が軽減される。CRAH/CRACが対応している場合は、以下を実行してください。 圧力制御 (温度はガードレールとして機能する)そのため、仕事量が急増するたびにノードが空気の奪い合いになることはない。
ワークロードを考慮したサーマル・オーケストレーション
ソフトウェアも役立ちます。隣の2台が同時にターボをかけると、同時にエアフローを引っ張ることになる。スケジューラーを使って 激務をこなすまた、密に詰め込まれたソリで過渡的なターボに上限を設定したり、すでにファンの限界に達しているクラスタからとがったタスクを移行したりすることもできます。派手に聞こえるかもしれないが、「通路のΔPが低いときには、隣接するベイに2つの最大TDPジョブを同居させない」という単純なルールがある。
現場で検証されたクレーム、症状、修正(IStoneCase fitを使用)
主張(何が真実か) | ラックの中身 | 実際に修正するもの | IStoneCase が役立つところ |
---|---|---|---|
ノードは格納容器内の限られた冷気を奪い合う | インレット温度が4~8℃変動、ファンが追走、バースト時にスロットルが現れる | 通路の維持 ΔP暑い列のある場所にタイルのCFMを追加し、ドアの穴を確認する。 | を使用する。 密閉性の高いシャーシ私たちの デュアルノード・サーバーケース タイトシュラウドとベイシールのある船 |
バイパス・パスがクロストークを引き起こす | 空いたU字スペース付近のホットスポット、"謎の "暖かい吸気口 | ブランキングパネル ケーブルグロメットも例外ではない | IStoneCaseのシャーシ+ラックキットは、実際にフィットするパネルとペアになっている。 |
空のソリ=巨大なリーク | インレットを保持するために、隣のノードはより高いファン回転数を必要とする | インストール ダミー/ブランク・ソリ圧力経路を連続的に保つ | のマルチノードオプション デュアルノード・サーバーケース 2400TB フィラー・ソリを含む |
アップグレード後のシュラウドの不一致 | CPU/GPU交換後、"理由なく "温度が上昇 | 再仕様 エアシュラウド スモーク/CFDとの適合性を検証する。 | 私たちの OEM/ODM チームは実際の熱源をマッピングしている。 カスタマイズサーバーシャーシサービス |
温度センサーだけ?遅い | ファンの遅れ、崖っぷちの後のアラーム | 追加 ディレクショナル・フロー そして 圧力 プローブ;ΔPのコントロール | プローブの前面取り付けに対応したシャーシ。 |

実践シナリオ(チームが実際に行っていること)
- ギアが混在するエッジラック:一人 コンピューターケースサーバー ストレージが重く、隣はコンピュートが重い。ストレージは低CFMで、コンピュートはスパイキーだ。シュラウドとブランキングパネルで隔離し、最小ΔPを設定することで、コンピュートスレッドがサージ時にストレージスレッドを飢えさせないようにする。コンパクトな atxサーバーケース吸気ジオメトリーを調整することができる。 カスタマイズサーバーシャーシサービス.
- 4ノードシャーシ、1ベイ空:大丈夫だと思ってるでしょ。大丈夫じゃない。その隙間がバイパスになるんだ。その隙間がバイパスになる。 ダミーそり そして、近隣のCPUインレット温度が下がるのを見る。私たちの デュアルノード・サーバーケース ブランクフィラーをサポートしているため、"オープンマウス "ベイを使用することはありません。
- 高密度GPU通路:ファンはすでにうるさい。ケーブルの切り欠きを塞ぎ、ドアのCFMを確認し、次に進む。 圧力ベース 冷却制御。タイトな サーバーPCケース を経由して、実際のGPUの高さをクリアするためにシュラウドをOEMします。 カスタマイズサーバーシャーシサービス.
- MSPへの展開:混在する顧客、混在する荷物、1つの請求書。不測の事態は避けたい。設計上エアフローを維持するシャーシを標準化。当社の デュアルノード・サーバーケース 2400TB 隣のノードをスペースヒーターにすることなく、高いスループットを維持する。
気流隔離のための指標とチェックリスト
カテゴリー | 何を追跡するか | グッドプラクティス |
---|---|---|
圧力 | 冷たい通路から部屋までΔP、ラック面ΔP | ノードが近隣から「風を吸わない」ように、安定したセットポイントを維持する。 |
流れ方向 | インレットで逆流を検知 | 問題ラックの方向性プローブ、フローフリップのアラーム |
吸気温度 | ラック単位ではなくノード単位 | 変動に従え:スイングは平均と同じくらい重要だ |
ファンのヘッドルーム | % RPM対最大 | バーストが天井に激突しないようにマージンを残す |
バイパス制御 | Uスペースの%を空白に、ダミーソリ使用 | 100%、空車で空振り。 |
シュラウドフィット | 目視+スモーク+(あれば)クイックCFD | CPU/GPUのリフレッシュ後に再シュラウド。 |
小さな "間違い "だが、現実だ: やめて ケーブルグロメットは忘れてください。あの小さなスロットは、全部合わせると大量のCFMを漏らす。それを閉じれば、グラフは落ち着く。

パフォーマンス、アップタイム、そしてビジネスにとって重要な理由
クロストークが少ないということは スロットルイベントの減少, 部品の長寿命化そして ファンのエネルギーを下げる.抽象的ではない。もし サーバーラックPCケース が圧力を維持し、バイパスをブロックすることで、同じパワーエンベロープのもとでクラスターがより安定して動作します。また、規模を拡大しても、同じエアフローを維持できるため、突然の火災訓練が発生することもありません。
IStoneCaseは2つの点で役立ちます:
- 良い骨:漏れないシャシー。私たちの デュアルノード・サーバーケース と大容量の デュアルノード・サーバーケース 2400TB 熱が実際に存在するルートエア。
- カスタムフィット:シュラウドのジオメトリー、ベイシール、スレッドフィラー、プローブマウントのOEM/ODM微調整-だからあなたの コンピューターケースサーバー 現実のサーマルと一致する。それが カスタマイズサーバーシャーシサービス.