ノード間の熱クロストークと気流隔離

あるノードがバースト的なジョブを実行し、ファンが暴れ、近くのノードが「正当な」理由もなく熱くなり、スロットリングが忍び込む。それは 熱クロストーク.解決策は魔法ではなく、エアフローを律するだけだ。この記事では、実際のラックライフと結びつけ、わかりやすく、実践的に説明する。また IStoneCase なぜなら、エアフローのルールを尊重するハードウェアは、後で頭痛の種を避けることができるからだ。

注:一般的なDC用語(コールド・アイル・コンテインメント、ΔP、バイパス・エア、リサーキュ、シュラウド、ダミー・ソリ)を使用する。


ノード間の熱クロストーク

隣接するソリが圧力平面を共有する場合、「ハングリー」ノードは次のことができる。 スティールインテーク 静かな」隣人から。閉鎖的な通路では、これは次のようになる。 限られた冷気供給競争.結果:吸気温度の上昇、ファン回転数の変動、ベンチでは再現できない奇妙な性能低下。

コールドアイルの封じ込めとエアフロー競争

封じ込めは素晴らしいが、バランスのハードルを上げてしまう。十分な 静圧 穴のあいたタイル(またはフロントドア)のところにある 逆流 そして 熱風循環.簡単に言うと、供給が追いつかない場合、ノード同士がエアフローを食い合う。ノードAがスパイクしているのにノードBが熱いのはなぜか?


ノード1間の熱クロストーク気流隔離

ノード間の気流隔離

孤立 空気を強制的に移動させることでクロストークを減少させる を通して 各ノード 周辺 それ考える:フィットしている エアシュラウド, ブランキングパネル密閉されたケーブルカット ダミー/ブランク・ソリ を空のベイに入れる。そうすることで、卑劣なバイパス経路をカットし、各ノードのインテークを安定させることができる。

エアシュラウド、ブランキングパネル、ダミーソリ

  • エアシュラウド CPU、DIMM、NVMe、VRMの上に冷風を送ることができる。
  • ブランキングパネル 空いたU字スペースを通る前後短絡の流れを止める。
  • ダミーソリ マルチノード・シャーシで空きスロットがリークにならないようにする。
  • ケーブルバッフル&ガスケット 大したことではない」ギャップを埋める。

圧力制御と気流方向モニター

温度は一人で見てはいけない。見る 圧力 そして 流れの方向 通路で、できればラックごとに。シンプルな ΔP設定値 コールドアイルとラックフェイスを横切ることで、ヨーヨー効果が軽減される。CRAH/CRACが対応している場合は、以下を実行してください。 圧力制御 (温度はガードレールとして機能する)そのため、仕事量が急増するたびにノードが空気の奪い合いになることはない。


ワークロードを考慮したサーマル・オーケストレーション

ソフトウェアも役立ちます。隣の2台が同時にターボをかけると、同時にエアフローを引っ張ることになる。スケジューラーを使って 激務をこなすまた、密に詰め込まれたソリで過渡的なターボに上限を設定したり、すでにファンの限界に達しているクラスタからとがったタスクを移行したりすることもできます。派手に聞こえるかもしれないが、「通路のΔPが低いときには、隣接するベイに2つの最大TDPジョブを同居させない」という単純なルールがある。


現場で検証されたクレーム、症状、修正(IStoneCase fitを使用)

主張(何が真実か)ラックの中身実際に修正するものIStoneCase が役立つところ
ノードは格納容器内の限られた冷気を奪い合うインレット温度が4~8℃変動、ファンが追走、バースト時にスロットルが現れる通路の維持 ΔP暑い列のある場所にタイルのCFMを追加し、ドアの穴を確認する。を使用する。 密閉性の高いシャーシ私たちの デュアルノード・サーバーケース タイトシュラウドとベイシールのある船
バイパス・パスがクロストークを引き起こす空いたU字スペース付近のホットスポット、"謎の "暖かい吸気口ブランキングパネル ケーブルグロメットも例外ではないIStoneCaseのシャーシ+ラックキットは、実際にフィットするパネルとペアになっている。
空のソリ=巨大なリークインレットを保持するために、隣のノードはより高いファン回転数を必要とするインストール ダミー/ブランク・ソリ圧力経路を連続的に保つのマルチノードオプション デュアルノード・サーバーケース 2400TB フィラー・ソリを含む
アップグレード後のシュラウドの不一致CPU/GPU交換後、"理由なく "温度が上昇再仕様 エアシュラウド スモーク/CFDとの適合性を検証する。私たちの OEM/ODM チームは実際の熱源をマッピングしている。 カスタマイズサーバーシャーシサービス
温度センサーだけ?遅いファンの遅れ、崖っぷちの後のアラーム追加 ディレクショナル・フロー そして 圧力 プローブ;ΔPのコントロールプローブの前面取り付けに対応したシャーシ。
ノード2間の熱クロストーク気流隔離

実践シナリオ(チームが実際に行っていること)

  • ギアが混在するエッジラック:一人 コンピューターケースサーバー ストレージが重く、隣はコンピュートが重い。ストレージは低CFMで、コンピュートはスパイキーだ。シュラウドとブランキングパネルで隔離し、最小ΔPを設定することで、コンピュートスレッドがサージ時にストレージスレッドを飢えさせないようにする。コンパクトな atxサーバーケース吸気ジオメトリーを調整することができる。 カスタマイズサーバーシャーシサービス.
  • 4ノードシャーシ、1ベイ空:大丈夫だと思ってるでしょ。大丈夫じゃない。その隙間がバイパスになるんだ。その隙間がバイパスになる。 ダミーそり そして、近隣のCPUインレット温度が下がるのを見る。私たちの デュアルノード・サーバーケース ブランクフィラーをサポートしているため、"オープンマウス "ベイを使用することはありません。
  • 高密度GPU通路:ファンはすでにうるさい。ケーブルの切り欠きを塞ぎ、ドアのCFMを確認し、次に進む。 圧力ベース 冷却制御。タイトな サーバーPCケース を経由して、実際のGPUの高さをクリアするためにシュラウドをOEMします。 カスタマイズサーバーシャーシサービス.
  • MSPへの展開:混在する顧客、混在する荷物、1つの請求書。不測の事態は避けたい。設計上エアフローを維持するシャーシを標準化。当社の デュアルノード・サーバーケース 2400TB 隣のノードをスペースヒーターにすることなく、高いスループットを維持する。

気流隔離のための指標とチェックリスト

カテゴリー何を追跡するかグッドプラクティス
圧力冷たい通路から部屋までΔP、ラック面ΔPノードが近隣から「風を吸わない」ように、安定したセットポイントを維持する。
流れ方向インレットで逆流を検知問題ラックの方向性プローブ、フローフリップのアラーム
吸気温度ラック単位ではなくノード単位変動に従え:スイングは平均と同じくらい重要だ
ファンのヘッドルーム% RPM対最大バーストが天井に激突しないようにマージンを残す
バイパス制御Uスペースの%を空白に、ダミーソリ使用100%、空車で空振り。
シュラウドフィット目視+スモーク+(あれば)クイックCFDCPU/GPUのリフレッシュ後に再シュラウド。

小さな "間違い "だが、現実だ: やめて ケーブルグロメットは忘れてください。あの小さなスロットは、全部合わせると大量のCFMを漏らす。それを閉じれば、グラフは落ち着く。


ノード間の熱クロストーク気流隔離 3

パフォーマンス、アップタイム、そしてビジネスにとって重要な理由

クロストークが少ないということは スロットルイベントの減少, 部品の長寿命化そして ファンのエネルギーを下げる.抽象的ではない。もし サーバーラックPCケース が圧力を維持し、バイパスをブロックすることで、同じパワーエンベロープのもとでクラスターがより安定して動作します。また、規模を拡大しても、同じエアフローを維持できるため、突然の火災訓練が発生することもありません。

IStoneCaseは2つの点で役立ちます:

  1. 良い骨:漏れないシャシー。私たちの デュアルノード・サーバーケース と大容量の デュアルノード・サーバーケース 2400TB 熱が実際に存在するルートエア。
  2. カスタムフィット:シュラウドのジオメトリー、ベイシール、スレッドフィラー、プローブマウントのOEM/ODM微調整-だからあなたの コンピューターケースサーバー 現実のサーマルと一致する。それが カスタマイズサーバーシャーシサービス.

お問い合わせ

完全な製品ポートフォリオ

GPUサーバーケースからNASケースまで、あらゆるコンピューティングニーズに対応する幅広い製品を提供しています。

オーダーメイド・ソリューション

お客様独自の要件に基づき、カスタムサーバーケースやストレージソリューションを作成するOEM/ODMサービスを提供しています。

包括的サポート

当社の専門チームは、すべての製品のスムーズな納入、設置、継続的なサポートを保証します。