GPUは飢えている。ドラマチックに、そして当てずっぽうにならずに、GPUを養ってあげましょう。
マルチGPUサーバーのためのN+1冗長性とA/B電源パス
冗長性は次のことから始まる。 N+1 と考える。モジュールが故障したり、ブレーカーが落ちたりした場合、1つの余分な電源、つまり1つの独立した電源が打撃を受ける。A/B給電の場合、各経路は以下を伝送しなければならない。 ピークの少なくとも半分 だから、片方が死んでも箱はトレーニングを続ける。これが 強い そして クラスタダウン.実際には、ケーブリング、PDU、ブレーカーのサイズを決めて、片側が単独で砦を維持できるようにする。
ワークステーション用ATX 3kW電源:長所と短所
シングル ATX ~3 kW デスクサイドのリグとしてはすっきりしている。4台 12V-2×6 をリードする。 600W/リード プラットフォームとOCPポリシーが許せば、最大4枚のボードを満足させることができる。プラットフォームとOCPポリシーが許せばだが。 atxサーバーケース または コンピューターケースサーバー.
しかし、それは 違う 冗長性。その1台が咳き込むと、仕事が止まってしまいます。また、多くの3kW ATXモデルには 220-240 V 入力と C19 コード。120Vの回路では、すぐに壁にぶつかるだろう。ファンの音も負荷がかかると大きくなる。
クイックフィット:3 kW ATXと深型ATXの組み合わせ GPUサーバーケース ロングカード、ストレートエアフロー、クリーンな12V-2×6ルーティングをサポートする。
ラックサーバー用CRPS/2U冗長PSUモジュール
ホットスワップと実際のフェイルオーバーが必要な場合は、次のようにしてください。 CRPS/2U冗長.2つ以上の2-3kWのモジュールがバックプレーンにスライドし、負荷を分担する。あなたは PMBus テレメトリー、 障害LEDそして N+1 または N+N レイアウト。効率?しばしば チタン・クラスこれにより、上流の熱予算とファンノイズを節約できる。
ボックス・イット・ライト サーバーラックPCケース ような 4U GPUサーバーケース または 5U GPUサーバーケース は、CRPSキャニスター、ミッドプレーンファン、ストレートショットケーブルトレイのためのスペースを残している。
OCP ORv3 48Vラック電源(3kW整流器、15~18kWシェルフ)
もっと大きくなる? OCP ORv3 にACをプッシュする。 48Vバス ラックにある。各整流器は 3 kW棚には5-6個のモジュールが収納されている。 N+1.その後、ノード内でダウンコンバートする。これはデスクトップのトリックではなく、クラスタのラックレベルアーキテクチャだ。アップタイム、高速スワップ、銅損の減少など、利点はたくさんある。
ポッドを作る場合は、ORv3シェルフを以下のものに合わせる。 6U GPUサーバーケース 高密度冷却のためのノード。

2電源の分割負荷は冗長性ではない
シンクボードで "2つのATX電源 "を使う人が時々いる。書類上では問題ないように見える。それでも 違う 冗長性。PSU-Aが半分のGPUに電力を供給して故障した場合、それらのボードは落下します。さらに悪いことに、1つのGPUを2つのPSUからクロスフィードしないでください。保管 GPU1基=PSUレール1セット.どうしても分けなければならないなら、そうすることだ 1台あたり決してコネクターごとではない。
電源入力の現実チェック:120V対240V、C19、分岐回路
3kWの連続使用電力 120 V / 20 A 回路は長時間の使用には耐えられません。安全な連続電流は、それ以下でディレーティングされます。3kWに近いリグでは、次のように計画してください。 220-240 V, C19 コンセント、PDUの定格をご確認ください。ラックの場合、以下のように分配します。 A/B PDU Aのブレーカーが落ちても火曜日が台無しにならないように。つまらなそうだが、週末を節約できる。
コネクタ計算:12V-2×6、600W/リード
新しい 12V-2×6 (PCIe 5.x)。予算 ケーブルあたり600W.コネクタとカードでサーマルヘッドルームを確保する。ケーブルの被覆が焼けないように、短く配線し、きつい屈曲を避け、排気経路を確保すること。
2-3 kWのオプション一覧
オプション | パワーレンジ | 冗長性 | インプット | ホットスワップ | 代表的なシャーシ | いつ選ぶべきか | ソースノート |
---|---|---|---|---|---|---|---|
シングルATX ~3 kW | 2.5~3.0 kW | いいえ | 220-240 V (c19) | いいえ | atxサーバーケースデスクサイド・タワー | 失敗が少ない、コスト重視のラボ、迅速な製造 | ベンダーのデータシート |
デュアルCRPS(2×2-3kW) | 2-6 kW | N+1 | 200-240 V | はい | 4U/5Uラックマウント | アップタイム優先、現場での交換が可能 | CRPSデザインガイド |
ORv3 48Vシェルフ | 15-18 kWシェルフ | N+1 | AC→48V | はい | ラックバス+4U/6Uノード | クラスタースケール、ラックパワーの統一 | OCP ORv3仕様 |
ATXスプリットロード×2 | 1.5~3.0 kW | いいえ | 120/240 V | いいえ | ミックス | 一時的な拡張のみ | 地域社会のベストプラクティス |
外部リンクはなし。

IStoneCaseのハードウェアを使用した実際のビルド
ワークステーション、2-3GPU、最小限の手間
3kWのATXユニットを ISC GPUサーバーケース WS04A2.フロントからバックまでのエアフロー、フルレングスのカードスペース、4つの12V-2×6ドロップへの整然としたケーブル経路が得られます。モデルの微調整、CVパイプライン、またはレンダリングに最適です。手元に240Vの電源がある限り、そのまま使用できる。
4-8GPUラックノード、アップタイムが重要
行く CRPS 内部 ISC GPUサーバーケースWS06A あるいは GPUサーバーケース ファミリー。2~3台のCRPSモジュールで負荷を分担。1台失ってもトレーニングは継続できます。PMBusにより、電力使用量、吸気温度、ファンアラームがライブで表示されます。SREは「ありがとう」と言います。
ポッド対応ラック、クリーンな電源領域
採用 ORv3 の上に構築されたノードに48Vを供給する。 4U GPUサーバーケース または 6U GPUサーバーケース.整流器が胸の高さでホットスワップ可能になった。在庫管理も簡単だ。配線の縮小。そして、各ノードの配線をやり直すことなく、列を拡張できる。複数ラックのフットプリントを計画しているバイヤーにとっては、オペレーションの回数が減り、スループットが向上します。
変わり種ベイ、カスタムスタンドオフ、気難しいアクセラレーター用の特殊バッフルが必要ですか?タップ カスタマイズサーバーシャーシサービス.私たちはレール、ファンウォール、PSUケージを微調整し、BOMがワークロードにマッチするようにします。
デプロイメント・プレイブック(素早く、ふわふわしない)
データセンター
用途 CRPS または ORv3.ワイヤー A/B PDUバーンインウィンドウのために、片側がピークでノード全体を運ぶことを検証する。PMBusで電力を追跡し、吸気温度とファンデルタで警告。予備モジュールを同じ列に配置。数時間ではなく、数分で故障を交換。
オンプレ・ラボ
ダウンタイムが問題なければ シングル3kW ATX スペースとコストを節約。ピーク時の消費電力、ケーブルの本数、エアフローを計算する。まずは壁の電源を確認してください。A サーバーPCケース 静圧の高いファンを搭載したコンシューマー向けタワーは、この点では勝っている。
スタートアップ・オフィス
騒音は重要。リースも同様だ。短いラックで CRPS 机の下ではなく、奥の部屋にノードを置く。大音量のパーツはドアの後ろに置き、開発エリアには長いファイバーを通す。みんながハッピーになり、GPUも忙しくなる。

壊してはいけないケーブリングのルール
- 1つのGPUに1つの電源。2つの電源のレールを1枚のカードに混ぜないでください。
- それぞれの 12V-2×6 アンダー 600 W リード1本につき
- コネクタをロックする。ラッチが外れたと感じたら、ケーブルを交換する。
- 排気から離して配線する。熱風はプラスチックを加熱し、プラスチックは接点を加熱する。
- フェイルオーバーのテスト:CRPSを引き、ノードがトレーニングを続けるのを見る。金曜の夜より今学んだ方がいい。
性能と騒音
高効率モジュールは熱を抑えるため、ファンカーブは穏やかなままです。CRPSのファンは、高負荷時にはまだ鋭くなりますが、これは小型の送風機と背圧のためです。ATX 3 kWユニットは、より大きなファンを使用しており、トーンが滑らかな場合もあれば、そうでない場合もあります。スペックシートだけでなく、耳で測ってください。覚えておいてほしいのは、GPUを6-8基搭載した場合、ノイズのほとんどはアクセラレーターの送風が働いているだけだということだ。静かではありません。
IStoneCase の適合性 (およびバイヤーが当社を選ぶ理由)
IStoneCase ビルド ラックマウント そして デスクサイド エアフロー、カードクリアランス、PSUルーティングをチューニングした筐体。OEM/ODMバッチをサポートし 一括購入 データセンター、アルゴリズムハブ、MSP、研究所、開発ショップ向け。もし サーバーPCケース あるいは、厚手のクーラーを扱う コンピューターケースサーバー CRPSのキャニスターをハックすることなく使用することができます。また、4分の2の熱サイクル後でもねじれないレールとトレイを出荷しています。小さなことですが、大きなアップタイムです。
始めよう GPUサーバーケースにマップする。 GPUサーバーケース ヴァリアント4U, 5U, 6U-とスロットイン WS04A2 または WS06A 奥行きやPCIe人口が必要な場合レイアウトが乱雑な場合は、バッフル、ケーブルコーム、PSUケージまでカスタマイズします。