GPUシャーシにおけるPCIe Gen4とGen5のライザーとバックプレーンに関する考察

あなたはGPUボックスを計画しており、古典的な質問をしている:Gen4のようにパスを扱うべきか、それともGen5をまっすぐに目指すべきか?手短に言えば、初日からGen5を目指して設計することです。Gen5では速度が倍増し(32GT/秒)、マージンが削減されます。これは、ライザー、バックプレーン、ケーブル、コネクター、エアフロー、さらにはカードをどのようにボルトで固定するかにまで影響します。 サーバーラックPCケース.以下では、それをわかりやすく説明し、簡単な表を示し、実際のキーワード(ふわふわしたものではない)を示し、選択肢をIStoneCaseのギアとサービスに結びつけ、実際に出荷できるようにします。


PCIe Gen4とGen5のシグナルインテグリティ予算比較

Gen5 は損失と反射にうるさい。エンドツーエンドの挿入損失バジェットが厳しくなるため、すべてのビア、長いPCBラン、デイジーチェーンコネクタがヘッドルームを食います。Gen4では長いライザーPCBで済むかもしれないが、Gen5では低損失ケーブル(MCIOスタイル)に移行するか、リタイマーを追加することが多い。トポロジーをシンプルに保つ:ルートコンプレックス→最小限のボードトレース→コネクタ→ケーブル→GPU。このチェーンを引き伸ばすと、目が閉じたり、LTSSMがランダムにリトレインされたり、無音でパフォーマンスが低下したりします。面白くない。

また、スキューにも注意すること。差動ペアはペア内マッチングを密にする必要がある。ACキャップを近くに置く。レシーバー付近でのレイヤーバウンスを避ける。CAD上では問題なくても、実験室では噛み付くことがあります。


PCIeライザー(Gen4とGen5)の選択

ライザーの選択は2つのファミリーの間で反転する:

  • PCBライザー (短い、コネクターが少ない):Gen4や非常に短いGen5ホップには問題ない。
  • ケーブル・ライザー (MCIO/SlimSASのような高性能ケーブル):Gen5では、特に高密度な内部での距離のためのデフォルトです。 サーバーPCケース.

アクティブ・パーツはいつ追加するのですか?

  • リドライバー軽いEQ、低レイテンシー。そのチャンネルがすでに良い状態である場合にのみ機能する。
  • リタイマーフルリクロック/リシェイプ。マルチGPUリグで典型的な、より長く、より乱雑なパスを処理する。少しレイテンシが増えますが、そうでなければダウンシフトまたはフラップするリンクを節約できます。

機械的な面では、エアフローを妨げたり、前後の経路を塞いだりしないライザーを選ぶ。4U以上では、フラットなケーブルライザーがシュラウドに沿ってきれいに配線でき、ファンを満足させる。


GPUシャーシ用PCIeバックプレーン設計

バックプレーンは贈り物にも罠にもなる。Gen5は、長いFR-4、ビアファーム、スタックコネクタを罰する。2つの動きが助けになる:

  1. ケーブル化されたバックプレーン長いボード・トレースの代わりにMCIOケーブルを使う。損失とクロストークを減らすことができます。
  2. ミッドスパン・リタイマーリタイマーはチャンネルの電気的な中点付近に配置します。これにより、損失バジェットが分割され、イコライジングが簡単になります。

電源とサイドバンドは早めに計画すること。分岐(x16を2×x8または4×x4に分岐)を行う場合、ライザー/バックプレーンのピンアウトとケーブルマッピングがレーン順をきれいに保つことを確認する。レーンが交差していると、スキューやトレーニングがおかしくなります。


GPU シャーシ 1 における PCIe Gen4 と Gen5 のライザーとバックプレーンの比較

PCIe Gen5用リタイマーとリドライバーの比較

率直に言おう:Gen5は リタイマー.もし、その道が短く、シンプルで、高級な素材があれば、その道は、その素材に合ったものになる。 リドライバー で十分です。しかし、実際のGPUシャーシ(複数のコネクター、長距離、きついカーブ)では、リタイマーがあなたをゴールに導いてくれます。レイテンシ(小さいが、存在する)の予算を立てよう。リタイマーは少ない方が良い。リタイマーが最も仕事をする場所(通常は中央付近)に配置する。そして、冷却すること-小さなパッケージ、小さな熱でないこと。


検証:レーンマージン、アイダイアグラム、コンプライアンス

"リンクする "で終わらせない。次のように レーンマージン 32GT/sでどれだけの安全性があるか確認する。代表的なワーストケースのレーンでアイ・ダイアグラムを実行する。カードを反転させ、トレランス・スタッキングを把握する。Gen4 フォールバックを強制できるファームウェアを含める。また、負荷がかかった状態でエラー・カウンターを見てください。いくつかのチャネルはアイド ル・テストをパスしますが、TDP と熱をフルに使った状態では吐き出してしまいます。これは重要であり、オプションではない。


マルチGPUリグの熱、エアフロー、メカニクス

シグナル・インテグリティは温度が適切でないと失われる。高温のプリント基板は特性を変化させ、マージンを狭める。Gen5 チャネルには、涼しくまっすぐなエアフローを与えてください。FHFLアクセラレータの場合、シュラウドがヒートシンクの周りではなく、ヒートシンクを通るように空気を誘導するようにしてください。ファンの吸気口を詰まらせないように、スムーズなケーブル経路を使用する。レールの場合は、サービスループを計画する。 コンピューターケースサーバー MCIOのハーネスを引っ張らずに出てくる。

ラックのサイズは重要だ:

  • 4U4-8GPUの高密度実装、入念なケーブル配線、タイトなエアフロー制御。
  • 5U / 6Uケーブル化されたバックプレーン、リタイマーボード、より大きなファン壁などのためのより広いスペース。

比較Gen4 vs Gen5ライザー/バックプレーン(クイックテーブル)

トピックGen4 (16 GT/s)Gen5 (32 GT/s)実践編
挿入損失バジェットより寛容によりタイトなエンド・ツー・エンドすべてのコネクタ/ビアを数え、安全マージンを残す
チャンネルの長さ中程度のPCBはOK長いPCBは危険長いFR-4より高性能ケーブルを選ぶ
イコライゼーションしばしばリドライバー専用リタイマー推奨スパンの中間付近に配置する。
スキュー&マッチングタイトタイトより短いペア、より少ないレイヤージャンプ
トポロジーフレキシブルシンプルにルート→コネクター→ケーブル→GPU完了
バリデーションリンクアップテストレーンマージンが必要全負荷でのバーンイン、可能ならホットボックス
サーマル重要クリティカルエアシュラウド、ケーブルルーティング、ファン壁圧

Gen5のルーティングと冷却に余裕のあるシャーシを選ぶことができる。いくつかの出発点:

私たちは、データセンター、AI/アルゴリズムハブ、大企業、中小企業、MSP、ラボ、そして単に機能するものが欲しいビルダーなど、あらゆるバイヤーをサポートしています。もし atxサーバーケース バリアント・チューンド・アクセラレーターの場合、GPUミックスとエアフロー目標をお知らせください。


GPU シャーシ 4 における PCIe Gen4 と Gen5 のライザーとバックプレーンの比較

現実世界のシナリオ(何を作るか、なぜ作るか)

  • HPCクラスタノード(4-8 GPU):4U/5U、シングルミッドスパン・リタイマー付きケーブルライザー、ストレートスルーエアフロー、高速スワップ用レールキットを選択。これは サーバーラックPCケース を800mmラックに収納した。
  • エッジAI推論:短いチャンネル、最小限のコネクター、多分リタイマーなし。ファンノイズを下げるが、カードを飢餓状態にしない。
  • 予算内での研究箱:Gen4は今日から始めるが、Gen5のためにルートと冷却を行う。ケーブルライザーを使用し、マージンに問題がある場合のみリタイマーを追加する。
  • OEMプラットフォーム:を使用する。 カスタマイズサーバーシャーシサービス 構築済みのMCIOルーム、ラベル付きレーン、コンプライアンス・テスト・ドキュメントがあれば、午前2時にオペレーション・チームが11番レーンを探し回る必要はありません。

サーバーPCケース/コンピュータケースサーバー/atxサーバーケースの購入メモ

  • GPUの長さ(FHFL)、スロットピッチ、電源コネクタをチェックします。
  • ライザー/バックプレーンがGen5でカード1枚あたりx16をサポートしているか、または意図する分岐を確認してください。
  • 要求されるエアフローマップとファンカーブ。
  • "はい、リンクしています "だけでなく、レーンマージンのスクリーンショットを要求する。
  • 頻繁に整備を行う場合は、ハーネスのストレイン・リリーフと、スライドアウト・レール用のケーブル長に余裕を持たせてください。

ハンズオン・チェックリスト(これをあなたのビルド・ドキュメントにコピーしてください。)

  1. すべてのコネクタを含むフルパス(CPUからGPUまで)を描画します。
  2. 実際の部品番号で損失を予算化する。
  3. ケーブル化されたライザーを使用し、ルートコンプレックスとGPU付近のPCBトレースを短くする。
  4. 追加 リタイマー 必要なところだけ、スパンの中間付近に置き、冷やす。
  5. ディファレンシャルペアのルールを早期にロックする(スキュー、スペーシング、ビアカウント)。
  6. バーンインでのレーンマージンとアイチェックによる検証。
  7. ファンをふさがないようにケーブルを配線する。ジップタイアンカーが役立つ。
  8. ファームウェアにGen4のフォールバックスイッチを入れておく。
  9. レーンマッピングを文書化し、ハーネスの端にラベルを貼る。
  10. 出荷前:シェイクテスト、ヒートソーク、再マージン。はい、もう一度。

IStoneCaseがこの仕事に適している理由

GPUを構築し サーバーPCケース ケーブルに優しい内部構造、直線的なエアフロー経路、厄介なブラケットを使用しないリタイマー用のスペースなど、Gen5の痛みを最初から想定したプラットフォームです。OEM/ODMとして、当社はバックプレーン、MCIOの長さ、ファントレイ、レールをお客様のラックの奥行きとサービススタイルに合わせて調整します。カードリストとラックプランをお知らせいただければ、面倒なことはお任せください。

GPUとスロットにマッピングされた簡単な仕様と部品表が必要ですか?上のリンクをクリックし、4U/5U/6Uのスタートポイントを選んでください。ロケット科学ではありませんが、Gen5は厄介なものです。

お問い合わせ

完全な製品ポートフォリオ

GPUサーバーケースからNASケースまで、あらゆるコンピューティングニーズに対応する幅広い製品を提供しています。

オーダーメイド・ソリューション

お客様独自の要件に基づき、カスタムサーバーケースやストレージソリューションを作成するOEM/ODMサービスを提供しています。

包括的サポート

当社の専門チームは、すべての製品のスムーズな納入、設置、継続的なサポートを保証します。