ダウンタイムは高くつく。.
によると Uptime Instituteの年間障害分析2024のエグゼクティブサマリー, また、深刻で深刻なデータセンター停止の最も一般的な原因として、電力問題が常に挙げられています。つまり、“冗長化 ”設計が機能しているか、あるいは積極的に嘘をついているかのどちらかです。.
では、なぜチームはいまだに冗長電源をチェックボックス扱いしているのだろうか?
単刀直入に言うと、業界は「1+1電源の冗長性」ハードウェアに過剰な投資をしている。そして、接触抵抗、エアフローマージン、ロードシェアリングポリシー、フェイスプラントモジュールになる前にモジュールが瀕死であることを知らせるファームウェア/テレメトリー配管など、退屈な統合作業への投資が不足している。こうして、2つのホットスワップ可能な冗長PSUモジュールと1つの単一障害点(バックプレーンまたはサーバーシャーシの配電盤)ができあがる。.
そう、それは大きな施設でも起こることなのだ。2024年2月に, ロイター通信がアプライド・デジタルのエレンデールの障害について報じた。 1月18日に始まり、1月19日までに完全な停電となったが、ユーティリティの「安定性」アップグレードはまだ進行中であり、同社は収益に重大な影響を及ぼすだろうと述べた。.
データセンターが電源パスの不安定性で暗転する可能性があるのなら、狭い1UボックスがPSUのブラウンアウトやバックプレーンのアーク放電でどうなると思いますか?

検索の背後にある意図(そして、そのために最適化すべきこと)
冗長電源を1U/2Uサーバーシャーシに統合する」、あるいは「冗長電源を1U/2Uサーバーシャーシに統合する方法」と入力する人は、ロゴバッジを求めているわけではない。彼らが求めているのは、A/B給電の配線方法、冗長電源装置のバックプレーンの取り付け方法、ホットスワップ動作の検証方法、PMBusの読み取り方法、そしてシャーシの設計が両者を結合しているために両電源装置が “一緒に ”故障するという古典的な罠を回避する方法といったプレイブックである。.
手短に言えば、これはオペレーション・エンジニアリングであり、パーツ・ショッピングではない。.
1U/2Uにおける「冗長電源」の実際の意味
3つの言葉:独立電源パス。.
実際の1+1構成では、どちらかのPSUが全負荷(または少なくとも定義されたクリティカルな負荷)を担っている間、もう一方のPSUが停止しているか、故障しているか、交換されている必要があり、切り替えは、バーゲンスプリングコンタクトの1つのコネクタブロックを通る保護されていないPCBトレースに依存することはできません。MTTR(平均修理時間)は数時間ではなく、数分で測定されます。.
ここでシャーシが重要になる。1Uシャーシでは、多くの場合、1U専用PSU、短いハーネス、きつい曲げ半径、より少ないヒートシンクの質量を余儀なくされます。2U冗長PSUセットアップでは、CRPSモジュール、より厚い銅製バックプレーン、適切なエアフローチャネルに余裕ができます。.
ハードウェアを選ぶのであれば、曖昧なマーケティングではなく、冗長電源のサポートが明示されているシャーシから始めましょう。インテグレーターは、カテゴリー・ページをカンニング・シートのように活用しています。 デュアル冗長電源をサポートする1Uサーバーケースオプション そして ラック環境に対応した2Uサーバーケースのラインナップ.
バックプレーンについての厳しい真実:他のボードと同じように故障する
バックプレーンは魔法ではない。低電圧で大電流を流すことを余儀なくされる銅、メッキ、コネクターを備えたプリント基板であり、その組み合わせは容赦がない。.
ティアダウンの写真やRMAサマリーで繰り返し見られる典型的な故障モード:
- コネクターの摩耗+マイクロアーシング: ホットスワップが繰り返され、わずかなミスアライメントが生じれば、孔食が生じ、熱を持ち、暴走する。.
- アンダービルトの銅: “「2オンスの銅」と「1オンスの銅」は、12V、80-120Aにおけるブティックの選択ではなく、暖かいボードと調理されたボードの違いである。.
- センスの悪い配線: リモートのセンスライン(とそのリターン)が後回しに配線されているため、負荷ステップでPSUがオーバーコンペンセーションを起こす。.
- 熱債務: 1Uのエアフローは残酷で、ドライブケージの後ろの淀んだポケットに置かれたバックプレーンは、周囲温度が上昇し、老化が早まる。.
ISC-SC278S-H25-TはCRPS冗長電源モジュールと保護機能付き12Gb/秒MiniSAS-HDバックプレーンとの互換性を謳っている。スペックへのリンク CRPS冗長PSUモジュールと互換性のある2Uシャーシ.

ほとんどのチームがスキップする電気統合チェックリスト
良い統合は繰り返し行われる。だから人々はそれをスキップする。そして、だからこそ故障が繰り返されるのだ。.
1 入力側:A/Bを大人扱いする
- 2つのPDU(AとB)を使い、理想的には2つのアップストリーム回路を使い、オンコール生活がかかっているようにラベルを付ける。.
- 入力範囲の確認:多くの高ワットユニットは、AC200-240VとIEC C19を必要とする。.
- 効率を追求するのであれば、80PLUS Titaniumは負荷が~50%あたりで最高の数値を出すことを覚えておいてほしい。.
2 出力側:回路図ではなく電流経路を設計する
- 12Vバスは短く、広く、機械的に固定しておくこと。12Vでは、数ミリオームがヒーターになる。.
- 適切なOR-ing/理想ダイオード制御を使用し(特にソースをミックスする場合)、PSUの内部OR-ingがシャーシのトポロジーと一致すると思わないこと。.
- シャーシがサーバーシャーシの配電盤(PDB)を使用している場合は、5VSB コンバータ、PS_ON# 用のロジックレール、両方のファンヘッダーに供給されるトレース、ヒューズになる「巧妙な」グラウンドの 1 つなど、1 点の障害を探します。.
3 テレメトリー:PMBusは早期警告システム
VIN、IIN、POUT、温度、ファン回転数、故障履歴を報告できるPMBus冗長電源は、ファン電流の上昇、一定負荷での内部温度の上昇、あるいは毎週「共有」するモジュールが少なくなるといった故障前のシグナルを与えてくれる。これが、予定された交換と突然の再起動との違いです。.
シャーシの外観が必要な場合は、次のようになります。 ISC-R166-4-M 1Uサーバーケース、冗長電源対応 というのも、フォームファクター(482×660×44.5mm)と実際に内部に組み込む制約が明示されているからだ。.
1U対2U:誰も正しい価格をつけたがらない統合トレード
1U冗長電源の設計は、規律に関わる問題である。エアフロー、コネクター間隔、サービスの人間工学を犠牲にし、より厳しい機械的許容差とより良い監視でそれを取り戻せるかどうかに賭けているのだ。.
2U冗長PSU設計はマージンの問題である。適切に行うためのスペースはあるが、チームはそのスペースをより多くのドライブ、より多くのライザー、より多くのケーブルで埋めてしまう。.
毒を選べ。.
比較表:一般的な冗長PSUの統合パターン
| パターン | 典型的なハードウェア | ホットスワップ動作 | 共通の故障点 | フィットする場所 |
|---|---|---|---|---|
| 1U「デュアル・リダンダント“ | 1U専用PSU+バックプレーン | 通常は可能だが、クリアランスに影響される | バックプレーンコネクタの磨耗、エアフロースターベーション | タイトラック、エッジノード、テレコムシェルフ |
| 2U CRPSモジュール | 2×CRPS + リダンダントPSUバックプレーン | はい、ツールレスモジュール交換 | バックプレーンの銅線/OR-ing、ロードシェアポリシーの設定ミス | ストレージ、仮想化、混合PCIe |
| シングルATX “大型PSU” | 1× 1-3 kW ATX | いいえ | 単一PSU、単一入力、単一ファン経路 | ラボ、開発リグ、コスト最小ビルド |
| デュアルATX+シンクボード | 2×ATX + ロードスプリットボード | 時々(しかし醜い) | 1つのPSUで冗長性-デバイスレベルの損失はない | 一部閉鎖を受け入れる場合のみ |
| ORv3ラックパワー | 48Vシェルフ+ノードコンバーター | ラック・レベル | コンバーターステージ、ラックバス保護 | クラスター、AIポッド、高密度ラック |
もしあなたが2-3kWの世界で生きているのなら、推測は禁物だ。 マルチGPUワークロード用の冗長2-3kW PSUオプション, 特に、“2基のPSUによる分割負荷は冗長性ではない ”という警告だ。”
大きな背景:電力ストレスの増加、それはラック内部に現れる
シャーシレベルの冗長電源の決定が、グリッドレベルの制約と衝突しているのだ。2024年12月には 米国エネルギー省によるLBNLデータセンター・エネルギー報告書の要約 によると、データセンターは2023年に米国で約4.4%の電力を使用し、2028年には約6.7%〜12%に達すると予測されており、データセンターの総電力使用量は2028年までに325〜580TWhに増加すると推定されている。.
供給が逼迫しているとき、電力品質が悪化することは稀ではない。.
つまり、1U/2Uサーバー・シャーシ内の冗長性は、“PSUが死んだ ”ということだけではないのだ。醜い入力を乗り切り、変換を安定させ、独自の保護回路が最初にトリップするのを防ぐことなのだ。.

よくある質問
1U/2Uサーバーシャーシの冗長電源とは何ですか?
1U/2Uサーバーシャーシの冗長電源は、デュアルモジュールのPSUシステム(多くの場合、1+1またはN+1)で、片方のPSUが取り外されたり、故障したり、ホットスワップされたりした場合でも、サーバーが定格負荷で稼働し続けることができるように設計されています。.
実際の負荷(例えば70-90%の合成負荷)の下で1つのモジュールを取り出し、ボックスがリブートしないこと、ファンが正常であること、ログがクリーンなフェイルオーバーイベントを示していることを確認します。.
1+1電源の冗長性とは何ですか?
1+1電源装置冗長化とは、同一の電源装置が2つ設置され、どちらか一方が単独でサーバーの全負荷を担える一方、もう一方は負荷を分担するかスタンバイ状態を維持する構成であり、バックプレーンと入力給電が独立していることを前提に、運用中に1つのモジュールが故障したり、プラグが抜かれたり、交換されたりしても、システムは動作を継続する。.
もし「1+1」がOCPトリップを避けるために両方のPSUを必要とするなら、冗長性ではなく、脆弱なデュアル電源システムを構築していることになります。.
冗長PSUバックプレーンとは何ですか?
冗長PSUバックプレーンは、ホットスワップモジュールを受け入れ、負荷共有のためにDC出力を分離・結合し、12Vや5VSBなどのレールと制御信号(PS_ON#、PWR_OK)を分配する高電流PCBとコネクタアセンブリです。.
消耗品と同じように扱い、点検し、温度を監視し、接触品質をケチらないこと。.
冗長電源のPMBusとは何ですか?
冗長電源装置上のPMBusは、デジタル管理インターフェイス(通常はI²C/SMBus上のPMBus 1.2/1.3)であり、電圧、電流、電力、温度、ファン速度、イベント履歴などのリアルタイムの測定値や障害ログを公開するため、オペレータは負荷分散を確認し、障害を予測し、PSUがトリップしたり、熱でサイレントになったりする前に警告しきい値を設定することができます。.
PMBusのテレメトリーなしで走っているのであれば、“高可用性 ”と称して盲目的に飛んでいることになる。”
シンクボードに2つのATX電源を使用することは、本当の冗長性ですか?
シンクボードで2つのATX PSUを使用するのは、各電源がコンポーネントのサブセットに電力を供給する負荷分割配線のトリックであるため、1つの故障で通常はその半分が停止し、残りが不安定になる可能性があります。通常、1つのPSUではシステムの全負荷をきれいに運ぶことができないため、真の1+1冗長ではありません。.
アップタイムが必要な場合は、専用の冗長PSUバックプレーンまたはCRPS設計を使用し、ホットスワップ動作を検証してください。.
結論
1U/2Uボックスの設計で、現実の電力事情に耐えうる冗長性を求めるのであれば、冗長PSUのサポートと保守性を明示したシャーシから始めましょう。 コンパクトな冗長PSU構築用1Uサーバーケースカテゴリー そして CRPSと大電流パスに適した2Uサーバーケース, そして、ワット数を選ぶ前に、バックプレーンとPMBusプランを指定する。.
また、金属を購入する前に、レイアウト、エアフロー、A/B給電プランのチェックを誰かに依頼したい場合は、ISTONECASEのシャーシページから見積もりとエンジニアリングレビューを依頼してください。.



