Integration redundanter Stromversorgungen in 1U2U-Serverchassis

Integration redundanter Stromversorgungen in 1U/2U-Server-Gehäuse

Redundante Netzteile werden als Versicherung für die Betriebszeit verkauft, doch die meisten Ausfälle haben ihren Ursprung in Fehlern im Stromnetz, nicht in “Pech”. Hier erfahren Sie, wie Sie redundante 1U/2U-Netzteile richtig integrieren - mechanisch, elektrisch und betrieblich.

Ausfallzeiten sind teuer.
Nach Angaben der Zusammenfassung der jährlichen Ausfallanalyse 2024 des Uptime Institute, 54% der Betreiber gaben an, dass ihr letzter signifikanter Ausfall mehr als $100.000 und 16% mehr als $1 Million betrug, und Stromversorgungsprobleme werden immer wieder als häufigste Ursache für schwerwiegende und schwerwiegende Ausfälle von Rechenzentren genannt - was bedeutet, dass Ihr “redundantes” Design entweder seine Aufgabe erfüllt oder Sie aktiv belügt.
Warum also behandeln die Teams eine redundante Stromversorgung immer noch wie eine Checkbox?

Ich will ganz offen sein: Die Industrie bezahlt zu viel für “1+1-Netzteilredundanz”-Hardware und investiert dann zu wenig in die langweilige Integrationsarbeit - Kontaktwiderstand, Luftstromspanne, Lastverteilung und die Firmware-/Telemetrietechnik, die Ihnen sagt, dass ein Modul stirbt, bevor es den Geist aufgibt. So kommt es, dass man zwei glänzende, im laufenden Betrieb austauschbare, redundante Netzteilmodule und einen einzigen Fehlerpunkt hat: die Backplane oder die Stromverteilungskarte des Servergehäuses.

Und ja, das passiert auch in großen Einrichtungen. Im Februar 2024, Reuters berichtete über den Ausfall von Applied Digital in Ellendale die am 18. Januar begann und sich bis zum 19. Januar zu einem kompletten Ausfall ausweitete, waren noch immer “Stabilitäts”-Upgrades im Gange, und das Unternehmen erklärte, dass die Einnahmen erheblich beeinträchtigt würden.
Wenn ein Rechenzentrum wegen einer Instabilität des Stromversorgungsnetzes ausfallen kann, was glauben Sie dann, was ein beengter 1U-Kasten macht, wenn ein Netzteil ausfällt und die Backplane einen Bogen macht?

Integration redundanter Stromversorgungen in 1U2U-Serverchassis

Die Absicht hinter der Suche (und worauf Sie optimieren sollten)

Wenn jemand “Integration redundanter Stromversorgungen in 1U/2U-Servergehäuse” oder “Wie man redundante Stromversorgungen in ein 1U/2U-Servergehäuse integriert” eingibt, sucht er nicht nach einem Logo-Abzeichen. Sie wollen ein Handbuch: wie man A/B-Einspeisungen verdrahtet, wie man eine redundante Netzteil-Backplane montiert, wie man das Hot-Swap-Verhalten validiert, wie man den PMBus liest und wie man die klassische Falle vermeidet, bei der beide Netzteile “zusammen” ausfallen, weil das Gehäusedesign sie koppelt.

Kurz gesagt: Es geht um Betriebstechnik, nicht um Teilekauf.

Was bedeutet eigentlich “redundante Stromversorgung” bei 1U/2U

Drei Worte: unabhängige Stromwege.

In einer echten 1+1-Konfiguration muss eines der beiden Netzteile die volle Last (oder zumindest die definierte kritische Last) tragen, während das andere abwesend ist, ausfällt oder ausgetauscht wird, und die Umschaltung kann nicht von einer ungeschützten Leiterbahn auf der Platine abhängen, die durch einen Anschlussblock mit günstigen Federkontakten verläuft. Sie entwerfen eine MTTR (mittlere Reparaturzeit), die in Minuten und nicht in Stunden gemessen wird.

Hier kommt es auf das Gehäuse an. Ein 1-HE-Gehäuse zwingt Sie oft zu 1-HE-spezifischen Netzteilen, kürzeren Kabelbäumen, engeren Biegeradien und weniger Kühlkörpermasse; ein 2-HE-Setup mit redundanten Netzteilen bietet Ihnen mehr Platz für CRPS-Module, eine dickere Kupfer-Backplane und vernünftige Luftstromkanäle.

Wenn Sie sich für Hardware entscheiden: Beginnen Sie mit Gehäusen, die ausdrücklich redundante Netzteile unterstützen, und nicht mit vagem Marketing. Integratoren stützen sich auf Kategorieseiten wie auf einen Spickzettel, weil sie zeigen, was physisch unterstützt wird - siehe die 1U-Servergehäuse-Optionen, die zwei redundante Netzteile unterstützen und das breitere 2U-Servergehäuse für Rack-Umgebungen.

Die harte Wahrheit über Backplanes: Sie fallen aus wie jede andere Platine auch

Backplanes sind keine Zauberei. Es handelt sich um Leiterplatten mit Kupfer, Beschichtungen und Anschlüssen, die gezwungen sind, hohe Ströme bei niedriger Spannung zu übertragen, und diese Kombination ist unnachgiebig.

Typische Fehlermodi, die in Teardown-Fotos und RMA-Zusammenfassungen wiederkehren:

  • Steckerverschleiß + Mikro-Arcing: Wiederholte Hot-Swap-Zyklen, geringfügige Fehlausrichtung, und es kommt zu Lochfraß, dann zu Hitze und schließlich zum Durchgehen.
  • Unzureichend ausgebautes Kupfer: “2 oz Cu” gegenüber “1 oz Cu” ist bei 12 V und 80-120 A keine Boutique-Entscheidung; es ist der Unterschied zwischen einem warmen und einem gekochten Brett.
  • Schlechter Sinn der Verkabelung: Remote-Sense-Leitungen (und deren Rückleitung), die wie nachträglich verlegt wurden, was dazu führt, dass das Netzteil bei Laststufen überkompensiert.
  • Thermische Schulden: Der 1U-Luftstrom ist brutal; eine Backplane, die in einer stagnierenden Tasche hinter den Laufwerkskäfigen sitzt, sieht eine erhöhte Umgebung und altert schneller.

Wenn Sie ein konkretes Beispiel für ein Gehäuse suchen: Das ISC-SC278S-H25-T weist auf die Kompatibilität mit redundanten CRPS-Stromversorgungsmodulen und einer 12-Gb/s-MiniSAS-HD-Backplane mit Schutzvorrichtungen hin; das sagt mir, dass das Designteam die Integration der Backplane als erstklassiges Merkmal und nicht als Zubehör betrachtet. Link für technische Daten: 2U-Gehäuse kompatibel mit redundanten CRPS-Netzteilmodulen.

Integration redundanter Stromversorgungen in 1U2U-Serverchassis

Checkliste für die elektrische Integration, die die meisten Teams auslassen

Gute Integration ist repetitiv. Deshalb wird sie übersprungen. Und deshalb kommt es immer wieder zu Ausfällen.

1 Eingangsseite: A/B wie Erwachsene behandeln

  • Verwenden Sie zwei getrennte PDUs (A und B), idealerweise zwei getrennte Upstream-Stromkreise, und kennzeichnen Sie sie so, als ob Ihr Leben im Bereitschaftsdienst davon abhinge.
  • Überprüfen Sie die Eingangsbereiche: Viele Geräte mit hoher Leistung benötigen 200-240 VAC und IEC C19; 120-VAC-Labors entdecken dies gerne um 2 Uhr morgens.
  • Wenn Sie nach Effizienz streben, denken Sie daran, dass 80 PLUS Titanium seine besten Werte bei einer Last von ~50% erreicht; übergroße Netzteile, die bei 10-15% laufen, können weniger effizient und lauter sein.

2 Ausgangsseite: Entwerfen Sie den Strompfad, nicht den Schaltplan

  • Halten Sie den 12-V-Bus kurz, breit und mechanisch gesichert; bei 12 V sind ein paar Milliohm eine Heizung.
  • Verwenden Sie gegebenenfalls eine korrekte ODER-Verknüpfung/ideale Diodensteuerung (insbesondere beim Mischen von Quellen), und gehen Sie nicht davon aus, dass die interne ODER-Verknüpfung des Netzteils mit Ihrer Chassis-Topologie übereinstimmt.
  • Wenn das Gehäuse eine Stromverteilungsplatine (PDB) für das Servergehäuse verwendet, suchen Sie nach Einzelpunktfehlern: ein 5VSB-Wandler, eine Logikschiene für PS_ON#, eine Leiterbahn, die beide Lüfterleisten versorgt, ein “cleverer” Erdungspunkt, der zu einer Sicherung wird.

3 Telemetrie: PMBus ist das Frühwarnsystem

Ein redundantes PMBus-Netzteil, das VIN, IIN, POUT, Temperatur, Lüfterdrehzahl und Fehlerhistorie melden kann, gibt Ihnen Vorab-Ausfallssignale: steigender Lüfterstrom, steigende interne Temperatur bei konstanter Last oder ein Modul, das jede Woche weniger “teilt”. Das ist der Unterschied zwischen einem geplanten Tausch und einem überraschenden Neustart.

Wenn Sie die Fahrgestellansicht benötigen: die ISC-R166-4-M 1U-Servergehäuse mit Unterstützung für redundante Netzteile ist die Art von Datenblatt, die ich mag, weil sie explizit auf den Formfaktor (482×660×44,5 mm) und die Einschränkungen, die Sie tatsächlich in das Gerät integrieren, eingeht.

1U vs. 2U: der Integrationshandel, den niemand richtig bewerten will

Das Design eines redundanten 1U-Netzteils ist ein Disziplinproblem: Sie verzichten auf Luftstrom, Steckerabstände und Service-Ergonomie und setzen darauf, dass Sie dies durch engere mechanische Toleranzen und bessere Überwachung zurückgewinnen können.

Ein 2U-Design mit redundantem Netzteil ist ein Randproblem: Man hat Platz, um es richtig zu machen, aber die Teams füllen diesen Platz oft mit mehr Laufwerken, mehr Risern, mehr Kabeln - und sind dann überrascht, wenn der Hot-Swap-Pfad durch ein Kabelbündel blockiert wird.

Wählen Sie Ihr Gift.

Vergleichstabelle: Übliche Integrationsmuster für redundante Netzteile

MusterTypische HardwareHot-Swap-VerhaltenGemeinsame FehlerstelleWo es passt
1U “doppelt redundant”1U-spezialisierte PSUs + BackplaneNormalerweise ja, aber abstandsabhängigAbnutzung der Backplane-Verbinder; Mangel an LuftstromEnge Racks, Edge Nodes, Telekommunikationsregale
2U CRPS-Module2× CRPS + redundante PSU-BackplaneJa, werkzeugloser Austausch der ModuleBackplane-Kupfer/OR-ing; falsch eingestellte LastverteilungsrichtlinieSpeicherung, Virtualisierung, gemischtes PCIe
Einzelnes ATX-“großes Netzteil”1× 1-3 kW ATXNeinEinzelne PSU, einzelner Eingang, einzelner LüfterpfadLabore, Entwicklungsplattformen, Cost-Min-Builds
Dual ATX + Sync-Karte2× ATX + LastverteilungsplatineManchmal (aber hässlich)Keine Redundanz - Verlust auf Geräteebene bei einer PSUNur wenn Sie eine teilweise Abschaltung akzeptieren
ORv3 Rack-Leistung48 V Regal + KnotenwandlerJa auf Rack-EbeneUmrichterstufe, Rack-Bus-SchutzCluster, KI-Pods, High-Density-Racks

Wenn Sie in der Welt der 2-3 kW leben, sollten Sie nicht raten, sondern die Kompromisse lesen, die in redundante 2-3 kW PSU-Optionen für Multi-GPU-Workloads, insbesondere die Warnung, dass “eine auf zwei PSUs aufgeteilte Last keine Redundanz ist”.”

Der größere Hintergrund: Der Leistungsstress nimmt zu, und das macht sich im Regal bemerkbar

Hier ist der unangenehme Makropunkt: Ihre Entscheidungen über redundante Stromversorgungen auf Gehäuseebene kollidieren mit den Zwängen auf Netzebene. Im Dezember 2024 wird die Zusammenfassung des Energieberichts für das LBNL-Rechenzentrum durch das US-Energieministerium erklärte, dass Rechenzentren im Jahr 2023 etwa 4,4% des US-Stroms verbrauchten und bis 2028 voraussichtlich 6,7%-12% erreichen werden, wobei der Gesamtstromverbrauch von Rechenzentren bis 2028 auf 325-580 TWh ansteigen dürfte.
Wenn die Versorgung knapp ist, werden Störungen der Netzqualität nicht seltener, sondern eher unübersichtlicher.

Bei der Redundanz in einem 1U/2U-Servergehäuse geht es also nicht nur darum, dass “ein Netzteil gestorben ist”. Es geht darum, hässliche Eingaben zu überstehen, die Umwandlung stabil zu halten und zu verhindern, dass Ihre eigenen Schutzschaltungen zuerst auslösen.

Integration redundanter Stromversorgungen in 1U2U-Serverchassis

FAQs

Was ist eine redundante Stromversorgung in einem 1U/2U-Servergehäuse?

Eine redundante Stromversorgung in einem 1U/2U-Servergehäuse ist ein PSU-System mit zwei Modulen (oft 1+1 oder N+1), das so konzipiert ist, dass der Server mit seiner Nennlast weiterlaufen kann, wenn ein PSU entfernt wird, ausfällt oder im laufenden Betrieb ausgetauscht wird, wobei eine gemeinsame Backplane oder Stromverteilungskarte verwendet wird, die Lastverteilung, ODER-Verknüpfung und Fehlerisolierung verwaltet.
Nach dieser Definition ist der praktische Test einfach: Ziehen Sie ein Modul unter einer realen Arbeitslast (z. B. einer synthetischen 70-90%-Last) und bestätigen Sie, dass das System nicht neu startet, die Lüfter in Ordnung bleiben und die Protokolle ein sauberes Failover-Ereignis zeigen.

Was bedeutet 1+1 PSU-Redundanz?

1+1 PSU-Redundanz ist eine Konfiguration, bei der zwei identische Netzteile installiert sind, so dass eines die gesamte Serverlast allein tragen kann, während das zweite Netzteil die Last teilt oder im Standby-Modus bleibt und das System weiterläuft, wenn ein Modul ausfällt, abgezogen oder während des Betriebs ausgetauscht wird, vorausgesetzt, die Backplane und die Eingangseinspeisungen sind unabhängig.
Wenn bei Ihrem “1+1”-System beide Netzteile vorhanden sein müssen, um OCP-Auslösungen zu vermeiden, haben Sie ein anfälliges System mit zwei Stromversorgungen gebaut, keine Redundanz.

Was ist eine redundante PSU-Backplane?

Eine redundante PSU-Backplane ist eine Hochstrom-Leiterplatten- und Anschlussbaugruppe, die Hot-Swap-Module aufnimmt, ihre Gleichstromausgänge zur Lastverteilung isoliert und kombiniert und Schienen wie 12 V und 5 VSB sowie Steuersignale (PS_ON#, PWR_OK) verteilt, so dass ein Modul entfernt werden kann, ohne den Server herunterzufahren.
Behandeln Sie es wie ein Verschleißteil: Überprüfen Sie es, überwachen Sie die Temperaturen und sparen Sie nicht an der Kontaktqualität.

Was ist PMBus bei einer redundanten Stromversorgung?

PMBus auf einem redundanten Netzteil ist eine digitale Verwaltungsschnittstelle (typischerweise PMBus 1.2/1.3 über I²C/SMBus), die Echtzeitmessungen und Fehlerprotokolle - Spannung, Strom, Leistung, Temperatur, Lüfterdrehzahl und Ereignishistorie - zur Verfügung stellt, so dass Betreiber die Lastverteilung überprüfen, Ausfälle vorhersagen und Warnschwellen festlegen können, bevor ein Netzteil ausfällt oder sich unter Hitzeeinwirkung stillschweigend zurückzieht.
Wenn Sie ohne PMBus-Telemetrie arbeiten, sind Sie im Blindflug unterwegs und nennen es “Hochverfügbarkeit”.”

Ist die Verwendung von zwei ATX-Netzteilen mit einem Sync-Board echte Redundanz?

Bei der Verwendung von zwei ATX-Netzteilen mit einem Sync-Board handelt es sich um einen Verdrahtungstrick, bei dem jedes Netzteil eine Untergruppe von Komponenten mit Strom versorgt, so dass ein einziger Ausfall in der Regel die Hälfte der Komponenten zerstört und den Rest destabilisieren kann; es handelt sich nicht um echte 1+1-Redundanz, da ein Netzteil in der Regel nicht die gesamte Systemlast sauber tragen kann.
Wenn Sie Betriebszeit benötigen, verwenden Sie eine speziell entwickelte redundante PSU-Backplane oder ein CRPS-Design und überprüfen Sie das Hot-Swap-Verhalten.

Schlussfolgerung

Wenn Sie ein 1U/2U-Gehäuse entwerfen und Redundanz wünschen, die die hässlichen Stromversorgungsprobleme in der Praxis übersteht, sollten Sie mit Gehäusen beginnen, die ausdrücklich redundante Netzteile unterstützen und wartbar sind. 1U-Server-Gehäusekategorie für kompakte redundante Netzteile und die 2U-Servergehäuse, geeignet für CRPS und höhere Strompfade, dann spezifizieren Sie die Backplane und den PMBus-Plan, bevor Sie die Wattzahl festlegen.
Und wenn Sie möchten, dass jemand Ihr Layout, Ihren Luftstrom und Ihren A/B-Feed-Plan auf Herz und Nieren prüft, bevor Sie Metall kaufen, fordern Sie ein Angebot und eine technische Prüfung über die ISTONECASE-Gehäuseseiten an.

Kontaktieren Sie uns, um Ihr Problem zu lösen

Vollständiges Produktportfolio

Von GPU-Server-Gehäusen bis hin zu NAS-Gehäusen bieten wir eine breite Palette von Produkten für alle Ihre Computeranforderungen.

Maßgeschneiderte Lösungen

Wir bieten OEM/ODM-Dienste an, um kundenspezifische Servergehäuse und Speicherlösungen auf der Grundlage Ihrer individuellen Anforderungen zu entwickeln.

Umfassende Unterstützung

Unser engagiertes Team sorgt für eine reibungslose Lieferung, Installation und laufenden Support für alle Produkte.