Wie viele GPUs verträgt Ihr Rack wirklich? Leitfaden für die Planung von Strom und Kühlung

Wie viele GPUs kann Ihr Rack wirklich verkraften? Leitfaden zur Planung von Strom und Kühlung

Das haben Sie wahrscheinlich schon hundertmal gehört:

“Also... wie viele GPUs können wir in ein Rack packen?”

Wenn Sie mit der “GPU-Anzahl” beginnen, werden Sie am Ende mit der Physik argumentieren. Das Rack interessiert sich nicht dafür, wie begeistert Sie von der KI sind. Es interessiert sich für zwei langweilige Grenzen:

  • Leistungsumfang (kW pro Rack)
  • Kühlungsabfuhr (kW an Wärme, die Sie tatsächlich abführen können)

Mein Standpunkt ist einfach: Die Rack-Dichte ist in erster Linie ein Problem der Einrichtung und erst in zweiter Linie ein Problem des Gehäuses. Aber das Gehäuse ist immer noch wichtig, denn es entscheidet darüber, ob sich der Luftstrom verhält... oder im Chaos versinkt.

Gehen wir das Ganze einmal so durch, wie es ein Betriebsteam tun würde: Unterbrecher → PDU → Serververbrauch → Wärme → Luftstrom/Flüssigkeit → Stabilität.


Wie viele GPUs verträgt Ihr Rack wirklich? Leitfaden für die Planung von Strom und Kühlung

Durchschnittliche Rackdichte unter 8 kW

Und jetzt kommt der unangenehme Teil: In vielen Serverräumen wird immer noch mit der “Legacy-Density” gearbeitet. Branchenumfragen zeigen die durchschnittliche Rackdichte bleibt unter 8 kWund >30-kW-Racks sind nicht üblich an den meisten Standorten.

Diese Lücke ist der Grund, warum die Einführung von KI so schwierig ist. Sie bringen moderne GPU-Knoten ein, und plötzlich muss Ihr Raum aufholen:

  • unterdimensionierte elektrische Verteilung
  • schwache Luftströmungswege
  • kein Containment
  • Hot Spots, die vorher kein Problem darstellten

Also ja, Sie kann GPUs kaufen. Die eigentliche Frage ist: Kann man sie füttern und kühlen, ohne sie zu drosseln?


Budget für Rack-Leistung (kW pro Rack)

Wattzufuhr gleich Wärmeabfuhr

Im Dauerbetrieb ist das Rack im Grunde ein Heizgerät mit Ventilatoren. Wenn Ihr Schrank zieht 40 kW, müssen Sie etwa 40 kW Wärme. Nicht “irgendwie”. So direkt ist es.

Deshalb sollte die Planung von Strom und Kühlung an der Hüfte zusammenhängen:

  1. Start mit Regal Budget für IT-Strom (was Sie sicher liefern können)
  2. Bestätigen Sie Kühlleistung an diesem Ort
  3. Erst dann auf die GPU-Zahl übertragen

Leistungsreduzierung, Reserven und Redundanz (N+1, 2N)

Wenn Sie bis zum Äußersten gehen, werden Sie es bereuen. Echte Einsätze haben es in sich:

  • Leistungsschalterderating
  • Spitzenbelastungen (Bootstorms sind real)
  • Lüfterrampen unter thermischer Belastung
  • Redundanzausführung (N+1 oder 2N Einspeisungen)

Mit anderen Worten: Planen Sie nicht wie eine Tabellenkalkulation. Planen Sie wie einen Bereitschaftsdienst.


GPU-TDP bis zu 700 W und Gesamtleistung des Servers

Viele moderne Beschleunigerkarten zeigen bis zu ~700W TDP je nach Modell und Konfiguration. Cool. Aber hier ist die Falle:

GPU-Watt ≠ Server-Watt.

Ihre Plattform umfasst auch:

  • CPU(s)
  • Speicher
  • NICs (200/400/800G)
  • Retimer / Schalter
  • Lagerung
  • Lüfter und Netzteile

Wenn also jemand sagt: “Wir machen 8 GPUs, das sind 8 × 700 W”, dann fehlt ihm der Rest der Box. Das ist der Punkt, an dem Projekte scheitern.

8-GPU-Serverleistung um 10 kW

Ein guter Realitätscheck: Übliche 8-GPU-Systeme in der Praxis können Folgendes auflisten etwa ~10 kW max auf Server-Ebene. Aus diesem Grund verwenden viele Teams einen groben Planungsmultiplikator:

Leistung des gesamten Servers ≈ 1,6-2,0× (GPU-TDP insgesamt)

Ist sie perfekt? Nö. Ist es nützlich für den frühen Entwurf? Ja, sehr.


Rack-Leistungsbudget zur Anzahl der GPUs (Planungstabelle)

Nachfolgend sehen Sie, wie dies in der Praxis aussieht. Die linke Spalte zeigt die “optimistische GPU-only”-Rechnung. In der rechten Spalte wird ein realistischerer Faktor für den gesamten Server angewendet (unter Verwendung von 1.8× als Planungshilfe).

Rack IT-Leistungsbudget (kW)Schätzung nur für die GPU (700 W pro GPU)Schätzung für den gesamten Server (≈1,8× GPU-only)
10147
152111
202815
304223
405731
507139
608547
8011462

Diese Tabelle versucht nicht, die Mathematik zu verbiegen. Sie versucht, Sie vor einem häufigen Fehler zu bewahren:

  • Sie bestellen “GPU-Kapazität”.”
  • dann stellen Sie fest, dass Sie eigentlich “Wärme und Ampere” bestellt haben.”

Wie viele GPUs verträgt Ihr Rack wirklich? Leitfaden für die Planung von Strom und Kühlung

Luftkühlungsgrenzen bei 20-30 kW pro Rack

Luftkühlung kann weiter gehen, als man denkt, aber sie wird schnell brüchig.

Viele Betreiber behandelten in der Vergangenheit 20-30 kW pro Gestell als der Punkt, an dem die Luftkühlung nicht mehr “einfach” ist. Mit besserer Luftstromtechnik kann man noch mehr erreichen, aber man befindet sich jetzt in einer Welt, in der kleine Fehler große Auswirkungen haben.

Eingrenzung des Warmgangs und Steuerung der Umwälzung

Sobald Sie in der Dichte aufsteigen, wird Ihr größter Feind Umwälzung.

Heiße Abgase gelangen zurück in die GPU-Einlässe, und plötzlich verhält sich Ihre “700-W-GPU” wie ein Toaster, der nicht atmen kann. Sie werden sehen:

  • GPU-Taktsenkung (Throttle City)
  • schreiende Ventilatorgeschwindigkeiten
  • Hotspots im Inneren des Gehäuses
  • ungleichmäßige Temperaturen zwischen Servern im selben Schrank

Eindämmung hilft. Ebenso wie eine saubere Verkabelung. Ebenso ist es hilfreich, die Vorderseite des Gehäuses nicht mit “vorübergehendem” Material zu blockieren, das dauerhaft wird.


Wann sollte Flüssigkeitskühlung verwendet werden (RDHx, CDU, Direct-to-Chip)?

Ab einem bestimmten Punkt wird die Luft zu einem teuren Kampf. An diesem Punkt hören Sie, wie die Facility-Leute mit Begriffen um sich werfen wie:

  • RDHx (Wärmetauscher der hinteren Tür)
  • CDU (Kühlmittelverteilereinheit)
  • direkt auf den Chip
  • Hybridkühlung

Sie müssen nicht vom ersten Tag an voll flüssig sein. Aber Sie sollten den Weg planen. Eine spätere Umstellung ist immer schmerzhafter als man denkt, und sie erfolgt nie an einem ruhigen Wochenende.


Praktische Szenarien für die Rackdichte (15 kW, 30 kW, 40 kW, 80 kW)

15-kW-Racks: Nachrüstung für Unternehmen und gemischte Arbeitslasten

Dies ist die “Wir haben bereits einen Serverraum”-Situation.

Was normalerweise funktioniert:

  • Verteilung der GPUs auf mehrere Schränke
  • Wählen Sie ein Gehäuse mit stabilem Luftstrom, nicht mit maximaler Dichte um jeden Preis
  • Priorität auf Wartungsfreundlichkeit legen, da Sie die Hardware häufig berühren werden

Deshalb ist die Wahl eines soliden Rack-Gehäuses so wichtig. Wenn Sie in großem Umfang beschaffen, ist eine konsistente Server-Gehäuse Familie macht Ihre Builds wiederholbar, und Wiederholbarkeit ist das, was die Operationen vernünftig macht.

30-40 kW-Racks: neue KI-Pods und Algorithmuszentren

Jetzt sind Sie in der “echten Dichte”.”

Ihre Checkliste sollte Folgendes enthalten:

  • Eindämmung vom ersten Tag an
  • PDUs mit Spielraum und Redundanz ausgelegt
  • eine Kabelführung, die den Luftstrom nicht behindert
  • Gehäuse für GPU-Thermik (Lüfterwand + Ablenkbleche)

Wenn Ihr Team Phrasen einkauft wie server rack pc gehäuse oder Computergehäuse Server, Was Sie wirklich brauchen, ist ein speziell angefertigtes GPU-Gehäuse, keine Hobby-Box in einem Rack-Kostüm.

Eine engagierte GPU-Server-Gehäuse kann Ihnen den Luftstromdruck, die Abstände und den Wartungszugang bieten, den dichte Beschleuniger erfordern.

80-kW-Racks: flüssigkeitsgefüllte und hochdichte Cluster

Hier hören Sie auf, “Server bereitzustellen” und beginnen mit dem “Betrieb der Infrastruktur”.”

Sie werden sich dafür interessieren:

  • schnelle MTTR (es geht um Minuten)
  • sauberes Wartungsintervall
  • zuverlässige Schienensysteme
  • vorhersehbares Layout für die Verrohrung/Verkabelung

Rails klingen langweilig, aber sie beeinflussen die Betriebszeit. Eine gute Fahrgestellführungsschiene Die Einrichtung verhindert schlampige Installationen und macht den Austausch sicherer (und auch schneller).


Wie viele GPUs verträgt Ihr Rack wirklich? Leitfaden für die Planung von Strom und Kühlung

Luftstrom im GPU-Servergehäuse: Lüfterwand, Ablenkbleche und Wartungsfreundlichkeit

Das ist der Teil, den die Käufer auslassen und die Betreiber hassen sie dafür:

das Gehäuse ist eine Luftstrommaschine.

Für dichte GPU-Knoten suchen Sie nach:

  • Optionen für starke Ventilatorwände (hoher statischer Druck)
  • Umlenkungen/Leitungen, die die Luft durch heiße Zonen drücken
  • Layouts, die die Wärme des Netzteils vom GPU-Einlass isolieren
  • einfacher Zugang von oben für schnellen Austausch

Wenn Sie um Workstation-ähnliche Teile herum bauen, werden Sie Suchanfragen sehen wie Server-PC-Gehäuse und atx-Server-Gehäuse. Das ist normalerweise ein Signal: “Ich will Flexibilität, aber ich kann keine Thermik auf Workstation-Niveau akzeptieren.” Völlig fair. Vergewissern Sie sich nur, dass das Gehäuse für Server-Luftstrommuster gebaut wurde, nicht nur für ATX-Schraubenlöcher.

Für Randräume oder Labore können Sie auch kompakte Formate verwenden: ITX-Gehäuse und Gehäuse für Wandmontage kann praktisch sein, wenn Sie nicht über ein vollwertiges Luftstromdesign verfügen oder kleinere “Pods” in der Nähe von Workloads betreiben.


OEM/ODM-GPU-Servergehäuse für den Masseneinsatz

Wenn Sie Dutzende (oder Hunderte) von Knoten bereitstellen, ist Ihr Problem nicht “ein Server”. Es ist die Wiederholbarkeit:

  • stabile Thermik über Chargen hinweg
  • ständige Verfügbarkeit von Teilen
  • eine Fahrgestellspezifikation, die nicht mitten im Projekt abdriftet
  • Anpassung an Ihre genaue GPU-, NIC- und Speicheranordnung

Da passt IStoneCase natürlich ins Bild. Das Unternehmen konzentriert sich auf GPU/Server-Gehäuse und Speichergehäuse mit OEM/ODM-Unterstützung, die für Großbestellungen und kundenspezifische Auflagen gebaut werden. Wenn Ihr Plan eine Skalierung vorsieht, lohnt es sich, mit einem Anbieter zu sprechen, der dies tagtäglich tut und nicht nur beliebige Gehäuse weiterverkauft.

Einige IStoneCase-Seiten, die Sie als interne Referenzen in Ihrem Inhalt verwenden können:

Kontaktieren Sie uns, um Ihr Problem zu lösen

Vollständiges Produktportfolio

Von GPU-Server-Gehäusen bis hin zu NAS-Gehäusen bieten wir eine breite Palette von Produkten für alle Ihre Computeranforderungen.

Maßgeschneiderte Lösungen

Wir bieten OEM/ODM-Dienste an, um kundenspezifische Servergehäuse und Speicherlösungen auf der Grundlage Ihrer individuellen Anforderungen zu entwickeln.

Umfassende Unterstützung

Unser engagiertes Team sorgt für eine reibungslose Lieferung, Installation und laufenden Support für alle Produkte.