Caixa de servidor com refrigeração líquida para H100/GB200

Está a planear racks de IA densos. As ventoinhas gritam, o calor dispara, a PUE aumenta. Vamos conversar Caixa de servidor com refrigeração líquida para H100/GB200-o que é, por que razão é importante e como o conseguir com cenários do mundo real e hardware que pode efetivamente comprar.


Refrigeração líquida NVIDIA GB200 NVL72 a nível de gabinete

As pilhas de formação densas como o GB200 não se comportam como um caixa de computador servidor. Trata-se de um sistema à escala de um armário com arrefecimento direto ao chip, distribuição por colectores e desconexões rápidas à prova de fugas. Em palavras simples: o líquido de arrefecimento toca os pontos quentes (GPU, CPU, VRM, DIMM, PSU) e transporta o calor para fora - de forma rápida e previsível. Isso não é "bom de se ter". É a diferença entre clocks estáveis em carga total e estrangulamento térmico durante longos períodos.

Onde o seu recinto é importante: o chassis precisa de espaço livre para a placa fria, suporte de calha rígido, caminhos de encaminhamento de mangueiras e acesso frontal de fácil manutenção. Se não conseguir puxar um nó, sangrar uma linha ou trocar uma bomba em minutos, a sua equipa de operações vai detestar o design (e a si).


Arrefecimento líquido direto ao chip para o H100

Para clusters H100, as placas líquidas reduzem o delta-T e permitem uma maior densidade por bastidor. Este é o seu bilhete para mais computação por metro quadrado sem sobrecarregar as unidades CRAC. O gabinete deve ser integrado:

  • Rigidez de montagem da placa fria da CPU/GPU/DIMM/VRM (sem curvatura da placa).
  • Disposição do coletor e do QD sem gotejamento para evitar arranhões nos nós dos dedos e problemas estranhos de raio de curvatura.
  • As calhas de cabos são separadas das linhas húmidas (segurança + facilidade de manutenção).
  • Rigidez dos carris para tabuleiros pesados (sem descaimento, sem inclinação).

Resumo: Se o compartimento não for construído para o DLC, terá de lutar contra ele em todas as janelas de manutenção.


Caixa de servidor com refrigeração líquida para H100GB200 1

O GB200 é à escala do armário; o seu chassis continua a decidir o tempo de atividade

"Líquidoarrefecido" não é apenas fluido. É também anéis de serviço, calhas e batentes de portas. Eis como as escolhas de compartimentos influenciam a disponibilidade:

  • Acesso a bobinas/bombas/CDU substituíveis: O tempo médio de serviço (MTTS) diminui, a recuperação de falhas melhora.
  • Preferência de E/S frontal: Menos colisões no corredor, encaminhamento mais seguro das mangueiras.
  • Carris com caraterísticas anti-rachadura: Não há micro-misalinhamentos que sobrecarreguem os QDs (não se quer mesmo esse gotejamento).

Para os compradores que perguntam: "Precisamos de água para o edifício?"

Alguns sítios não trazem água das instalações para o espaço em branco no primeiro dia. Ainda é possível implementar, utilizando líquido-ar permutadores de calor na porta traseira ou na fila. Não se trata de uma solução única, mas permite-lhe enviar GPUs agora e planear a água das instalações mais tarde. A caixa deve reservar espaço e pontos de montagem para qualquer direção: loop de instalação mais tarde, bobina de porta traseira hoje.


Opções de caixas e chassis de PC para rack de servidor (preparadas para H100/GB200)

A IStoneCase fornece linhas de montagem em bastidor que correspondem a padrões de utilização reais - não a fantasias de laboratório:

Verá as palavras-chave que lhe interessam...caixa de pc para rack de servidor, caixa para pc de servidor, caixa de computador servidor, caixa do servidor atx-não como uma coisa superficial, mas como os blocos de construção reais que irá utilizar num bastidor ao vivo.


Caixa de servidor com refrigeração líquida para H100GB200 3

Cenários práticos que irá encontrar (e como o armário os resolve)

(1) Formação mista H100 + armazenamento na mesma linha

Para formação, são utilizados 8-16 H100 por nó. O rack seguinte hospeda o armazenamento pesado de NVMe. O resfriamento líquido mantém os nós de GPU densos; o armazenamento permanece resfriado a ar. O gabinete deve isolar as linhas de líquido do fluxo de ar de armazenamento, e os trilhos devem suportar uma massa maior para as bandejas de GPU. Se os trilhos trepidarem ou torcerem, os QDs se soltarão com o tempo - más notícias.

(2) O armário GB200 NVL72 cai no campo castanho DC

A água das instalações não está pronta. Primeiro, coloca-se um permutador de calor líquido-ar de porta traseira, pretende-se obter temperaturas de entrada estáveis e planear uma adaptação do circuito da instalação. A folga traseira do armário e a geometria da dobradiça decidem se a bobina da porta se encaixa. Já vi muitas instalações falharem aqui porque a porta não consegue abrir totalmente - não faça isso.

(3) Inferência 24/7 com SLO apertado

A variação da latência é o seu KPI, não o pico de TFLOPs. As placas líquidas eliminam os picos térmicos que causam oscilações de frequência. Uma placa líquida caixa para pc de servidor controla a vibração, mantém as mangueiras longe das ventoinhas e acelera a troca a quente. É assim que se mantém o p95 estável durante os picos de tráfego.

(4) Laboratório→Aumento de escala da produção

O seu laboratório começa em caixa do servidor atx protótipos. A produção precisa dos mesmos "keep-outs" de placas, ângulos de tubagem e localizações de portas. A continuidade do ODM evita o inferno da requalificação e auditorias de fugas estranhas.

Caixa de servidor com refrigeração líquida para H100GB200 4

Tabela de especificações (o que verificar antes de comprar)

Requisito (exato por palavra-chave)Porque é importante no arrefecimento líquido H100/GB200O que procurar na caixa de um PC servidor
Folga da placa fria diretamente para o chipEvita a inclinação da placa → dispersão irregular da TIMSuportes maquinados, placas traseiras, etiquetas de especificações de binário
Roteamento do coletor e acessibilidade QDServiço mais rápido, menor risco de fugasColectores de serviço frontal, zonas húmidas/secas identificadas
Rigidez da calha de guia do chassisOs nós húmidos pesados não se amontoam nem cedemCapacidade de carga certificada, fecho anti-encolhimento
Esquema de E/S frontalCaminhos de mangueira mais seguros, menos colisões no corredorCalhas de cabos separadas das linhas de refrigeração
Orifícios de drenagem/enchimento e pontos de purgaJanelas de manutenção mais curtasTampas sem ferramentas, tabuleiros de recolha de água, marcação clara
Integração de sensores e deteção de fugasO aviso prévio é melhor que o corte de energiaSuportes de sondas, passagens de cabos com ilhós
Compatibilidade com o HX de porta traseiraEntrada em zonas industriais abandonadas sem água nas instalaçõesEspecificação do raio de abertura da porta, resistência das dobradiças, altura livre em profundidade
ATX/placa de servidorLaboratório→Produto sem remodelaçãoSuporte ATX/E-ATX, grelha de suporte para GPU, compartimentos para PSU

Esta tabela não é uma teoria; é a lista de verificação que as equipas utilizam antes de uma OP. Se falhar uma linha, o seu TTR aumenta durante os picos de carga.


Porquê o IStoneCase (valor comercial, dito de forma clara)

  • Previsibilidade e repetibilidade. ODM significa que as segundas centenas de unidades correspondem às primeiras centenas - os mesmos padrões de orifícios, a mesma resposta dos carris, as mesmas passagens de cabos. Menos "surpresas durante a instalação".
  • Mecanismos térmicos de primeira ordem. As estruturas reforçadas mantêm as placas planas, as calhas não oscilam e as portas não colidem com o HX traseiro. Pequenas coisas, impacto gigante.
  • Serviço de ciclo de vida. Pontos de sangria, recipientes de drenagem, rotulagem - pequenas adições que reduzem os minutos de cada vez que se faz um loop. Durante um ano, isso é tempo real de atividade.
  • Carteira que corresponde à sua linha. Plano de controlo em 1U, armazenamento em 4U/6U, tabuleiros GPU onde precisar deles. Pode misturar caixa de pc para rack de servidor com caixa de computador servidor sem alterar a sua linguagem ferroviária.
  • Nada de dramas ODM. Traga os ficheiros da sua placa, a pegada da placa e as especificações da mangueira. Ajustaremos as braçadeiras, os espaçadores e os ilhós à sua lista de materiais e ajudá-lo-emos na validação.

Caixa de servidor com refrigeração líquida para H100GB200 5

FAQ do comprador (jargão propositado)

P: Será que isto se adapta aos meus pilotos "atx server case"?
R: Se as suas placas de laboratório forem ATX/E-ATX, mantemos os keep-outs idênticos nas caixas de produção. Sem calços misteriosos, sem arco de placa.

P: A nossa equipa de operações teme fugas de informação.
R: Ótimo. Nós também. Especificamos QDs sem gotejamento, limites rígidos no raio de curvatura e sondas de deteção de fugas perto de pontos baixos. Além disso: encaminhamos as linhas húmidas para longe das entradas da ventoinha, para que uma única gota não se atomize. Parece picuinhas, mas é por isso que dormimos à noite.

P: Zona industrial abandonada, ainda não há água para construção.
R: Comece com a bobina de porta traseira ou HX em fila, depois planeie o circuito da instalação. As nossas portas e calhas estão dimensionadas para a montagem mais pesada e para o raio de rotação. Não é necessário voltar a comprar mais tarde.

P: Podemos cumprir os prazos de envio?
R: Sim, com kits de carris bloqueados e conjuntos de painéis repetíveis. O objetivo da ODM é reduzir o número de incógnitas. Pequenos erros de digitação no SOW acontecem - nomes de eventos e tudo mais - mas o hardware não deve surpreendê-lo.



Conclusão

Se leva a sério o H100/GB200, a caixa não é uma caixa metálica - é a sua estratégia de arrefecimento, o seu plano de serviço e a sua promessa de tempo de atividade. Escolha um caixa de pc para rack de servidor que respeita as realidades do DLC, integra a rigidez dos carris e deixa espaço para o caminho que está a percorrer (hoje porta traseira, amanhã circuito de instalações). Com o IStoneCase, obtém um caixa para pc de servidor plataforma e caixa do servidor atx opções que podem ser escaladas desde pilotos de laboratório até implementações ao nível do gabinete - sem ter de voltar a ligar a sua linha ou o seu fim de semana.

Contacte-nos para resolver o seu problema

Portfólio completo de produtos

Desde caixas de servidor GPU a caixas NAS, fornecemos uma vasta gama de produtos para todas as suas necessidades informáticas.

Soluções à medida

Oferecemos serviços OEM/ODM para criar caixas de servidor e soluções de armazenamento personalizadas com base nos seus requisitos exclusivos.

Apoio abrangente

A nossa equipa dedicada garante uma entrega, instalação e assistência contínua sem problemas para todos os produtos.