Integração de fontes de alimentação redundantes em chassis de servidor 1U2U

Integração de fontes de alimentação redundantes em chassis de servidor 1U/2U

As PSUs redundantes são vendidas como uma garantia de tempo de atividade, mas a maioria das falhas começa com erros no percurso da energia, não com “azar”. Eis como integrar corretamente a alimentação redundante 1U/2U - mecânica, eléctrica e operacionalmente.

O tempo de inatividade é dispendioso.
De acordo com o Resumo executivo da Análise anual de interrupções de serviço 2024 do Uptime Institute, De acordo com o estudo, 54% dos operadores afirmaram que a sua última interrupção significativa excedeu $100.000 e 16% ultrapassou $1 milhão, e os problemas de energia continuam a aparecer como a causa mais comum de interrupções sérias e graves nos centros de dados - o que significa que o seu design “redundante” está a fazer o trabalho ou a mentir-lhe ativamente.
Então, porque é que as equipas ainda tratam uma fonte de alimentação redundante como uma caixa de verificação?

Vou ser direto: a indústria paga demasiado pelo hardware de “redundância de PSU 1+1” e depois investe pouco no trabalho de integração aborrecido - resistência de contacto, margem de fluxo de ar, política de partilha de carga e a canalização de firmware/telemetria que lhe diz que um módulo está a morrer antes de se desligar. É assim que se acaba com dois módulos brilhantes de PSU redundante com troca a quente e um único ponto de falha: o backplane ou a placa de distribuição de energia do chassis do servidor.

E sim, também acontece em grandes instalações. Em fevereiro de 2024, A Reuters noticiou a interrupção da atividade da Applied Digital em Ellendale que teve início a 18 de janeiro e se transformou numa interrupção total a 19 de janeiro - as actualizações de “estabilidade” dos serviços públicos ainda estavam em curso e a empresa afirmou que as receitas seriam afectadas de forma significativa.
Se um centro de dados pode ficar às escuras devido à instabilidade do caminho de alimentação, o que acha que uma caixa de 1U apertada faz quando uma PSU fica sem energia e o painel traseiro se parte?

Integração de fontes de alimentação redundantes em chassis de servidor 1U2U

A intenção por detrás da pesquisa (e o que deve ser optimizado)

Quando alguém escreve “integração de fontes de alimentação redundantes em chassis de servidor 1U/2U” ou o mais simples “Como integrar fontes de alimentação redundantes num chassis de servidor 1U/2U”, não está à procura de um logótipo. Eles querem um manual: como conectar alimentações A/B, como montar um backplane de PSU redundante, como validar o comportamento hot-swap, como ler o PMBus e como evitar a armadilha clássica em que ambas as PSUs falham “juntas” porque o design do chassi as acopla.

Versão resumida: trata-se de engenharia operacional, não de compra de peças.

O que significa realmente “fonte de alimentação redundante” em 1U/2U

Três palavras: caminhos de energia independentes.

Numa configuração 1+1 real, qualquer uma das PSU tem de suportar a carga total (ou, pelo menos, a carga crítica definida) enquanto a outra estiver ausente, falhar ou for trocada, e a comutação não pode depender de um traço de PCB desprotegido que passa por um bloco de conectores com contactos de mola de barganha. Está a projetar para MTTR (tempo médio de reparação) medido em minutos, não em horas.

É aqui que o chassis é importante. Um chassis 1U obriga-o frequentemente a utilizar PSUs especializadas em 1U, cablagens mais curtas, raios de curvatura mais apertados e menos massa de dissipador de calor; uma configuração de PSU redundante 2U dá-lhe mais espaço para módulos CRPS, uma placa traseira de cobre mais espessa e canais de fluxo de ar mais sãos.

Se estiver a escolher hardware: comece com chassis que sejam explícitos quanto ao suporte de PSU redundante, e não com marketing vago. Os integradores apoiam-se nas páginas de categoria como uma folha de consulta porque mostram o que é fisicamente suportado - veja o Opções de caixas de servidor 1U que suportam fontes de alimentação redundantes duplas e o mais vasto Gama de caixas de servidor 2U concebidas para ambientes de rack.

A dura verdade sobre os backplanes: eles falham como qualquer outra placa

Os backplanes não são mágicos. São placas de circuito impresso com cobre, revestimento e conectores que são forçados a transportar corrente elevada com baixa tensão, e essa combinação não perdoa.

Modos de falha típicos que se repetem em fotografias de desmontagem e resumos de RMA:

  • Desgaste do conetor + micro-arcos: ciclos repetidos de troca a quente, um pequeno desalinhamento, e obtém-se corrosão, depois calor, depois fuga.
  • Cobre subconstruído: “2 oz Cu” versus “1 oz Cu” não é uma escolha de boutique a 12 V e 80-120 A; é a diferença entre uma placa quente e uma cozinhada.
  • Cablagem de mau senso: As linhas de deteção remota (e o seu retorno) foram encaminhadas como se fossem uma reflexão tardia, fazendo com que a PSU compensasse excessivamente com os passos de carga.
  • Dívida térmica: O fluxo de ar de 1U é brutal; um backplane colocado numa bolsa estagnada atrás de caixas de unidades vê um ambiente elevado e envelhece mais rapidamente.

Se quiser um exemplo concreto de chassis: o ISC-SC278S-H25-T refere a compatibilidade com módulos de alimentação redundante CRPS e um backplane MiniSAS-HD de 12Gb/s com protecções; isto diz-me que a equipa de design pensou na integração do backplane como uma caraterística de primeira classe e não como um acessório. Link para especificações: Chassis 2U compatível com módulos PSU redundantes CRPS.

Integração de fontes de alimentação redundantes em chassis de servidor 1U2U

Lista de verificação da integração eléctrica que a maioria das equipas não faz

Uma boa integração é repetitiva. É por isso que as pessoas não a fazem. E é por isso que as falhas se repetem.

1 Lado das entradas: tratar os A/B como adultos

  • Utilize duas PDUs separadas (A e B), idealmente dois circuitos upstream separados, e rotule-as como se a sua vida de permanência dependesse disso.
  • Validar as gamas de entrada: muitas unidades de alta potência querem 200-240 VAC e IEC C19; os laboratórios de 120 VAC adoram descobrir isto às 2 da manhã.
  • Se procura eficiência, lembre-se de que a 80 PLUS Titanium atinge os seus melhores valores por volta de ~50% de carga; as PSUs de grandes dimensões que funcionam a 10-15% podem ser menos eficientes e mais ruidosas.

2 Lado da saída: desenhar o percurso da corrente, não o esquema

  • Mantenha o barramento de 12 V curto, largo e mecanicamente seguro; a 12 V, alguns miliohms são um aquecedor.
  • Utilize o controlo adequado do diodo ideal / OR-ing quando apropriado (especialmente quando misturar fontes) e não assuma que o OR-ing interno da PSU corresponde à topologia do seu chassis.
  • Se o chassis utilizar uma placa de distribuição de energia (PDB) do chassis do servidor, procure falhas de ponto único: um conversor 5VSB, uma calha lógica para PS_ON#, um traço que alimenta ambos os cabeçalhos da ventoinha, um terra “inteligente” que se torna um fusível.

3 Telemetria: O PMBus é o sistema de alerta precoce

Uma fonte de alimentação redundante PMBus que pode reportar VIN, IIN, POUT, temperatura, RPM da ventoinha e histórico de falhas dá-lhe sinais de pré-falha: aumento da corrente da ventoinha, aumento da temperatura interna a carga constante ou um módulo que está a “partilhar” menos todas as semanas. Essa é a diferença entre uma troca programada e uma reinicialização surpresa.

Se precisar de uma visão do chassis: o Caixa de servidor ISC-R166-4-M 1U com suporte de fonte de alimentação redundante é o tipo de ficha de especificações de que gosto, porque é explícita quanto ao formato (482×660×44,5 mm) e às restrições que estão efetivamente a ser integradas no seu interior.

1U vs 2U: o comércio de integração que ninguém quer precificar corretamente

A conceção de uma fonte de alimentação redundante 1U é um problema de disciplina: está a trocar o fluxo de ar, o espaçamento dos conectores e a ergonomia do serviço, e está a apostar que pode recuperá-los com uma tolerância mecânica mais apertada e uma melhor monitorização.

O design de uma PSU redundante de 2U é um problema de margem: tem espaço para o fazer corretamente, mas as equipas enchem frequentemente esse espaço com mais unidades, mais risers, mais cabos - e depois ficam surpreendidas quando o caminho de permuta a quente é bloqueado por um nó de feixe.

Escolhe o teu veneno.

Tabela de comparação: padrões comuns de integração de PSU redundantes

PadrãoHardware típicoComportamento de troca a quentePonto de falha comumOnde se encaixa
1U “duplo redundante”PSUs especializadas 1U + backplaneNormalmente sim, mas sensível à autorizaçãoDesgaste do conetor do barramento de dados; falta de fluxo de arBastidores apertados, nós de extremidade, prateleiras de telecomunicações
Módulos CRPS 2U2× CRPS + placa traseira de PSU redundanteSim, troca de módulos sem ferramentasCobre do backplane/OR-ing; política de partilha de carga mal definidaArmazenamento, virtualização, PCIe misto
ATX simples “PSU grande”1× 1-3 kW ATXNãoPSU única, entrada única, caminho único do ventiladorLaboratórios, equipamentos de desenvolvimento, compilações de custo-minuto
ATX duplo + placa de sincronização2× ATX + placa de divisão de cargaPor vezes (mas feio)Não redundância - perda ao nível do dispositivo numa PSUSó quando se aceita o encerramento parcial
Potência de bastidor ORv3Conversores de 48 V de prateleira + nóSim, ao nível das estantesFase do conversor, proteção do barramento do bastidorClusters, pods de IA, bastidores de alta densidade

Se está a viver no mundo dos 2-3 kW, não adivinhe - leia as soluções de compromisso apresentadas em opções de PSU redundante de 2-3 kW para cargas de trabalho multi-GPU, especialmente o aviso de que “a carga dividida de duas PSU não é redundância”.”

O cenário mais importante: o stress energético está a aumentar, e isso nota-se no interior do bastidor

Aqui está o ponto macro desconfortável: as suas decisões sobre fontes de alimentação redundantes ao nível do chassis estão a colidir com restrições ao nível da rede. Em dezembro de 2024, a Resumo do Departamento de Energia dos EUA sobre o relatório de energia do centro de dados LBNL afirmou que os centros de dados utilizaram cerca de 4,4% de eletricidade dos EUA em 2023 e prevê-se que atinjam cerca de 6,7%-12% até 2028, estimando-se que a utilização total de eletricidade dos centros de dados aumente para 325-580 TWh até 2028.
Quando o fornecimento é escasso, os eventos de qualidade da energia não se tornam mais raros; tornam-se mais confusos.

Assim, a redundância dentro de um chassis de servidor 1U/2U não se trata apenas de “uma PSU morreu”. Tem a ver com a passagem por uma entrada feia, mantendo a conversão estável e evitando que o seu próprio circuito de proteção dispare primeiro.

Integração de fontes de alimentação redundantes em chassis de servidor 1U2U

FAQs

O que é uma fonte de alimentação redundante num chassis de servidor 1U/2U?

Uma fonte de alimentação redundante num chassis de servidor 1U/2U é um sistema de PSU de módulo duplo (frequentemente 1+1 ou N+1) concebido para que o servidor possa continuar a funcionar com a sua carga nominal quando uma PSU é removida, falha ou é trocada a quente, utilizando um painel posterior partilhado ou uma placa de distribuição de energia que gere a partilha de carga, a ligação em OU e o isolamento de falhas.
Após essa definição, o teste prático é simples: puxe um módulo sob uma carga de trabalho real (digamos, uma carga sintética 70-90%) e confirme que a caixa não reinicia, as ventoinhas permanecem sãs e os registos mostram um evento de ativação pós-falha limpo.

O que é redundância de PSU 1+1?

A redundância de PSU 1+1 é uma configuração em que são instaladas duas fontes de alimentação idênticas, de modo a que uma delas possa suportar sozinha toda a carga do servidor, enquanto a segunda fonte partilha a carga ou permanece em espera, e o sistema continua a funcionar se um módulo falhar, for desligado ou substituído durante o funcionamento, assumindo que o painel posterior e as alimentações de entrada são independentes.
Se o seu “1+1” requer que ambas as PSUs estejam presentes para evitar disparos do OCP, construiu um sistema frágil de alimentação dupla, não redundância.

O que é um backplane de PSU redundante?

Um backplane de PSU redundante é um conjunto de PCB e conetor de alta corrente que aceita módulos hot-swap, isola e combina as suas saídas DC para partilha de carga e distribui carris como 12 V e 5VSB mais sinais de controlo (PS_ON#, PWR_OK) para que um módulo possa ser removido sem desligar o servidor.
Trate-o como um artigo de desgaste: inspeccione-o, monitorize as temperaturas e não poupe na qualidade do contacto.

O que é o PMBus numa fonte de alimentação redundante?

O PMBus numa fonte de alimentação redundante é uma interface de gestão digital (tipicamente PMBus 1.2/1.3 sobre I²C/SMBus) que expõe medições em tempo real e registos de falhas - tensão, corrente, potência, temperatura, velocidade da ventoinha e histórico de eventos - para que os operadores possam verificar a partilha de carga, prever falhas e definir limites de alerta antes de uma PSU disparar ou desativar silenciosamente sob calor.
Se estiver a funcionar sem telemetria PMBus, está a voar às cegas e a chamar-lhe “alta disponibilidade”.”

A utilização de duas PSUs ATX com uma placa de sincronização é uma verdadeira redundância?

A utilização de duas PSU ATX com uma placa de sincronização é um truque de cablagem de divisão de carga em que cada fonte alimenta um subconjunto de componentes, pelo que uma única falha normalmente mata a sua metade e pode desestabilizar o resto; não é uma verdadeira redundância 1+1 porque uma PSU normalmente não consegue suportar a carga total do sistema de forma limpa.
Se precisar de tempo de atividade, utilize um design de backplane de PSU redundante ou CRPS concebido para o efeito e valide o comportamento de troca em tensão.

Conclusão

Se estiver a conceber uma caixa 1U/2U e pretender uma redundância que sobreviva à fealdade da energia no mundo real, comece com chassis que sejam explícitos quanto ao suporte de PSU redundante e à possibilidade de manutenção - consulte a Categoria de caixa de servidor 1U para montagem de PSU redundante compacta e o Caixas de servidor 2U adequadas para CRPS e percursos de corrente mais elevados, e, em seguida, especifique o plano de backplane e PMBus antes de escolher a potência.
E se quiser que alguém verifique a sua disposição, fluxo de ar e plano de alimentação A/B antes de comprar metal, solicite um orçamento e uma análise de engenharia através das páginas de chassis da ISTONECASE.

Contacte-nos para resolver o seu problema

Portfólio completo de produtos

Desde caixas de servidor GPU a caixas NAS, fornecemos uma vasta gama de produtos para todas as suas necessidades informáticas.

Soluções à medida

Oferecemos serviços OEM/ODM para criar caixas de servidor e soluções de armazenamento personalizadas com base nos seus requisitos exclusivos.

Apoio abrangente

A nossa equipa dedicada garante uma entrega, instalação e assistência contínua sem problemas para todos os produtos.