Интеграция резервных источников питания в серверные шасси 1U2U

Интеграция резервных источников питания в серверные шасси 1U/2U

Избыточные блоки питания продаются как страховка на время безотказной работы, но большинство сбоев все равно начинается с ошибок в трассе питания, а не с “невезения”. Вот как правильно интегрировать резервное питание 1U/2U - механически, электрически и эксплуатационно.

Время простоя стоит дорого.
Согласно Резюме ежегодного анализа отказов в 2024 году от Uptime Institute, 54% операторов заявили, что их последний значительный выход из строя превысил $100 000, а 16% превысил $1 миллион. Проблемы с электропитанием продолжают фигурировать в качестве наиболее распространенной причины серьезных и тяжелых сбоев в работе центров обработки данных, что означает, что ваша “избыточная” конструкция либо справляется со своей задачей, либо активно врет вам.
Почему же команды до сих пор относятся к резервному источнику питания как к флажку?

Скажу прямо: индустрия переплачивает за аппаратное обеспечение “резервирования 1+1 БП”, а затем недополучает средства на скучную интеграционную работу - сопротивление контактов, запас воздушного потока, политику распределения нагрузки и встроенное ПО/телеметрию, которая сообщает вам, что модуль умирает, прежде чем он отключится. В итоге вы получаете два блестящих резервных модуля БП с возможностью горячей замены и одну точку отказа: объединительную панель или плату распределения питания в серверном корпусе.

И да, это происходит и в крупных учреждениях. В феврале 2024 года, Агентство Reuters сообщило о сбое в работе компании Applied Digital в Эллендейле который начался 18 января и полностью прекратился к 19 января - модернизация системы “стабильности” все еще продолжалась, и компания заявила, что доходы существенно пострадают.
Если центр обработки данных может погрузиться в темноту из-за нестабильности маршрутов питания, то что, по-вашему, будет делать тесный бокс 1U, когда блок питания отрубится, а объединительная плата выгнется дугой?

Интеграция резервных источников питания в серверные шасси 1U2U

Цель поиска (и то, что вы должны оптимизировать)

Когда кто-то набирает “интеграция резервных источников питания в серверные шасси 1U/2U” или более грубое “Как интегрировать резервные источники питания в серверное шасси 1U/2U”, он не ищет значок с логотипом. Им нужен учебник: как подключить A/B-питание, как установить объединительную панель резервных блоков питания, как проверить поведение горячей замены, как читать PMBus и как избежать классической ловушки, когда оба блока питания выходят из строя “вместе”, потому что конструкция шасси объединяет их.

Короткая версия: это оперативная разработка, а не покупка запчастей.

Что на самом деле означает “резервный источник питания” в 1U/2U

Три слова: независимые пути питания.

В реальной конфигурации 1+1 один из блоков питания должен нести полную нагрузку (или, по крайней мере, определенную критическую нагрузку), пока другой отсутствует, вышел из строя или заменяется, и переключение не может зависеть от незащищенной трассы печатной платы, проходящей через один блок разъемов со сменными пружинными контактами. Вы проектируете для MTTR (среднее время ремонта), измеряемого в минутах, а не в часах.

Вот где шасси имеет значение. Шасси 1U часто заставляет вас использовать специализированные блоки питания, более короткие жгуты, более узкие радиусы изгибов и меньшую массу радиатора; при установке 2U с резервным блоком питания у вас будет больше места для модулей CRPS, более толстой медной объединительной платы и разумных каналов воздушных потоков.

Если вы выбираете оборудование, начните с корпусов, в которых четко прописана поддержка резервного блока питания, а не расплывчатый маркетинг. Интеграторы опираются на страницы категорий как на шпаргалки, потому что они показывают, что физически поддерживается - см. Варианты серверных корпусов 1U с поддержкой двух резервных источников питания и более широкий Линейка серверных корпусов 2U для стоечных сред.

Суровая правда о объединительных платах: они выходят из строя, как и любые другие платы

Задние платы не волшебные. Это печатные платы с медью, покрытием и разъемами, которые вынуждены пропускать большой ток при низком напряжении, а такое сочетание не терпит наказания.

Типичные режимы отказов, которые повторяются на фотографиях разбора и в отчетах RMA:

  • Износ коннектора + микротравмы: Многократные циклы горячей замены, незначительная несоосность - и вы получаете питтинг, затем нагрев, затем выход из строя.
  • Неполная сборка из меди: “2 унции меди” против “1 унции меди” - это не выбор бутика при 12 В и 80-120 А; это разница между теплой платой и готовой.
  • Плохое чувство проводки: Линии дистанционного управления (и их возврат) проложены как попало, что приводит к перекомпенсации БП при изменении нагрузки.
  • Тепловая задолженность: Воздушные потоки в 1U жестоки; объединительная плата, сидящая в застойном кармане за отсеками для накопителей, видит повышенную температуру окружающей среды и быстрее стареет.

Если вам нужен конкретный пример шасси: в ISC-SC278S-H25-T указана совместимость с модулями резервного питания CRPS и объединительной платой MiniSAS-HD 12 Гбит/с с защитой; это говорит о том, что команда разработчиков рассматривала интеграцию объединительной платы как первоклассную функцию, а не как аксессуар. Ссылка для получения спецификаций: Шасси 2U, совместимое с модулями резервных блоков питания CRPS.

Интеграция резервных источников питания в серверные шасси 1U2U

Контрольный список по интеграции электрооборудования, который большинство команд пропускают

Хорошая интеграция повторяется. Именно поэтому люди пропускают ее. И именно поэтому отказы повторяются.

1 Входная сторона: относитесь к A/B как к взрослым

  • Используйте два отдельных блока PDU (A и B), в идеале - две отдельные цепи восходящего потока, и пометьте их так, будто от этого зависит ваша жизнь на вызове.
  • Проверьте диапазоны входного сигнала: для многих мощных устройств требуется 200-240 В переменного тока и IEC C19; лаборатории, работающие с напряжением 120 В переменного тока, любят обнаруживать это в 2 часа ночи.
  • Если вы гонитесь за эффективностью, помните, что 80 PLUS Titanium достигает своих лучших показателей при нагрузке ~50%; слишком мощные блоки питания, работающие при 10-15%, могут быть менее эффективными и более шумными.

2 Выходная сторона: проектируйте путь тока, а не схему

  • Шина 12 В должна быть короткой, широкой и механически закрепленной; при напряжении 12 В несколько миллиом - это нагреватель.
  • Используйте правильное управление ИЛИ/идеальными диодами там, где это необходимо (особенно при смешивании источников), и не думайте, что внутреннее ИЛИ блока питания соответствует топологии вашего шасси.
  • Если в шасси используется плата распределения питания серверного корпуса (PDB), ищите неисправности в одной точке: один преобразователь 5VSB, одна логическая шина для PS_ON#, одна трасса, питающая оба вентилятора, одна “умная” земляная заливка, которая становится предохранителем.

3 Телеметрия: PMBus - система раннего предупреждения

Резервный источник питания с шиной PMBus, который может сообщать о VIN, IIN, POUT, температуре, оборотах вентилятора и истории неисправностей, дает вам сигналы, предшествующие отказу: растущий ток вентилятора, повышение внутренней температуры при постоянной нагрузке или модуль, который “делится” меньше с каждой неделей. Это разница между плановой заменой и неожиданной перезагрузкой.

Если вам нужен вид шасси, то это: Серверный корпус ISC-R166-4-M 1U с поддержкой резервного источника питания Это тот тип спецификации, который мне нравится, потому что в нем четко указан форм-фактор (482×660×44,5 мм) и ограничения, которые вы фактически интегрируете внутрь.

1U против 2U: интеграционная торговля, которую никто не хочет оценивать правильно

Конструкция резервного блока питания высотой 1U - это дисциплинарная проблема: вы отказываетесь от воздушного потока, расстояния между разъемами и эргономики обслуживания, и вы делаете ставку на то, что сможете отыграться за счет более жестких механических допусков и лучшего мониторинга.

Конструкция 2U с резервным блоком питания - это проблема маржи: у вас есть место, чтобы сделать все правильно, но команды часто заполняют это пространство большим количеством дисков, стоек, кабелей, а потом удивляются, когда путь горячей замены перекрывается стяжкой.

Выберите свой яд.

Сравнительная таблица: общие схемы интеграции резервных блоков питания

УзорТипичное оборудованиеПоведение при горячей заменеОбщая точка отказаГде это уместно
1U “двойное резервирование”Специализированные блоки питания 1U + объединительная платаОбычно да, но с учетом клиренсаИзнос разъемов объединительной платы; нарушение воздушного потокаЖесткие стойки, пограничные узлы, телекоммуникационные полки
Модули CRPS 2U2× CRPS + резервная объединительная панель блока питанияДа, замена модуля без использования инструментовМедь/OR-соединение задней панели; неправильная политика распределения нагрузкиСистемы хранения данных, виртуализация, смешанный PCIe
Одиночный ATX “большой блок питания”1× 1-3 кВт ATXНетОдин блок питания, один вход, один канал вентилятораЛаборатории, установки для разработчиков, экономичные сборки
Двойной ATX + плата синхронизации2× ATX + плата с раздельной нагрузкойИногда (но некрасиво)Не резервирование - потеря устройства на уровне одного блока питанияТолько если вы согласитесь на частичное отключение.
Мощность стойки ORv3Полка 48 В + узловые преобразователиДа, на уровне стойкиПреобразовательный каскад, защита шины стойкиКластеры, капсулы ИИ, стойки высокой плотности

Если вы живете в мире 2-3 кВт, не гадайте - читайте о компромиссах, изложенных в Возможность резервирования блоков питания мощностью 2-3 кВт для рабочих нагрузок с несколькими GPU, Особенно предупреждение о том, что “раздельная нагрузка на два БП - это не избыточность”.”

Более серьезный фон: напряжение в сети растет, и это проявляется внутри стойки

Вот неудобный макросюжет: ваши решения о резервных источниках питания на уровне шасси сталкиваются с ограничениями на уровне сети. В декабре 2024 г. Резюме Министерства энергетики США по отчету об энергопотреблении центра обработки данных LBNL заявила, что в 2023 году центры обработки данных использовали около 4,4% электроэнергии в США, а к 2028 году, по прогнозам, этот показатель достигнет примерно 6,7%-12%, а общее потребление электроэнергии центрами обработки данных вырастет до 325-580 ТВтч к 2028 году.
В условиях дефицита электроэнергии события, связанные с качеством электроэнергии, не становятся реже, они становятся более беспорядочными.

Таким образом, резервирование в серверном корпусе 1U/2U - это не только “умер блок питания”. Резервирование нужно для того, чтобы пережить неприятности на входе, сохранить стабильность преобразования и предотвратить срабатывание собственных схем защиты.

Интеграция резервных источников питания в серверные шасси 1U2U

Вопросы и ответы

Что такое резервный источник питания в серверном шасси 1U/2U?

Резервный блок питания в серверном шасси 1U/2U - это двухмодульная система БП (часто 1+1 или N+1), разработанная таким образом, чтобы сервер мог продолжать работать с номинальной нагрузкой, когда один БП удален, вышел из строя или заменен в горячем режиме, используя общую объединительную панель или плату распределения питания, которая управляет распределением нагрузки, OR-ing и изоляцией от сбоев.
После этого определения практический тест прост: возьмите один модуль под реальную рабочую нагрузку (например, синтетическую нагрузку 70-90%) и убедитесь, что он не перезагружается, вентиляторы работают нормально, а в журналах зафиксировано событие обхода отказа.

Что такое резервирование 1+1 блока питания?

Резервирование 1+1 PSU - это конфигурация, в которой установлены два идентичных блока питания, один из которых может нести всю нагрузку сервера, а второй разделяет нагрузку или остается в режиме ожидания, и система продолжает работать, если один модуль вышел из строя, отключен от сети или заменен во время работы, при условии, что объединительная плата и входные каналы независимы.
Если “1+1” требует наличия обоих блоков питания во избежание срабатывания OCP, вы построили хрупкую систему с двумя источниками питания, а не с резервированием.

Что такое резервная объединительная панель БП?

Резервная объединительная панель БП представляет собой сильноточную печатную плату с разъемами, которая принимает модули горячей замены, изолирует и объединяет их выходы постоянного тока для распределения нагрузки, а также распределяет шины 12 В и 5VSB и управляющие сигналы (PS_ON#, PWR_OK), чтобы можно было извлечь один модуль без отключения сервера.
Относитесь к нему как к предмету одежды: осматривайте его, следите за температурой и не экономьте на качестве контакта.

Что такое PMBus в резервном источнике питания?

PMBus в резервированном источнике питания - это цифровой интерфейс управления (обычно PMBus 1.2/1.3 через I²C/SMBus), который позволяет в режиме реального времени проводить измерения и вести журнал неисправностей - напряжение, ток, мощность, температура, скорость вращения вентилятора и история событий. Операторы могут проверять распределение нагрузки, прогнозировать отказ и устанавливать пороги оповещения, прежде чем блок питания отключится или тихо выйдет из строя под воздействием тепла.
Если вы работаете без телеметрии PMBus, вы летаете вслепую и называете это “высокой доступностью”.”

Является ли использование двух блоков питания ATX с платой синхронизации настоящим резервированием?

Использование двух блоков питания ATX с платой синхронизации - это трюк с разделением нагрузки, при котором каждый блок питания питает подмножество компонентов, поэтому один отказ обычно убивает половину из них и может дестабилизировать остальные; это не настоящее резервирование 1+1, поскольку один блок питания обычно не может нести полную нагрузку системы в чистом виде.
Если вам нужно время безотказной работы, используйте специально разработанную объединительную панель с резервным блоком питания или конструкцию CRPS и проверьте работу горячей замены.

Заключение

Если вы проектируете бокс 1U/2U и хотите, чтобы резервирование выжило в реальных условиях, начните с корпусов, в которых четко прописана поддержка резервных блоков питания и возможность их обслуживания. Серверный корпус категории 1U для компактных корпусов с резервным блоком питания и Серверные корпуса 2U, подходящие для CRPS и токопроводов повышенной мощности, Затем укажите заднюю панель и план PMBus, прежде чем выбирать мощность.
А если вы хотите, чтобы кто-то проверил вашу компоновку, воздушные потоки и план питания A/B до того, как вы купите металл, запросите цену и инженерный обзор на страницах шасси ISTONECASE.

Свяжитесь с нами, чтобы решить вашу проблему

Полный портфель продуктов

Мы предлагаем широкий ассортимент продукции для любых вычислительных задач - от серверных корпусов на базе GPU до корпусов для сетевых хранилищ.

Индивидуальные решения

Мы предлагаем услуги OEM/ODM для создания индивидуальных серверных корпусов и решений для хранения данных на основе ваших уникальных требований.

Всесторонняя поддержка

Наша специальная команда обеспечивает бесперебойную доставку, установку и постоянную поддержку всех продуктов.