После запуска партии из 1200 плат управления зарядной станцией заказчик получил 3.8% отказов в первые две недели эксплуатации. Стандартная линия SMT-сборки отработала корректно: SPI, AOI, рентген для BGA и функциональный тест не показали критических отклонений. Проблема проявилась только под комбинированной нагрузкой: плата работала при температуре окружающей среды 55°C, токе 80% от номинала и циклическом переключении силовых реле. Анализ возвратов показал типичную картину infant mortality: дефекты пайки силовых компонентов, нестабильные DC/DC-модули и один некорректно запрограммированный MCU-порог brown-out. После введения 8-часового burn-in при 65°C и ESS-профиля с циклами включения/выключения уровень ранних отказов снизился до 0.4%.

Главный вывод: burn-in не улучшает конструкцию изделия и не исправляет слабый процесс. Но он позволяет выявить скрытые ранние отказы до отгрузки, если профиль испытаний привязан к реальной физике отказов, а не выбран по принципу «подержим изделие в печи подольше».

Что такое burn-in, ESS, HALT и HASS — и почему их часто путают

Burn-in — это продолжительная работа изделия или PCBA под электрической нагрузкой, часто при повышенной температуре, чтобы ускоренно проявить ранние отказы компонентов и сборки. На практике burn-in обычно длится от 4 до 168 часов и используется после контрактной сборки под ключ, когда изделие уже функционально завершено.

ESS (Environmental Stress Screening) — более широкий подход: изделие подвергается контролируемым стрессам, которые не выходят за границы проектной прочности, но помогают выявить скрытые дефекты производства. Это могут быть температурные циклы, циклы питания, повышенная влажность, функциональные переключения выходов и интерфейсов. На странице тестирования и контроля ESS логично стоит рядом с ICT, FCT и AOI: это не замена базовым тестам, а надстройка над ними.

HALT (Highly Accelerated Life Test) применяется на стадии разработки и валидации конструкции, а не для серийного скрининга. Его задача — довести изделие до предела и найти слабые места дизайна: резонансы, трещины в пайке, деградацию компонентов, ошибки теплового проектирования. Для этого используют температуры и градиенты, значительно превышающие штатные режимы.

HASS (Highly Accelerated Stress Screen) — серийный скрининг, построенный на данных HALT. Он использует более мягкий профиль, чем HALT, но быстрее классического burn-in. Если у вас нет реальных данных HALT, попытка «изобрести HASS на глаз» часто превращается в дорогой источник ложного брака.

Burn-in отвечает на вопрос "сломается ли изделие рано", а HALT — "где у конструкции предел прочности". Это разные задачи, и смешивать их нельзя.

Когда burn-in действительно оправдан

Burn-in имеет смысл не для всех проектов. Для простого потребительского устройства стоимость скрининга может оказаться выше, чем стоимость гарантийных замен. Но для ряда применений он экономически оправдан почти всегда:

Изделия для медицинской отрасли, где ранний отказ может привести к остановке терапии или диагностического цикла.
Блоки для автомобильной электроники, особенно если в конструкции есть силовые каскады, BGA, сложные DC/DC и работа в широком температурном диапазоне.
Контроллеры для промышленной автоматизации, где простой оборудования стоит дороже самого электронного модуля.
Изделия с высокой стоимостью сервисного выезда: телеком-шкафы, удалённые IoT-узлы, наружные контроллеры.
Новые изделия после NPI, особенно если проект только что прошёл первичный контроль FAI и статистика поля ещё не накоплена.

Обычно burn-in приносит максимальную пользу в трёх сценариях:

Новый продукт с неизвестным реальным распределением отказов.
Изменение BOM, поставщика компонентов, паяльной пасты или профиля SMT-монтажа.
Переход от прототипа к серии после этапа прототипной сборки, когда изделие начинает работать часами, а не минутами на инженерном столе.

Когда burn-in не нужен или вреден

Есть и обратная сторона. Burn-in часто вводят формально, потому что «так спокойнее». Это ошибка.

Ошибка 1: использовать burn-in вместо инженерного анализа корневой причины. Если партия не проходит функциональное тестирование, burn-in не вылечит проблему. Он лишь замаскирует нестабильный процесс и съест ресурс лаборатории.

Ошибка 2: завышать температуру без понимания ограничений компонентов. Электролиты, кварцы, оптопары, разъёмы, дисплеи и клеевые материалы деградируют по-разному. Если вы испытываете изделие при 95°C, а слабым местом является пластиковый разъём кабельной сборки, вы проверяете не реальную надёжность, а устойчивость к неправильно выбранному тесту.

Ошибка 3: тестировать только "голую" плату, хотя в поле работает система. Для устройств, где критичны проводка и межблочные соединения, burn-in нужно проводить в составе системы или хотя бы с подключёнными силовыми кабельными сборками и релевантными жгутами проводов. Иначе вы не видите нагрев контактов, падение напряжения на жгуте и отказы при циклической коммутации.

Ошибка 4: не разделять screening и life test. 24-часовой burn-in в производстве не доказывает, что изделие проживёт 5 лет. Для этого нужны расчёты derating, ресурсные испытания и данные по применению.

Ошибка 5: держать 100% продукции на burn-in "на всякий случай". Для зрелого процесса часто достаточно скрининга пилотных партий, First Article, стартовых серий или статистически обоснованной выборки.

Плохо выбранный burn-in создаёт ложный брак, перегружает производство и иногда повреждает годные изделия.

Какие отказы burn-in помогает выявить лучше всего

Burn-in наиболее эффективен против дефектов, которые проявляются в ранний период жизни изделия под температурой и нагрузкой:

Тип дефекта	Проявление на burn-in	Уловит ли ICT/AOI без burn-in	Комментарий
Пограничная пайка силового компонента	Срыв питания, локальный перегрев, периодический отказ	Часто нет	Особенно актуально после селективной пайки и mixed technology
Дефект BGA/QFN под тепловой нагрузкой	Отказ после прогрева, intermittent reset	Частично	Нужна связка с рентген-контролем
Нестабильный DC/DC-конвертер	Просадка напряжения, ripple вне допуска	Частично	Хорошо проявляется при циклах нагрузки
Компонент с ранней деградацией	Drift параметров через 2–8 часов	Нет	Типично для marginal semiconductor lots
Ошибки прошивки и power sequencing	Reset loop, watchdog, brown-out	Частично	Особенно в многошинных системах
Нестабильные межблочные соединения	Потеря связи, рост сопротивления контакта	Нет	Актуально для кабельных сборок и жгутов

Burn-in почти бесполезен против дефектов, которые уже должны быть выявлены раньше: перепутанная полярность, явные короткие замыкания, отсутствующие компоненты, грубые ошибки BOM. Для этого есть AOI, ICT, FCT, DFM для сборки и входной контроль.

Как выбрать профиль burn-in без самообмана

Корректный профиль строится не вокруг абстрактного числа часов, а вокруг четырёх переменных:

Температура окружающей среды на испытании.
Электрическая нагрузка по основным цепям.
Динамика работы изделия: включения, выключения, переключения режимов, обмен по интерфейсам.
Длительность, достаточная для проявления известных ранних дефектов.

Практический ориентир для OEM-покупателя и инженера NPI:

Тип изделия	Типичный профиль	Длительность	Комментарий
Промышленный контроллер PCBA	55–70°C, 70–90% нагрузки, циклы I/O	6–12 ч	Баланс стоимости и выявляемости
Медицинский модуль	45–60°C, непрерывная работа, контроль дрейфа	12–24 ч	Важна стабильность, а не экстремальность
Силовой блок / зарядный модуль	60–85°C, 80–100% нагрузки, циклы питания	8–24 ч	Нужен контроль горячих точек и разъёмов
Серверный/телеком узел	50–65°C, трафик и питание под нагрузкой	12–48 ч	Скрининг PSU, памяти, линков
Зрелый массовый продукт	Выборочный ESS	2–8 ч	Часто выгоднее 100% burn-in

Если изделие работает с высокой плотностью мощности, начните не с максимальной температуры камеры, а с измерения фактической температуры hot spot на плате. Например, если MOSFET уже разогревается до 92°C при ambient 25°C, то камера 70°C без дерейтинга создаст локальную температуру junction выше безопасного предела. В таких случаях сначала нужен анализ теплоотвода печатных плат и, возможно, корректировка конструкции.

Правильный burn-in доводит изделие до репрезентативного стрессового режима, но не должен разрушать его быстрее, чем реальная эксплуатация.

Burn-in для PCBA, box build и кабельных систем: режимы отличаются

Для голой PCBA основной риск — пайка, компоненты и управление питанием. Для box build добавляются вентиляторы, дисплеи, механические крепления, заземление корпуса и межблочные кабели. Для системы с внешними соединениями важно отдельно смотреть на:

падение напряжения на кабельной трассе;
нагрев контактов и силовых клемм;
стабильность фиксации разъёмов при циклах нагрузки;
поведение экранирования и заземления в составе изделия.

Если ваш продукт включает корпусную сборку, кабельную коммутацию и несколько модулей PCBA, скрининг на уровне одной платы редко достаточен. В таком случае разумный порядок такой:

Скрининг PCBA после сборки и базового FCT.
Интеграция в систему.
Короткий burn-in готового изделия с реальной периферией и интерфейсами.

Это особенно важно для изделий на стыке производства печатных плат и кабельной подсистемы: ESS может выявить не только электронный, но и межсистемный дефект.

Burn-in и ESS в сравнении с HALT/HASS

Метод	Где применяется	Стресс	Цель	Типичный результат
Burn-in	Производство / NPI	Умеренный, длительный	Отсев ранних отказов	Pass/Fail партии или выборки
ESS	Производство	Комбинированный, контролируемый	Выявление скрытых производственных дефектов	Снижение early field failures
HALT	Разработка	Очень высокий, за пределами нормы	Поиск пределов конструкции	Карта слабых мест дизайна
HASS	Серия после HALT	Высокий, но ниже HALT	Быстрый серийный скрининг	Быстрый отбор нестабильных изделий

Типичная ошибка OEM-заказчика — требовать HASS от поставщика, не имея исходных данных HALT и не определив destruct limits. Более прагматичный путь для большинства проектов у EMS-подрядчика такой:

для первых партий: burn-in + ESS;
для зрелого продукта: выборочный ESS;
для критического нового продукта: HALT на этапе разработки, затем HASS или оптимизированный ESS.

Как определить объём контроля: 100% или выборка

100% burn-in оправдан не всегда. Решение зависит от стоимости отказа, зрелости процесса и доступности данных по полю.

Сценарий	Объём burn-in	Почему
Новый медицинский или automotive продукт	100% первых партий	Цена отказа выше стоимости скрининга
Новый промышленный контроллер, серия 100–1000 шт.	100% pilot + выборка серий	Нужно быстро набрать статистику
Зрелый продукт со стабильным Cpk и low ppm	Выборка 5–20%	Полный burn-in редко окупается
Изменение BOM / поставщика / прошивки	Временный возврат к 100%	Риск новых ранних отказов резко растёт

Если вы только выбираете подрядчика для контрактного производства электроники, спрашивайте не только "делаете ли вы burn-in", но и "по каким критериям вы включаете или выключаете его для продукта". Зрелый EMS-партнёр должен объяснять логику выборки, а не продавать burn-in как универсальную страховку.

Что обязательно включить в спецификацию на burn-in

Плохо сформулированное ТЗ порождает споры между OEM и производителем. Минимальный набор требований:

Температура камеры и допустимое отклонение, например 65°C ±3°C.
Электрическая нагрузка по основным каналам: ток, напряжение, duty cycle.
Последовательность режимов: boot, idle, communication, max load, cycling.
Длительность теста и критерии pass/fail.
Логируемые параметры: ток потребления, напряжения, температура hot spot, ошибки интерфейсов.
Объём выборки или правило 100% screening.
Действия при отказе: ремонт, повторный тест, MRB, RCA.

Отдельно задайте, в каком состоянии испытывается изделие:

только PCBA;
PCBA в корпусе;
полностью собранный box build;
система с подключёнными коаксиальными, силовыми или сигнальными кабельными сборками.

Какие метрики нужно собирать во время burn-in

Burn-in без данных малоценен. Для инженерного решения нужны хотя бы:

число отказов по часам теста;
распределение отказов по типу дефекта;
температура критических точек платы;
отклонение выходных напряжений и токов;
количество повторных прохождений после ремонта;
корреляция с лотами компонентов, линией, сменой, оператором.

Если отказ выявлен на 20-й минуте, а не на 10-м часу, это влияет на экономику режима. Часто после трёх-четырёх партий становится видно, что 80% дефектов проявляются в первые 90 минут. Тогда 12-часовой burn-in можно сократить до 2 часов ESS + расширенного FCT, не теряя эффективности. Именно поэтому burn-in надо регулярно пересматривать, а не делать вечным процессом.

Практический алгоритм внедрения burn-in для новой электроники

Определите, какова стоимость раннего отказа в поле: сервисный выезд, отзыв, простой оборудования, ущерб бренду.
Проверьте, закрыты ли базовые методы контроля: AOI, ICT/Flying Probe, FCT, рентген для BGA, входной контроль.
Выберите, что именно скринировать: PCBA, box build или изделие в системе.
Снимите реальные тепловые данные и hot spots, а не задавайте температуру камеры вслепую.
Запустите burn-in на первой партии и классифицируйте все отказы по корневым причинам.
Сравните стоимость screening с ожидаемыми затратами на ранние отказы в поле.
Зафиксируйте правило пересмотра профиля через 3–5 серий или после любого изменения BOM/прошивки.

Чек-лист для OEM-покупателя перед утверждением burn-in у EMS-поставщика

☐ Есть ли у поставщика связка FAI + FCT + burn-in, а не только «термошкаф и чекбокс в отчёте»?
☐ Привязан ли профиль к реальным условиям эксплуатации, а не к случайно выбранной температуре?
☐ Понимает ли поставщик, какие отказы burn-in должен выявить именно в вашем изделии?
☐ Есть ли данные по отказам с разбивкой по времени, лотам и корневым причинам?
☐ Определено ли, нужен 100% screening или статистическая выборка?
☐ Проводится ли повторный тест после ремонта по формализованной процедуре?
☐ Проверяется ли изделие с реальными кабелями, жгутами и периферией, если это важно для приложения?
☐ Есть ли критерий, при котором burn-in можно сократить или заменить ESS-профилем?

Часто задаваемые вопросы

Можно ли заменить burn-in обычным функциональным тестом?

Нет, если ваша задача — выявить ранние отказы под температурой и длительной нагрузкой. FCT подтверждает, что изделие работает в момент проверки. Burn-in показывает, сохраняет ли оно стабильность в течение времени.

Нужно ли проводить burn-in для каждой платы с BGA?

Не обязательно. Для BGA критичнее сначала обеспечить правильный процесс: профиль оплавления, рентген-контроль, критерии IPC и корректный stackup. Burn-in полезен, если отказ проявляется именно после прогрева и циклов нагрузки. Иначе он лишь дублирует слабый процесс контроля.

Сколько часов burn-in достаточно?

Единого числа нет. Для многих промышленных изделий 6–12 часов дают большую часть пользы. Если реальные данные показывают, что дефекты проявляются за первые 60–120 минут, более длинный цикл может быть экономически неоправдан.

Подходит ли burn-in для кабельных сборок и жгутов?

Да, но в другой форме. Для кабельных изделий чаще используют циклы электрической нагрузки, hi-pot, проверку сопротивления контактов и термонагрев под током. Для систем с проводкой полезно испытывать изделие в сборе, а не отдельную плату.

Доказывает ли burn-in долгий срок службы изделия?

Нет. Burn-in снижает риск ранних отказов, но не заменяет ресурсные испытания, HALT, расчёты derating и анализ условий эксплуатации.

Заключение

Burn-in — сильный инструмент, если он встроен в инженерную стратегию качества, а не существует отдельно от процесса. Для новых и ответственных изделий он помогает убрать infant mortality до отгрузки. Для зрелых продуктов его нужно регулярно пересматривать и сокращать до того уровня, который подтверждён данными, а не привычкой. Лучший результат даёт связка: корректный DFM, управляемый процесс сборки, внятный First Article, достаточный набор электрических тестов и только затем burn-in или ESS с понятной экономикой.

Если вы закупаете PCBA, box build или систему с кабельной коммутацией, обсуждайте burn-in на языке риска, режима и данных. В противном случае вы либо переплатите за лишний screening, либо отправите в поле дефекты, которые можно было поймать на заводе за один цикл.

Burn-in тестирование: когда оно снижает ранние отказы