Backblaze представила статистику надёжности для четверти миллиона HDD — 8- и 10-Тбайт модели стали ломаться чаще
Рост отказов жестких дисков в дата-центрах становится системной проблемой: по итогам второго квартала 2023 года годовая частота отказов (AFR) в парке одного из крупнейших облачных провайдеров выросла до 2,28%. Это почти на 50% выше показателя первого квартала (1,54%), что заставляет экспертов пересмотреть стратегии обновления парка накопителей.
Статистика накопителей: от идеальной работы до группы риска
Мониторинг охватывает почти 246 тысяч устройств, используемых для хранения данных. Из общего пула 4 460 дисков являются загрузочными, где соотношение SSD и HDD составляет 3144 к 1316. Основной массив данных собирается с 241 297 HDD, из которых для чистоты статистики исключены тестовые образцы и единичные модели. В итоге анализу подверглись 240 940 накопителей, сгруппированных по 31 модели.
Шесть моделей во втором квартале продемонстрировали нулевой уровень сбоев, однако три из них представлены в недостаточном количестве для формирования статистически значимых выводов.
Рекордсмены долголетия и тревожные сигналы
Самым возрастным рабочим накопителем в облачной инфраструктуре признан Seagate ST4000DM000 объемом 4 Тбайт, который функционирует без сбоев уже 105,2 месяца (почти 9 лет). Однако абсолютный рекорд принадлежит загрузочному диску WDC WD5000BPKT емкостью 500 Гбайт, чей срок службы достиг 122 месяцев — более 10 лет непрерывной работы.
Несмотря на отдельные примеры долгожительства, общая тенденция вызывает опасения. Рост AFR до 2,28% был ожидаемым, так как средний возраст парка увеличивается. Специалисты провели углубленный анализ зависимости отказов от срока службы и объема накопителя.
Уязвимость «возрастных» дисков: фокус на 8 и 10 Тбайт
Особое внимание уделено накопителям старше пяти лет — категории, которую операторы ЦОД считают критической. В эту группу попали модели емкостью 4, 6, 8 и 10 Тбайт. Диски 12, 14 и 16 Тбайт не достигли пятилетнего рубежа, поэтому их показатели не учитывались. Данные за последние три года демонстрируют, что старые 4- и 6-терабайтные модели сохраняют приемлемую надежность. Проблемным сегментом стали накопители на 8 и 10 Тбайт — именно они формируют «группу риска», существенно увеличивая общий показатель AFR.
За весь период наблюдения с апреля 2013 года по июнь 2023 года сводный AFR составил 1,45%, что на 0,05 процентных пункта выше, чем кварталом ранее. Эта динамика подтверждает долгосрочный тренд на постепенное снижение надежности эксплуатируемого оборудования.
Ранее отрасль наблюдала устойчивое снижение AFR за счет внедрения более новых моделей и совершенствования технологий производства. Однако текущий рост отказов совпадает с этапом активного старения парка HDD, который компании не спешат массово заменять из-за высокой стоимости твердотельных аналогов большой емкости. Проблема усугубляется тем, что наиболее уязвимые диски объемом 8 и 10 Тбайт являются «рабочими лошадками» во многих ЦОД, обеспечивая баланс между ценой и вместимостью.
Дальнейший рост AFR может спровоцировать волну преждевременных замен накопителей в облачных сервисах, что приведет к увеличению капитальных затрат. Для конечных пользователей это обернется либо ростом тарифов на облачное хранение, либо переходом провайдеров на более дорогие, но надежные SSD-массивы. В среднесрочной перспективе рынок ожидает ускоренное вытеснение HDD из сегмента активного хранения данных, оставляя за ними лишь нишу холодного архивирования.















