Ssd время наработки на отказ: сколько живёт, какое время наработки на отказ и на сколько его хватит – Сколько прослужит SSD — Ответы на вопросы

Содержание

сколько живёт, какое время наработки на отказ и на сколько его хватит

Определяем срок службы SSD: сколько живёт, какое время наработки на отказ и на сколько его хватит

Самая большая проблема SSD — срок службы меньше (в связи с износом твердотельного накопителя), чем у традиционных HDD и гибридных устройств.

Каждый раз, когда ваши данные записываются в ячейку NAND, она слегка вырабатывается. При достижении критического количества циклов записи та самая «измочаленная» ячейка NAND в конечном итоге потерпит неудачу завершения операции.

Понимание реального срока службы SSD-накопителя поможет организации определить, когда переход на такой формат хранения данных оправдан, а когда нет.

До сих пор не появилось единого мнения, как точно посчитать сколько живёт SSD, то есть когда именно он выйдет из строя. Тем не менее, алгоритм действий по определению потенциала той или иной модели накопителя существует. Поделился им Брайен Поузи (Brien Posey) — вице-президент

Relevant Technologies по исследованиям и разработкам в области ИТ.

Мы приведём несколько цитат Брайана и основы его подхода в определении времени, сколько живут SSD-диски любых моделей и производителей.

Определяем срок службы SSD: сколько живёт, какое время наработки на отказ и на сколько его хватит

Почему так сложно узнать срок службы SSD?

SSD служит меньше, чем HDD — вы тоже так считаете? Это мнение так распространено, что обратному никто и не поверит.

Производители не спешат указывать какие-то конкретные цифры — ведь устоявшихся стандартов в этой области не появилось. А значит, если каждый будет указывать «отсебятину», то и конкурентная борьба выльется в совершенно бессмысленную гонку вооружений.

«Большинство людей согласны с тем, что твердотельные накопители достаточно надёжны для массового использования, но я иногда читал сообщения в блогах, что современные твердотельные накопители гораздо более долговечны, чем даже самые лучшие жёсткие диски», — говорит Брайан.

Разные классы накопителей отличаются и по характеристикам, и по надёжности. Например, диск SLC, как правило, обладает гораздо большей долговечностью, чем диск QLC. Эксплуатация тоже играет немаловажную роль при определении срока службы: приложения с интенсивной записью ухудшают работу SSD гораздо быстрее, чем приложения, которые выполняют только случайные записи (те же резервные копии).

Всё это практически невозможно предсказать производителю. И всё-таки зная свои цели и привычки, вы способны прикинуть перспективы перехода на твердотельные накопители вполне самостоятельно. Уделим этому моменту особое внимание.

Определяем срок службы SSD: сколько живёт, какое время наработки на отказ и на сколько его хватит

Как определить, сколько живет SSD?

Попробуйте научиться определять, сколько осталось SSD жить в вашей существующей системе или каковы перспективы проработать у выбранной модели как можно дольше. При помощи объяснений, предложенных Брайаном, вам потребуются лишь трое точных сведений.

  • Program/Erase Cycles — количество циклов операций
  • TBW — сколько можно записать терабайт данных
  • DWPD — как много раз вы перезаписываете диск в день

I. Показатели от производителя

Количество циклов операций (program/erase cycles), которым подвергается устройство — это значение, которое стараются предложить производители в качестве основного параметра срока службы SSD. Но только с этими цифрами невозможно даже отдалённо спрогнозировать, когда диск выйдет из строя, как мы и сказали выше. Но без него вы тоже не сможете сделать сколь-нибудь честную оценку.

II. Количество гарантированных операций

Два других более важных фактора, которые нужно изучить — это общее количество терабайт записи (TBW) и число операций записи на диске в день (DWPD). Производитель накопителя предоставит вам сведения об общем количестве терабайт, которые, по его проектным оценкам, должны записаться в течение гарантированного срока службы.

«Например, компьютер, который я сейчас использую, имеет диск объёмом 1 ТБ. По словам производителя, диск имеет показатель Terabytes Written (TBW) 500. Это означает, что в течение срока службы накопителя я могу рассчитывать на запись в него около 500 терабайт данных», — объясняет Брайан.

На практике это совсем не гарантированные 500 циклов операций записи и стирания на ячейку, как можно подумать изначально. Большинство производителей имеют дополнительные резервные ячейки NAND на диске. Эти дополнительные «клетки под данные» могут быть использованы вместо сильно изношенных (эдакий запас прочности для увеличения срока службы SSD).

«Другими словами, это некая оценка того, как можно использовать диск. Например, вы записываете 2 ТБ в день на диск объёмом 1 ТБ — получается около 2 операций записи в день. Если диск поддерживает 500 TBW, а вы выполняете на нём 2 операции перезаписи в день (DWPD) при ёмкости 1 ТБ (всего выходит около 2 ТБ в день), то диск должен работать примерно 8 месяцев (500 TBW / 2 TB в день = 250 дней)», — с наглядным примером Брайан раскрывает секреты определения, сколько служит SSD.

Имейте в виду, что оценка выходит приблизительная

! Некий ожидаемый диапазон долговечности ячеек NAND. Например, «ожидается, что диск TLC с 3D NAND будет поддерживать от 1500 до 3000 циклов записи».

Рассчитанная цифра, на сколько хватит SSD, грубая оценка ещё и потому, что файловые хранилища редко используются столь линейно и равномерно. Даже при выравнивании износа (путём специального ПО для твердотельных накопителей, например) некоторые области диска всё равно могут записываться чаще, чем другие.

Определяем срок службы SSD: сколько живёт, какое время наработки на отказ и на сколько его хватит

Показатель среднего времени наработки на отказ у SSD

При определении надёжности диска не стоит пренебрегать характеристикой среднего времени до отказа, когда его производитель рассчитывает и указывает на основании результатов испытаний на выносливость.

Никто точно не знает, каковы были особенности тестов Western Digital в данном случае. Но есть основное предположение того, откуда могло прийти значение среднего времени наработки на отказ в 1,75 миллиона часов.

Среднее время наработки на отказ у SSD учитывает:
  • количество тестируемых устройств,
  • часы тестирования,
  • число отказавших устройств.

Предположим, что Western Digital решила протестировать 17 500 твердотельных накопителей, тестирование длилось 5000 часов (примерно семь месяцев) и во время теста отказали, например, 50 дисков. Вот как сработает математика:

17 500 дисков * 5 000 часов тестирования каждого / 50 отказов = 1 750 000

Этот расчет даст значение среднего времени наработки на отказ 1,75 миллиона часов. Значение не может даже примерно показать, на сколько лет хватит SSD. Но диски с более высоким значением «Среднее время наработки на отказ», вероятно, более надёжны, чем диски с низким значением, верно?

Определяем срок службы SSD: сколько живёт, какое время наработки на отказ и на сколько его хватит

В конечном счете, не существует универсальной формулы, чтобы точно определить как долго будет работать SSD. Тем не менее, рейтинг TBW диска и среднее время до отказа должны дать вам некоторое представление.

Логотип компании «ZEL-Услуги»Компания ZEL-Услуги

Любые манипуляции с компьютерами для офиса, сервера или коммерческих целей, разумеется, составляют сейчас большой риск для бюджета фирмы. Передайте заботы об ИТ-оборудовании в компанию ИТ-аутсорсинга с экспертной поддержкой и консультацией по любым техническим вопросам и задачам.

Сколько прослужит SSD — Ответы на вопросы

Сколько прослужит SSD

Время стремительно идет вперед, технологии совершенствуются и вы приходите к мысли, что вам нужно заменить свой старенький HDD на SSD накопитель.
При выборе SSD вы задаетесь таким вопросом: «Сколько прослужит эта модель SSD-накопителя?».

Срок службы SSD-накопителя оценивается двумя параметрами:
— Среднее время наработки на отказ (MTBF),
— Ресурс SSD.
Наиболее важный из них, это «Ресурс SSD».

Оба эти параметра можно увидеть в технических характеристиках конкретной модели.
Если производитель их не указал, то лучше пройти мимо такой модели SSD.

С параметром «Среднее время наработки на отказ (MTBF)» достаточно все понятно, оно указывается в часах.
Например, MTBF=2 000 000 часов, это примерно 83 333 суток (дней) или примерно 228 лет.

Параметр «Ресурс SSD» характеризуется общим объемом данных, который может быть записан на SSD-накопитель до достижения предела износа, т.е.
суммарное число записываемых байтов (TBW).
Например, TBW=150 TB, это соответствует записи на SSD примерно 40 ГБ в день в течение 10 лет.

После приобретения SSD можно периодически отслеживать состояние вашего накопителя.
Мы советуем для этого воспользоваться утилитой SSD-Z.

Сколько прослужит SSD

На вкладке «Device» мы видим оба эти параметра:
— «POH», это время наработки (MTBF) в днях (d) и часах (h), т.е это время, которые уже отработал ваш диск.
— «Bytes Written», это суммарный обьем записанных байтов (TBW).

Если эти параметры уже близки значениям указанным производителем SSD, то пора задуматься о его замене.
Естественно не нужно забывать, что отказ SSD может произойти и по другим причинам, например, из-за перебоя с питанием.

MTBF — откуда берется «миллион часов MTBF» / Habr

Просто удивительно то, насколько велико непонимание вокруг такого широко распространенного понятия, как MTBF (Mean Time Between Failure — «Время между сбоями» или «наработка на отказ» ), насколько смысла этой величины не понимают, зачастую, даже специалисты в области хранения данных.

Казалось бы — что может быть проще. «Наработка на отказ» это время беспроблемной работы, от первого включения нового диска, до момента отказа, посчитанная в часах.

Почти любой, кто поинтересуется значением, приводимым производителями, в качестве MTBF современных дисков, и с легкостью сделает несложные подсчеты, будет удивлен странной его величиной.
На сегодня величина MTBF приводится в миллион или даже полтора миллиона часов.
В году — примерно 8760 часов, значит, исходя из нашего понимания «физического смысла» этого значения, производитель планирует «наработку на отказ» для любого такого диска более ста лет (114 лет, для миллиона часов MTBF), что является очевидной нелепостью для каждого, у кого подыхали жесткие диски.

Тогда что это за «миллион часов», где и каким образом он измерен?
Конечно же производитель не гоняет диск 114 лет, оценка производится искусственно, но откуда вообще взялась величина в «миллион часов»?

Дело в том, что MTBF измеряется для всей эксплуатируемой «дисковой популяции», и распространяется на период объявленного гарантийного срока для данного типа дисков. Оба выделенных момента являются важными, и часто опускаются в описании, что и приводит к принципиальному непониманию.

Представим себе, что мы поставили в сервер жесткий диск, который проработал 3 года гарантийного срока, и, будучи исправным, был заменен на новый. Следующий проработал три года, и был заменен по истечении гарантийного срока, и так далее. И вот на 38-м диске вы вправе ожидать, что до конца гарантийного срока он не доработает.

Или же представим себе чуть более приближенную к реальности ситуацию.
Допустим, для простоты подсчета, у нас есть система хранения на 115 дисков. Для каждого диска производитель приводит MTBF равный миллиону часов. Но надо принять во внимание то, что в большой дисковой популяции общий MTBF, то есть вероятность отказа, растет, с увеличением количества используемых дисков.
Для 115 дисков, исходя из приводимой вендором величины MTBF, мы вправе ожидать, что хотя бы один диск из популяции в 115 выйдет из строя до конца трехлетнего гарантийного срока.
Этот вариант уже куда более похож на правду.

Строго говоря, на практике, вместо MTBF гораздо практичнее пользоваться параметром AFR — Annual Failure Rate, или «ежегодная вероятность сбоев», выводимом из MTBF.
Он вычисляется как: AFR = 1-exp(-8760/MTBF)
Величина AFR для диска с миллионом часов MTBF составляет 0,87%, что, в принципе, хоть и чуть завышено (Google в известном исследовании 2007 года показывает для новых дисков в пределах гарантийного срока как раз AFR в районе 1%), но, все же уже довольно хорошо согласуется с практикой.

Любопытно, что, например, такой производитель жестких дисков как WD теперь вовсе перестал указывать величину MTBF, перейдя на указание другого параметра: «power on/off cycles», по видимому не в последнюю очередь именно в связи с явно видимым непониманием и неочевидностью применения указываемой величины MTBF пользователями.

Как работает SSD-диск — время жизни твердотельного накопителя

     Если у Вас есть SSD-диск или Вы только собираетесь его купить, то данная статья будет очень полезна для Вас. Ранее я уже писал статью о достоинствах и недостатках SSD-диска, можете ознакомиться по этой ссылке. Но для начала прочитайте данную статью до конца.


Как работает SSD-диск


     Хотелось бы коротко поговорить о принципе работы твердотельного накопителя.

1. TRIM


     Функция TRIM в диске позволяет операционной системе отмечать ненужные данные специальным образом. За счет этого контроллер не перемещает эти данные в другие блоки, что очень уменьшает количество циклов перезаписи и повышает скорость записи новых данных.


     Функция TRIM в ОС Windows (современных версиях) включена автоматически. Я бы посоветовал все же проверить ее. Например, на ОС Linux мне пришлось все настроить самому.

2. Выравнивание износа


     Все SSD-диски имеют ограниченное количество циклов перезаписи. Если постоянно писать данные в один блок, то SSD уменьшит емкость и «умрет». Эта проблема была решена следующим образом: теперь контроллер записывает данные равномерно по всем блокам SSD-диска.

3. Сбор мусора


     Память SSD-диска состоит из блоков (ячеек). Для более наглядного представления мысленно представьте пчелиную соту. В свою очередь блок состоит из страниц. После записи блока, частично его перезаписать нельзя. Чтобы записать на него данные приходиться стирать его целиком.


     Но и тут есть один нюанс. Из блоков, которые будут стерты, нужная информация перезаписывается в другой блок, а все остальное удаляется. Далее этот блок будет опять готов к новой записи. Тут надо понимать, что блок (ячейка) данных можно стирать ограниченное количество раз. Кстати, у каждого SSD-диска количество циклов перезаписи разные.

На заметку! При покупке SSD-диска я советую посмотреть на этот параметр внимательнее. Чем больше циклов перезаписи, тем дороже будет диск.
Сам процесс, который я описываю выше называется Garbage collection (сбор мусора).

4. Объем записи


     Функция выравнивание износа и сбор мусора приводит к увеличению фактического объема данных.


Запись данных на SSD-диск может быть 2 видов:

1. Последовательная запись — при такой записи блоки заполняются равномерно. Допустим, Вы копируете какие либо файлы (музыку, фильмы и т. д.)

2. Случайная запись — это активное перемещение файлов по ячейкам памяти. Такая запись происходит при работе операционной системы.

     Отсюда можно сделать вывод, что вся работа SSD-диска возлагается на контроллер. Он обеспечивает равномерное распределение данных по ячейкам памяти, продлевает срок службы SSD-диска.

Время жизни SSD-диска


     В том году я себе приобрел SSD-диск Kingston Hyper-X FURI на 120 Гб. В качестве примера я хочу взять его. Обращаю внимание на то, что я не рекламирую диск и не навязываю его к покупке.


     На момент покупки я прочитал огромное количество обзоров (я думаю все так делают), и свой выбор остановил на нем.
     Так вот, при выборе диска я прежде всего обратил внимание на скорость чтения и записи (составляет 500Мб/с / 500 Мб/с). Главным параметром для меня было количество циклов записи.
     У взятого мною диска суммарное число записываемых байтов (TBW) составляет TBW = 354 Тб, а количество записей в день (DWPD) равно 2,75. Средняя наработка на отказ 1 млн часов, гарантия 3 года.
     Теперь давайте немного посчитаем, если я где-то ошибусь, то прошу поправить меня в комментариях.
Допустим, 354 Тб дается нам на 3 года. Значит, в год нам будет доступно 118 000 Гб ( 354 000/3), в месяц получаем 9833 Гб (118 000/12), в день 327 Гб (9833/30). Вы только представьте, чтобы «убить» мой SSD-диск за 3 года мне придется каждый день записывать по 327 Гб информации. Честно скажу, для меня это просто нереально. А ведь есть SSD-диски с куда большим TBW.
     Мне стало интересно, если я буду каждый день записывать по 10 Гб. Что же я получаю: 354 000/10=35 400 (!) дней. А в годах: 35 400/365=97. Таким образом, при ежедневной записи 10 Гб в день мой SSD-диск будет работать 97 лет. С трудом в это верится, ведь наши расчеты в теории верны. На деле же есть и другие нюансы.

Жертвы стереотипов


     Когда появись первые SSD-диски, срок их работы составлял относительно малое количество времени. И вот с тех пор сложились стереотипы, что SSD-диски недолговечны. Но время идет, и прогресс, как мы знаем, не стоит на месте. Уверен, у многих пользователей SSD-диск вышел из строя не только по причине израсходованного ресурса цикла перезаписи. На срок работы SSD-диска влияют много факторов: скачок напряжения, сбой в работе прошивки и прочее.


     Таким образом, если Вы собираетесь записывать терабайты торрентов, то SSD-диск Вам явно не подойдет. А вот для ОС, личных файлов, игр SSD-диск будет незаменим.

Поможем друг другу


     И еще один практический момент. Друзья! Кто прочитал статью и пользуется SSD-дисками, давайте поможем друг другу.


     В комментариях напишите, каким SSD-диском (фирма, модель, год выпуска) Вы пользуетесь/пользовались. Подробно опишите свои впечатления за время пользования, оцените его достоинства и недостатки. И, надеюсь. Мы сломаем старые стереотипы о том, что SSD-диски недолговечны. Заранее спасибо!

SSD лучше, чем HDD – но какой диск надежнее

Эра популяризации SSD началась с введением на рынок Windows 7. Это первая система от Microsoft, которая правильно работала с этим типом памяти и не вела к преждевременному выходу диска из строя. В то же время появились первые серьезные проблемы с этими носителями.

Источник беспокойства

Вновь установленный носитель SSD в системе Windows XP работал плавно, однако, с течением времени, чрезмерное количество записей, генерируемых системой, вызывало неисправности в работе SSD. То не было ни виной системы, ни оборудования – плохой идеей было просто такое соединение продуктов.

Распределение областей памяти на диске SSD

В начальной стадии развития SSD возникали также проблемы с дисками Intel. В большинстве испытаний были отличные результаты, однако, попытка использования в тесте Iometer вела к повреждению носителя. В реальных условиях продукты работали без оговорок.

Большую неудачу потерпела компания OCZ, которая в серии дисков Vertex использовала новаторский контроллер, встроенный в SSD. По разным сообщениям, до ⅓ всех носителей вышли из строя в течение первого года работы.

Однако, для современных SSD производители гарантируют очень высокий уровень TBW. Поэтому слабая стойкость дисков SSD – это прошлое.

Total Bytes Written – главный параметр диска SSD

Указанный выше параметр TBW (от англ. Total Bytes Written) является наиболее важным параметром, определяющим качество SSD. Им обозначают общее количество терабайт, запись которых производитель гарантирует для данной модели.

Значения TBW зависят, в первую очередь, от типа используемой флэш-памяти. При условии, что система записывает на диск, в среднем, несколько гигабайт в день, типичный дешевый SSD с уровнем TBW порядка 20-50 ТБ прослужит около 10 лет.

TBW зависит от количества, так называемых, циклов стирания и записи одной ячейки памяти. У памяти TLC (Triple Level Cell) 500-3000 циклов, а для памяти MLC (Multi Level Cell) этот параметр на уровне 3000-10000 циклов. Самые дорогие, но самый эффективный и наиболее надежные модели SSD используют память SLC (Single Level Cell) – количество операций стирания и записи ячеек памяти достигает 100 000 циклов.

Забота о прочности SSD

Инженеры, создающий SSD, разумеется, знают об этих ограничениях записи, поэтому используют соответствующие функции. К наиболее важным следует отнести Wear Leveling – равномерное чередование записей в наименее нагруженных ячейках.

Специальные таблицы, собирающие информацию о проделанном числе записей, позволяют размещать в ячейках, находящихся ближе «к концу жизни», те данные, которые предназначены только для чтения (чтение данных не расходует ресурс SSD). Кроме того, каждая память SSD имеет запас ячеек для замены поврежденных.

Современные компьютеры имеют всё больше и больше оперативной памяти, поэтому в последнее время вернулись к идее использования её в качестве, так называемого, ram-диска, используемого для кэширования данных. Такие решения предлагают, в частности, Crucial и Plextor. Имея в виду продление работы SSD за счет уменьшения количества записей, виртуальный диск имеет смысл.

Появляются новые алгоритмы, управляющие сохранением данных в памяти, поэтому стоит проверять наличие новой прошивки для SSD. Установив программное обеспечение производителя, также стоит использовать предлагаемые изменения в конфигурации системы, которые направлены на увеличение срока службы и производительности SSD.

Тестирование SSD на прочность

Многие компании пытались измерить срок службы SSD – хороших результатов достигли в TechReport. В тесте проверили поведение несколько разных накопителей емкостью 240 ГБ. Самым слабым оказался Samsung SSD 840 с памятью TLC, который без проблем записал 100 ТБ данных, после чего стал происходить перенос данных из поврежденных ячеек в запасные. При дальнейшей работе диск смог перезаписать ещё почти 900 ТБ данных.

Kingston HyperX с памятью MLC записал без проблем около 600 ТБ, а при возникновении признаков перераспределения ячеек ещё 200 ТБ. Intel SSD 335 записал 728 ТБ, а затем переключился в режим «только чтение», что позволяет скачать записанные данные.

Показатели начала отказа секторов самых популярных SSD дисков

Лучший результат показал Samsung 840 Pro. Правда, переназначение секторов начало происходить после записи около 600 ТБ данных, однако, полное повреждение SSD произошло после сохранения 2,5 PB. Ни в одном из протестированных дисков не наблюдалось падения производительности.

Провести тесты SSD в большом масштабе обещает компания Backblaze – поставщик облачных услуг. В случае жестких магнитных дисков она регулярно выпускает отчеты для десятков тысяч используемых приводов.

SSD для параноиков

Если невероятно высокая долговечность SSD Вас ещё не убедила, Вы всегда можете перестраховаться. Одним из самых простых способов является массив RAID1, то есть дублирование данных на двух дисках.

Если у вас нет доверия к SSD, можно использовать массив RAID1, состоящий из одного твердотельного диска и одного жесткого диска. Благодаря этому, Вы получите скорость работы и уверенность в том, что никакие данные не будут потеряны в случае сбоя любого из носителей данных. Кроме того, решение будет дешевле, чем массив, состоящий из двух дисков SSD.

MTBF не определяет срока службы диска

Купив SSD, не стоит руководствоваться параметром MTBF (Mean Time Between Failures). В случае жестких дисков (HDD) он измеряется в сотнях тысяч, а SSD – в миллионах часов.

Например, среднее время наработки на отказ жесткого диска Seagate Barracuda 7200.11 – 700 тысяч. часов. Может показаться, что диск не завершит работу в течение 240 лет при работе по 8 часов в сутки. К сожалению, MTBF означает только вероятность отказа – 2920 часов в год (8 часов в день), деленное на 700 000 часов и умножить на 100%, означает, что вероятность отказа 0,42%. Другими словами один диск из 240 выходит из строя в течение года.

Почему меня нервируют отказы современных SSD / Habr

Сегодня один из SSD на одном из наших новых файловых серверов под Linux умер. Это не первая и, вероятно, не последняя смерть SSD, с которой мы столкнёмся, но, как почти всегда в таких случаях, я почувствовал, как шалят мои нервы – а всё из-за сочетания характера отказов SSD, их похожести на «чёрный ящик» и твердотельной природы.

Как и большинство других отказов SSD, этот произошёл внезапно; диск перешёл из состояния прекрасно работающего в состояние вообще не реагирующего ни на что секунд за 50, без какого бы то ни было предупреждения через SMART или что-либо ещё. Вот он радостно обрабатывает запросы на чтение и запись (по всем внешним признакам, в том числе и ZFS, которая не жаловалась на контрольные суммы), а вот уже нет никакого Crucial MX300 на SAS-порту.

Первое сообщение от ядра Linux об отказе IO-операций поступило в 20:31:34, а официально отсутствующим диск был объявлен в 20:32:15. Однако реально диск мог сразу перестать отвечать на запросы – мне не совсем понятны сообщения драйвера.

Что беспокоит меня больше всего по поводу этих резких отказов SSD – так это насколько они непонятны, и что я не могу сам себе объяснить, что именно пошло не так. Когда жёсткий диск крутится, он тоже может внезапно помереть, но, по крайней мере, можно составить объяснение того, что случилось перед этим – заклинило мотор, или случился другой физический отказ, приведший к резкому останову. SSD – твердотельные и таинственные, и у меня нет никаких объяснений тому, что пошло не так, особенно когда диск ещё молод и не должен был подходить к исчерпанию лимита жизни флэш-ячеек.

Когда HDD помирает в юном возрасте, можно представить, что у него не выявили проявившиеся в итоге дефекты производства. С SSD теоретически такого происходить не должно, поэтому его ранняя смерть особенно беспокоит. Возможно, во флэш-ячейках тоже могут быть необнаружимые дефекты изготовления.

А когда у меня нет объяснения происходящему, мои мысли начинают идти по пути беспокойства – типа того, что диск обманывал нас по поводу своего здоровья в SMART-диагностике, и что он на самом деле использовал последние запасные ячейки, а потом они закончились, или что у него была какая-то ошибка в прошивке, которую мы случайно затронули, после чего он превратился в кирпич.

У нас было такое, что SSD таким образом умер, а потом вернулся к жизни, когда его достали и снова воткнули – и на вид был совершенно здоровым, что совершенно не внушает доверия. Но это был другой тип SSD. А ещё мы получали странные ошибки от SSD серии Crucial MX500.

Кроме того, когда у меня нет объяснения отказам SSD, каждый из них кажется мне непредсказуемой миной замедленного действия. Здоровы ли они или помрут завтра? Кажется, что я должен полагаться на статистику, то есть, что не слишком многие из них умрут, и сделают это не слишком быстро, чтобы их можно было поменять. И даже эта надежда зиждется на предположении об отсутствии корреляции отказов – что произошедшее с этим SSD с малой вероятностью произойдёт с другими, стоящими рядом с ним.

И эта проблема актуальна не только для наших файловых серверов – у меня есть то же беспокойство, связанное с моим домашним компьютером. Все данные я зеркалю, но каковы реальные шансы отказа обоих SSD?

В теории я знаю, что SSD должны быть куда как более надёжными, чем вращающийся ржавый диск. Также у нас есть куча SSD, тихонько работающих уже много лет. Но после таких загадочных внезапных отказов они уже не кажутся такими надёжными. Я очень хотел бы, чтобы у нас было какое-то предупреждение по поводу отказа SSD, ведь с HD это довольно часто было возможно (к примеру, такие предупреждения по поводу HD в одном из рабочих настольных компьютеров мне поступали – хотя я их и игнорировал).

Наработка на отказ — Википедия

Материал из Википедии — свободной энциклопедии

Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 25 марта 2019; проверки требуют 7 правок. Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 25 марта 2019; проверки требуют 7 правок.

Сре́дняя нарабо́тка на отка́з (англ. Mean time between failures, MTBF) — технический параметр, характеризующий надёжность восстанавливаемого прибора, устройства или технической системы.

Средняя продолжительность работы устройства между отказами, то есть показывает, какая наработка в среднем приходится на один отказ. Выражается в часах.

T=∑1mtim{\displaystyle T={\sum _{1}^{m}t_{i} \over m}}

где ti — наработка до наступления отказа i; m — число отказов.

Измеряется статистически, путём испытания множества приборов, или вычисляется методами теории надёжности.

Для программных продуктов обычно подразумевается срок до полного перезапуска программы или полной перезагрузки операционной системы.

Средняя наработка до отказа (англ. Mean time to failure, MTTF) — эквивалентный параметр для неремонтопригодного устройства. Поскольку устройство не восстанавливаемое, то это просто среднее время, которое проработает устройство до того момента, как сломается.

Наработка — продолжительность или объем работы объекта, измеряемая в часах, мото-часах, гектарах, километрах пробега, циклах включения-выключения и др.

ГОСТ 27.002-89 определяет данные параметры следующим образом:

  • Наработка между отказами (англ. Operating time between failures) — наработка объекта от окончания восстановления его работоспособного состояния после отказа до возникновения следующего отказа.
  • Наработка до отказа (англ. Operating time to failure) — наработка объекта от начала эксплуатации до возникновения первого отказа.
  • Средняя наработка на отказ (англ. Mean operating time between failures) — отношение суммарной наработки восстанавливаемого объекта к математическому ожиданию числа его отказов в течение этой наработки.
  • Средняя наработка до отказа (англ. Mean operating time to failure) — математическое ожидание наработки объекта до первого отказа.

В английской литературе MTBF (англ. Mean time between failures — среднее время между отказами, наработка на отказ) — среднее время между возникновениями отказов.[1]; термин обычно касается работы оборудования. Единица размерности — час.

Системы, связанные с обеспечением безопасности, можно условно подразделить на две категории:

  • работающие в режиме низкой частоты запросов;
  • и в режиме высокой частоты запросов (непрерывно).

IEC 61508 (англ.)русск. количественно определяет эту классификацию, устанавливая, что частота запросов на работу системы обеспечения безопасности не превышает одного раза в год в режиме низкой частоты запросов, и более раза в год в режиме высокой частоты запросов (непрерывной работы).

Значение SIL (англ.)русск. для систем обеспечения безопасности с низкой частотой запросов непосредственно зависит от диапазонов порядков средней вероятности того, что она не сможет удовлетворительно выполнить свои функции по обеспечению безопасности по запросу, или, проще говоря, от вероятности отказа при запросе (PFD). Значение SIL для систем обеспечения безопасности, работающих в режиме высокой частоты запросов (непрерывно) непосредственно зависит от вероятности возникновения опасного отказа в час (PFH).

  • PFD (Probability of Failure on Demand, Вероятность отказа при запросе) — средняя вероятность того, что система не выполнит свою функцию по запросу.
  • PFH (Probability of Failure per Hour, Вероятность возникновения отказа за час) — вероятность возникновения в системе опасного отказа в течение часа.
  • MTTR (Mean Time to Restoration, Среднее время до восстановления работоспособности) — среднее время, необходимое для восстановления нормальной работы после возникновения отказа.
  • DC (Diagnostic Coverage, Диагностическое покрытие) — отношение количества обнаруженных отказов к общему числу отказов.

В свою очередь, λ = частота отказов = 1/MTBF (для экспоненциального распределения отказов)

Для устройства с технической характеристикой MTTF, равной 1 000 000 часов[2].

ВремяРасчётная вероятность отказа устройства
1-гохотя бы 1 из 22 из 2
1 000 000 часов (~114 лет)50,000 %75,000 %25,000 %
100 000 часов (~11 лет)6,697 %12,945 %0,448 %
87 660 часов (10 лет)5,895 %11,443 %0,348 %
43 830 часов (5 лет)2,992 %5,895 %0,09 %
8 766 часов (1 год)0,606 %1,208 %менее 0,0003 %

Для 10 устройств: Отказ хотя бы одного устройства:

  • Техническая характеристика MTTF устройства 1 000 000 часов
  • Расчётная вероятность отказа хотя бы одного из 10 устройств для времени 1 000 000 часов (114 лет) равна: 99,902 %
  • Расчётная вероятность отказа хотя бы одного из 10 устройств для времени 100 000 часов (~11 лет) равна: 50%
  • Расчётная вероятность отказа хотя бы одного из 10 устройств для времени 87660 часов (10 лет) равна: 45,535 %
  • Расчётная вероятность отказа хотя бы одного из 10 устройств для времени 43830 часов (5 лет) равна: 26,2 %
  • Расчётная вероятность отказа хотя бы одного из 10 устройств для времени 8766 часов (1 год) равна: 5,895 %

Для 100 устройств: Отказ хотя бы одного устройства:

  • Техническая характеристика MTTF устройства 1 000 000 часов
  • Расчётная вероятность отказа хотя бы одного из 100 устройств для времени 1 000 000 часов (114 лет) близка к 100 %
  • Расчётная вероятность отказа хотя бы одного из 100 устройств для времени 100 000 часов (~11 лет) равна: 99,902 %
  • Расчётная вероятность отказа хотя бы одного из 100 устройств для времени 87660 часов (10 лет) равна: 99,77 %
  • Расчётная вероятность отказа хотя бы одного из 100 устройств для времени 43830 часов (5 лет) равна: 95,207 %
  • Расчётная вероятность отказа хотя бы одного из 100 устройств для времени 8766 часов (1 год) равна: 45,535 %
  1. ↑ Использование ControlLogix в приложениях SIL2. Справочное руководство по обеспечению безопасности Rockwell Automation. Публикация 1756-RM001C-EN-P- Апрель 2004
  2. ↑ С равномерным распределением во времени вероятности отказа

Leave a comment