Расшифровка SMART у HDD. Как читать ошибки жесткого диска

Содержание

Расшифровка SMART у HDD. Как читать ошибки жесткого диска?

Алиса Мэддисон

При запуске системы постоянно запускается утилита chkdsk

Вы никогда не делали и понятия не имеете, что такое дефрагментация

Ingredients

Directions

При запуске системы постоянно запускается утилита chkdsk

Вы никогда не делали и понятия не имеете, что такое дефрагментация

Обозначение полей в таблице SMART

Итак, мы уже определили — нам нужно использовать SMART. Теперь детально рассмотрим каждый параметр, на который стоит обратить внимание. Для примера мы возьмем наш жесткий диск компании Western Digitak — модель WD3200BPVT-55JJ5T1 (WD-WX61E82M9996). Срок службы 5 лет.

Кликните, чтобы увеличить изображение

Значение (Value или Current) — текущее значение данного атрибута. Единиц измерений этого нет — некое абстрактное значение, которым пользуется система. Может изменятся в процессе работы HDD. По умолчанию имеет значение 100 или 200 (т. е. это не действительное текущее значение параметра, а выставленное системой). Имеется много споров, действительно ли SMART корректно выставляет параметр «Значение» (Value). Многие склоняются, что точнее и правильней использовать метрику «Данные» (RAW).

В любом случае, «Значение» (Value) нужно сравнивать с «Порогом» (Threshold) — здесь есть нюансы, но в основном, чем ниже Value, тем хуже работает жесткий диск — оно не должно опускаться до порога или сравняться с ним

Наихудшее (Worst) — Самое худшее значение, до которого опускался параметр «Значение» (Value).

Порог (Threshold) — Порог, ниже которого параметр «Значение» Value ни в коем случае не должен опускаться. Threshold — постоянный параметр, который установил производитель жесткого диска. Если это случилось, тогда у диска имеются серьезные проблемы со здоровьем. Однако тут есть один нюанс

Многие SMART-программы показывают, что с вашим диском всё в порядке, ориентируясь на параметры «Значение» и «Порог». Да, действительно, диагностика показывает, что значение не приблизилось к порогу, мол, всё окей. Но они не учитывают параметр Данные (RAW), о котором пойдет речь ниже. Зачастую, именно RAW показывает верные значения, а значит ваш диск может быть в опасности!

Данные (RAW или Data, «Сырое значение») — Наиболее точный показатель с тем, что творится с вашим жестким диском. Это уже не абстрактный параметр, как «Значение» (Value), а вполне реальный показатель. Хотя есть мнение, что именно «Данные» (RAW) влияет на показатель Значения, но иногда эти два типа данных сильно расходятся друг с другом. Иногда программы SMART показывают его в шестнадцатеричной системе измерения — перевести можно с помощью калькулятора (из DEC в HEX). Например, тут — https://lin. in. ua/tools/numconv. html

Для наших читателей из Азербайджана есть отличные новости. Если вы устали от возни со старым железом, то можете заказать новый игровой компьютер в компании iComp по ссылке https://icomp. az/bakida-komputerler/. Кроме того, вы можете собрать собственный сетап — на сайте огромное количество разнообразных комплектующих на любой вкус и кошелек.

Частота появления ошибок при чтении с диска

[adace-ad Read Error Rate

Частота ошибок при операции чтения с жесткого диска. Большое количество ошибок (меньшее значение атрибута) говорит о том, что с аппаратной частью диска не всё в порядке. Чем меньше параметр, тем хуже

Данный атрибут — главный показатель здоровья именно механики жесткого диска. Любое замедление блока магнитных головок может вылиться в ошибки чтения, так же как и падения, удары, перегрев и другие физические воздействия на диск. Тут важно понимать, что появление этих ошибок уже означает отрицательную динамику — их будет только больше. Остается только надеяться, что это не произойдет так быстро.

Главный нюанс атрибута Raw Read Error Rate в том, что именно параметр Данные «RAW» показывает реальное количество ошибок, а не параметр «Значение». Поэтому, даже если SMART-программы вам говорят о том, что всё в порядке, обратите внимание на «Данные». В нашем случае, Value=200, а RAW=1380, т. е. реальное количество ошибок чтения у нас 1380!

Однако и тут есть некоторые особенности. Часто винчестеры фирмы Seagate и Samsung в поле RAW показывают умопомрачительные значения под десятки тысяч или миллионов — понятно, что это неверная информация от SMART-программы — ваш диск при таком количестве ошибок был бы уже труп. ИТОГ: В данном атрибуте надо смотреть на RAW — он показывает реальные данные. Но если этот показатель показывает миллионные значения — то лучше ориентироваться на показатель «Значение» (Value)

Время раскрутки

Pin Up Time

Атрибут показывает время за которое диск (шпендель) разогнался из полного покоя до своей рабочего состояния, до «паспортной» скорости, которую зашил производитель на заводе — оно отображено Значение «Порог» (Threshold). Соответственно «Значение»(Value) содержит текущий показатель, конкретный для этой модели и этого производителя. До порогового значения он опускаться не должен. Чем меньше параметр, тем хуже

Данный атрибут некоторыми SMART-программами выделен как критичный, хотя его критичность, на самом деле, спорна. В целом, на этот показатель можно не обращать внимание, т. к. он говорит, скорей, не о здоровье конкретно жесткого диска, а наличие проблем с его питанием — недостаточное напряжение в блоке питания.

Кол-во переназначенных секторов

Счетчик показывает общее количество так называемых «переназначенных» секторов. Сбойный сектор на диске — это очень плохо, поэтому HDD использует специальную резервную область, куда отныне жесткий диск будет обращаться за данными, вместо этого сбойного сектора. Чем меньше параметр, тем хуже!

Наверное, самый главный показатель здоровья жесткого диска. Если этот атрибут, SMART отмечает как проблемный («Значение» (Value) приближается к «Порогу» (Threshold)) — существуют серьезные проблемы с износом одной из головок или поверхностью жесткого диска. Показатель не выставляется производителем, как Pin Up Time или Raw Read Error Rate, поэтому максимального значения у него нет

При наличии повреждённого сектора диск помечает его как нечитаемый и использует вместо него сектор в резервной области, сделав соответствующие пометки в специальном списке дефектов поверхности – G-list. Такая операция по назначению нового сектора на роль старого называется remap (ремап, ремапинг) либо переназначение, а используемый вместо повреждённого сектор – переназначенным. Новый сектор получает логический номер LBA старого, и теперь при обращении за данными к этому сектору (с этим номером) запрос будет перенаправляться в резервную область. А она — не бесконечная.

В данном атрибуте смотрим лучше обращать внимание на «Данные» (RAW), а не на «Значение» (Value). Т. к. VALUE может стоять 200 или 100 (по умолчанию системы, но это не значит, что у вас уже 200 ошибок). Именно поле RAW показывает реальное общее количество переназначенных секторов. Самый идеальный вариант в данном случае — ноль в поле «RAW». Даже единица в этом поле говорит о начавшихся проблемах.

Проблема кроется в том, что данный атрибут показывает число уже переназначенных секторов, т. е. исправить это уже нельзя (даже низкоуровневым формтированием). Показатель не выставляется производителем, как Pin Up Time или Raw Read Error Rate, поэтому любое значение отличное от ноля — уже плохо. Это значит что уже есть отрицательная для здоровья HDD динамика.

Ошибки позиционирования

Seek Error Rate

Жесткий диск постоянно находится в движении — его головки скользят по поверхности в поисках данных. Иногда этот процесс сбоит и блок магнитных головок оказывается не в том месте — это ошибка позиционирования. При их наличии имеются повреждения сервометок, возможны проблемы с охлаждением и механической частью (шпендель)

Жесткий диск контролирует правильность установки головок на требуемую дорожку поверхности для считывания данных. В случае, когда установка выполнилась неверно, фиксируется ошибка и операция повторяется. Для данного накопителя причиной большого числа ошибок явился перегрев. Как и в случае с Raw Read Error Rate, «Значение» не должно опуститься ниже «Порога». А в столбце «Данные» (RAW) должен быть (в идеале) ноль.

Текущее количество нестабильных секторов.

Предвестник больших проблем. Данный атрибут показывает количество секторов, которые диск не смог прочитать с первого раза. Операция будет проведена еще раз при повторном обращении к этому сектору. Если он не прочитается и второй раз, то он улетит в переназначенные сектора (Reallocated Sector Count)

Непрочитанный второй раз сектор будет переназначен в резервную область (как мы уже знаем, это называется ремап). Если всё-таки сектор будет прочтен, то он будет помечен, как стабильный и атрибут улучшиться. Ошибки в этом параметре могут быть вызваны банальным выключением ПК из сети или севшим ноутбуком — в общем, некорректным заверением работы Windows.

&nbsp &nbsp Атрибуты состоят из нескольких полей, каждое из которых имеет определенный смысл. Обычно, программы считывания S. M.A. R.T. выдают расшифровку атрибутов в виде:

Жесткий диск не имеет возможности, по собственной инициативе, передать данные SMART потребителю. Их считывание выполняется специальным программным обеспечением.

В настройках большинства современных BIOS материнских плат имеется пункт позволяющий запретить или разрешить считывание и анализ атрибутов SMART в процессе выполнения тестов оборудования перед выполнением начальной загрузки системы. Включение опции позволяет подпрограмме тестирования оборудования BIOS считать значения критических атрибутов и, при превышении порога, предупредить об этом пользователя. Как правило, без особой детализации:
Primary Master Hard Disk: S. M.A. R.T status BAD!, Backup and Replace.
Выполнение подпрограммы BIOS приостанавливается, чтобы привлечь внимание:
Press F1 to Resume
Таким образом, без установки или запуска дополнительного программного обеспечения, имеется возможность вовремя определить критическое состояние накопителя (при включении данной опции) средствами Базовой Системы Ввода-Вывода (BIOS).

Анализ данных S. M.A. R.T. жесткого диска

&nbsp &nbsp Для получения данных SMART в среде операционной системы могут использоваться специальные программы, в частности, практически все утилиты для тестирования оборудования жестких дисков.

Одной из самых популярных программ для тестирования жестких дисков является Victoria Сергея Казанского.

На сайте автора найдете последнюю версию программы, а также массу полезной информации, в том числе и подробное описание работы с Victoria.

Victoria 3.52 Freeware

В процессе работы с программой можно вызвать контекстную справку клавишей F1

Расшифровка кодов ошибок в Victoria:

BBK (Bad Block Detected) — Найден бэд-блок.

UNCR (Uncorrectable Error) — Неисправимая ошибка. Не удалось скорректировать данные избыточным кодом, блок признан нечитаемым. Может быть как следствием нарушения контрольной суммы данных (софтовый Bad Block), так и неисправностью HDD;

ABRT (Aborted Command) — HDD отверг команду в результате неисправности, или команда не поддерживается данным HDD (пароль, устаревшая или слишком новая модель и т. д.)

T0NF (Track 0 Not Found) — не найдена нулевая дорожку, невозможно выполнить рекалибровку на стартовый цилиндр рабочей области. На современных HDD говорит о неисправности микрокода или магнитных головок;

AMNF (Address Mark Not Found) — адресный маркер не найден, невозможно прочитать сектор, обычно в результате неисправности тракта чтения или дефекта поверхности.

Программа не требует установки, просто скачайте ее по ссылке на странице загрузки сайта автора.

Программа должна выполняться под учетной записью с павами администратора. В среде Windows 7 / 8 необходимо использовать контекстное меню «Запуск от имени администратора».

Victoria for Windows

Краткое описание атрибутов (в скобках дано шестнадцатеричное значение номера):

Ремап (Remap) и проверка поверхности жесткого диска

При записи жесткий диск не проверяет, что и как было записано в область данных сектора, кроме случаев, когда предварительная диагностика, которой накопитель занимается все «свободное время», не пометила в соответствующих журналах эти сектора, как проблемные, или кандидаты на переназначение, что отражается в атрибуте 197 SMART (Current Pending Sectors).

При возникновении плохих блоков (Bad Block) нередко возникает необходимость проверки принадлежности сбойного участка конкретному файлу. Для этих целей можно воспользоваться консольной утилитой NFI. EXE (NTFS File Sector Information Utility) из состава пакета Support Tools от Microsoft. Скачать 10кб
Формат командной строки
nfi. exe Диск Номер логического сектора
Подсказку по использованию NFI. EXE можно получить по команде nfi. exe /?

***Logical sector 12541492 (0xbf5e34) on drive C is in file number 49502.
\WINDOWS\ system32\ D3DCompiler_38.dll

Т. е. интересующий нас сбойный сектор принадлежит файлу D3DCompiler_38.dll в каталоге Windows\system32. В случае, когда сбойные блоки принадлежат системным файлам Windows, возможно появление синих экранов смерти или зависаний системы с перезагрузкой. В большинстве случаев, информация о наличии сбоев дисковой подсистемы, будет отображаться в системном журнале Windows.

Для выполнения тестирования поверхности накопителя с принудительным переназначением (ремапом) сбойных секторов можно воспользоваться программами тестирования HDD, алгоритм работы которых специально разработан таким образом, чтобы «заставить» внутреннюю микропрограмму накопителя выполнить переназначение нестабильного участка.
Так, например, подобные алгоритмы будут использоваться, в упоминаемой выше программе Victoria, если выбран режим тестирования поверхности с выполнением операций восстановления или переназначения (Classic Remap, Advanced Remap :). Изначально режим выполнения теста установлен в Ignore Bad Blocks

Сканирование поверхности MHDD

Добавлю, что особого выбора алгоритмов тестирования с переназначением сбойных секторов у программы MHDD, в отличие от Victoria, нет, однако MHDD обладает несколько большими возможностями, в т. ч. позволяет работать с SCSI-дисками и съемными USB HDD, при использовании драйверов, позволяющих получить доступ к съемному диску как SCSI-устройству (драйверы ASPIEHCI. SYS, USBASPI. SYS).

Вернуть переназначенные сектора на место, обычными программными средствами, невозможно. Однако, с использованием специального оборудования и методик можно выполнить внутренние технологические утилиты (selfscan, или селфскан), которые заново произведут те операции, которые выполняются для анализа поверхности при изготовлении накопителя, аналогично настоящему низкоуровневому форматированию, предназначенному для проверки поверхности и физической разметки дорожек.

HDAT2 – альтернатива программам MHDD и Victoria.

Для работы HDAT2 используется загрузка в среде Windows98 с возможностью выбора конфигурации драйверов, которые будут использоваться для доступа к накопителям:

HDAT2 – выбор загружаемых драйверов

Программа HDAT2 обеспечивает 3 вида доступа к дисковым устройствам:

через прерывание INT13h BIOS;

через порты ввода вывода;

через драйверы ASPI;

Благодаря хорошо реализованному алгоритму распознавания подключенных дисковых устройств, программа, как правило, верно определяет их характеристики и задает необходимые режимы работы с ними. Хотя бывают и исключения, как например, приходилось сталкиваться с тем, что неверно определяется объем жестких дисков некоторых моделей емкостью 4 Тб. Тем не менее, программа позволяет, например, выполнить тестирование SD-карты, установленной в телефон Alcatel, подключенный к компьютеру через USB-порт, что невозможно с использованием MHDD и Victoria:

HDAT2 – тестирование SD карты в телефоне, подключенном через USB

На сайте разработчика можно скачать документацию к программе на английском языке, актуальные версии HDAT2 и загрузочные образы дискет или компакт дисков на на странице загрузки

Лучшая, в свое время, программа для тестирования жестких дисков Victoria возвращается!

Обновленная Victoria работает в среде операционных систем Windows 2000/XP/8/10 x32. В среде Windows 9х программа работает только в режиме PIO.

Технические требования к оборудованию:

— Память 2 Gb или более.

— Видеокарта SVGA. Рекомендуется видеорежим от 1280*1024.

— Желательно наличие доступа в Интернет.

— Программа должна выполняться в контексте учетной записи пользователя с правами администратора.

В среде 64-разрядных ОС Windows работоспособность Victoria сохраняется, за исключением режима PIO.

Мониторинг состояния HDD.

&nbsp &nbsp Для отслеживания технического состояния диска в непрерывном режиме используется специальное программное обеспечение (нередко, платное), главной задачей которого является периодическое считывание и анализ значений атрибутов таблицы SMART с целью предупредить пользователя о достижении порога критического состояния, когда работоспособность устройства и сохранность пользовательских данных не гарантируются. Одним из бесплатных, и тем не менее, популярных в среде пользователей ПК, представителей программ для мониторинга состояния HDD является CrystalDiskInfo

CrystalDiskInfo

Список команд жестких дисков стандарта ATA для работы с данными S. M.A. R.T

Наименование &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp Код операции

SMART_READ_VALUES&nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp 0xd0
SMART_READ_THRESHOLDS &nbsp &nbsp &nbsp &nbsp &nbsp&nbsp 0xd1
SMART_AUTOSAVE&nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp&nbsp 0xd2
SMART_SAVE&nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp 0xd3
SMART_IMMEDIATE_OFFLINE &nbsp &nbsp &nbsp &nbsp 0xd4
SMART_READ_LOG_SECTOR &nbsp &nbsp &nbsp &nbsp &nbsp&nbsp 0xd5
SMART_WRITE_LOG_SECTOR &nbsp &nbsp &nbsp &nbsp&nbsp 0xd6
SMART_ENABLE &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp&nbsp 0xd8
SMART_DISABLE &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp&nbsp&nbsp 0xd9
SMART_STATUS &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp0xda
SMART_AUTO_OFFLINE &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp &nbsp 0xdb

В качестве дополнительного материала по технологии S. M.A. R.T и использованию программного обеспечения smartmontools в операционных системах семейства Linux, может пригодиться статья S. M.A. R.T и оценка технического состояния жесткого диска в Linux

Использование терминального режима для ремонта HDD.

&nbsp &nbsp Методика несложная и вполне работоспособная, но, в основном, рассчитана на применение опытными специалистами по ремонту HDD. Я постараюсь дать некоторые пояснения, которых в оригинале нет.

&nbsp &nbsp Итак, кроме обычного интерфейса ATA или SATA, современные накопители имеют служебный интерфейс для подключения в терминальном режиме. На плате электроники накопителя любого производителя вы найдете кроме стандартных разъемов питания и интерфейса, еще и дополнительный разъем, никак не обозначенный, и имеющий не менее 3-х контактов. Это и есть разъем для подключения терминала через последовательный порт накопителя.

Разъем подключения терминала к диску

В разных моделях накопителей используются свои контакты для подключения к терминалу

3,5″ накопители Seagate PATA :

Интерфейсный разъём. : : | : RX / TX Разъём питания

3,5″ и 2.5″ накопители Seagate SATA, а также 2.5″ Samsung SATA :

3,5″ накопители Samsung PATA :

Интерфейсный разъём. : : : | RX / TX Разъём питания

3,5″ накопители Samsung SATA :

Разъём питания. Разъём SATA : : : | RX / TX

Использование Hiperterminal для подключения накопителей Seagate.

Выбор COM порта

Параметры COM порта

Параметры эмуляции терминала

&nbsp &nbsp Убедитесь, что ваш терминал работает. Для этого соедините RX и TX между собой. При наборе с клавиатуры вы должны видеть удвоение набираемых символов, поскольку на экран терминала сначала выводится введенный символ, передаваемый по линии TX, а затем, этот же символ, принятый по линии RX. Если режим «Отображать введенные символы на экране» выключить, то удвоения символов не будет, поскольку будут отображаться только символы, принятые по линии RX.

&nbsp &nbsp Если параметры порта выбраны правильно и накопитель поддерживает терминал, то, при нажатии CTRL-Z вы должны увидеть приглашение:

), в ответ на которые накопитель выводит диагностические данные о своем текущем состоянии.

Переход на нужный уровень выполняется с помощью команды:

LED: 000000CC FAddr: 0024A051

После раскручивания двигателя, увидите сообщение:

Spin Up Complete
Elapsed Time 7.146 secs

Теперь накопитель готов к работе в терминальном режиме.

Spin Error
Elapsed Time 12.917 secs
R/W Status 2 R/W Error 84150180

&nbsp &nbsp В сети встречается несколько методик восстановления работоспособности накопителей семейства 7200.11, которые позволили добиться положительного результата. Логика подсказывает, что как минимум, нужно:
— обнулить содержимое SMART Причиной разрушения транслятора, судя по всему, является ошибка в микропрограмме, связанная с обработкой этого содержимого. Иначе причина разрушения транслятора не будет устранена.
— пересчитать содержимое транслятора заново, что вернет работоспособность внутренней микропрограмме накопителя.

В большинстве методик используется команда обнуления списка переназначенных в процессе эксплуатации секторов G-List (Grown List). Мне кажется, в случае восстановления не только работоспособности, но и целостности данных, это будет лишним, хотя, вероятность порчи транслятора в зависимости от содержимого G-List, очевидно, исключить нельзя. На практике, очистку G-List я никогда не использовал, а восстановление нескольких Barracuda 7200.11 выполнилось вполне успешно.

&nbsp &nbsp Для очистки данных SMART нужно перейти на уровень 1

Восстановление работоспособности накопителя ST3640323AS с прошивкой SD35.

Rst 0x20M
(P) SATA Reset

LED:000000CC FAddr:0024CDC9
Rst 0x20M
(P) SATA Reset
LED:000000CC FAddr:0024CDC9
Rst 0x20M

Реакция на CTRL-Z присутствует, накопитель переходит на уровень /T, однако, тут же возвращается на «SATA Reset» :

Если вы желаете поделиться ссылкой на эту страницу в своей социальной сети, пользуйтесь кнопкой «Поделиться»

Источники:

https://storedigital. ru/2019/07/29/oshibki-smart-u-hdd-kak-chitat-oshibki-zhestkogo-diska/

https://ab57.ru/hdd. html

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: