У меня есть несколько жестких дисков в mdadm RAID 5, настроенных для перехода в режим ожидания после нескольких минут бездействия. (Используя hdparm.conf spindown_time
.)
Через нерегулярные интервалы я получаю сообщения, подобные этим в dmesg
:
[ 1840.251661] ata4.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[ 1840.251722] ata4.00: failed command: SMART
[ 1840.251758] ata4.00: cmd b0/d5:01:06:4f:c2/00:00:00:00:00/00 tag 0 pio 512 in
[ 1840.251759] res 40/00:14:50:2e:04/00:00:02:00:00/40 Emask 0x4 (timeout)
[ 1840.251858] ata4.00: status: { DRDY }
[ 1840.251888] ata4: hard resetting link
[ 1840.600742] ata4: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 1840.601521] ata4.00: configured for UDMA/133
[ 1840.601547] ata4: EH complete
[337877.713988] ata4.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
[337877.714019] ata4.00: failed command: SMART
[337877.714038] ata4.00: cmd b0/d5:01:06:4f:c2/00:00:00:00:00/00 tag 0 pio 512 in
[337877.714039] res 40/00:04:90:10:81/00:00:00:00:00/40 Emask 0x4 (timeout)
[337877.714089] ata4.00: status: { DRDY }
[337877.714107] ata4: hard resetting link
[337878.063085] ata4: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[337878.063743] ata4.00: configured for UDMA/133
[337878.063764] ata4: EH complete
Я думаю, что исключение вызвано smartd
, когда диск не просыпается достаточно быстро.
Нет проблем (которые я могу сказать) при обычном доступе к дискам через файловую систему - это занимает несколько секунд дольше, чем обычно, когда они спят, но нет никаких исключений.
Должен ли я беспокоиться об этом как о потенциальном симптоме чего-то, что может со временем испортить диск?
Или я могу безопасно игнорировать это как часть нормальной работы?
Редактировать:
По запросу: smartctl -a
для sda
и sde
оба диска являются членами массива.
Если ata4
совпадает с scsi-4
, то, согласно /dev/disk/by-path
, sde
является тем, который дал ошибку, указанную выше.
Укажите вывод команды smartctl -a /dev/sda
(замените sda
на все диски) и отправьте сообщение на http://paste.ubuntu.com/ ). Это покажет, пытаются ли ваши диски слишком часто вращаться, чтобы сэкономить энергию (которая может повредить их). Кроме того, он будет отображать другую информацию, такую как температура и плохие сектора.
У меня было такое же сообщение об ошибке в моем Armbian, работающем на Banana Pi. Оказалось, что у меня был сломанный 5-вольтовый контакт в кабеле molex для питания жесткого диска.
Как ни странно, мой 3,5-дюймовый жесткий диск работал только при работающем источнике питания 12 В, но постоянно показывал ту же ошибку, что и у вас.
Поэтому, если ваш жесткий диск прошел проверку, я рекомендую проверить источник питания, попробуйте подключить жесткий диск с помощью другого кабеля питания sata.
Надеется, что это сэкономит время для тех, кто сталкивается с такими странными проблемами.