Проблемы с SSD: повышение ошибок CRC, замораживание, иногда доступное только для чтения

У меня была аналогичная проблема с apt dist-upgrade. Я исправляю это, останавливая службу libvirt-bin и убивая все запущенные процессы libvirt.

6
задан 24 February 2018 в 00:36

8 ответов

Поскольку у вас есть только ошибки WRITE DMA, а короткие и длинные тесты не показывают ошибок.

И поскольку DMA, это о прямом доступе к памяти, попробуйте выяснить, есть ли у BIOS отдельный тест аппаратной диагностики , и попробуйте тесты, связанные с памятью.

Если нет встроенного теста BIOS, посмотрите сайт поддержки производителей, если доступна автономная аппаратная диагностика (например: загрузочный ISO-файл для записи на CD или USB- )

(BTW: у ubuntu cd есть также диагностика памяти)

Поскольку запись DMA - это IO, я бы попытался заменить кабель SATA и посмотреть, не добавлены ли новые номера ошибок после этого (последний здесь 298, но больше можно добавить уже)

0
ответ дан 17 July 2018 в 21:11

Замените ваш SSD

Люди пробовали много вещей в комментариях, но у этого SSD есть некоторые проблемы.

Судя по показаниям SMART, ваш диск не видел много действий (~ 250 ед. в день, ~ 6 ТБ написано), и вы говорите, что ему около 2 лет.

Мой совет:

немедленно сохранить все ваши данные (хотя вы говорите, что у вас уже есть) удалить / заменить SSD (в зависимости от вашего бюджета , конечно) отправьте диск производителю на замену

Ваши « люди пробовали много вещей в комментариях, но у этого SSD есть некоторые проблемы. " disk должны быть покрыты в соответствии с 5-летней гарантией Silicon Power

Просто отправьте их

6
ответ дан 17 July 2018 в 21:11

Нет ничего плохого в вашем драйвере. Все тесты проходят. Вы просто неправильно интерпретируете данные SMART.

Во-первых, первый скриншот содержит необработанные данные, и вы не можете делать никаких выводов об этом. Я понятия не имею, как использовать его создатель, чтобы данные были для кого угодно, но это ничего не значит. Если только значимые столбцы не могут быть достигнуты путем прокрутки прямо в окне или что-то в этом роде.

Позвольте мне объяснить столбцы в отчете SMART (последний отчет, который вы опубликовали).

Имя атрибута: имя метрики Значение: текущее значение, выше - лучше. Значения часто из 100, где 100 = лучше, но могут использовать любой масштаб, если выше, лучше. Даже если показатель является чем-то вроде «частоты ошибок», он нормализуется, поэтому более высокие значения означают более низкие коэффициенты ошибок. Хуже того: наихудшее наблюдаемое значение, лучше. Thresh: если значение падает ниже этого, это условие отказа. При или выше = проход. Тип: какое условие отказа будет означать для этой метрики. Old_age: эта метрика указывает на возраст / использование диска, а не на конкретную проблему. Pre-fail: эта метрика указывает на потенциальную проблему с приводом, увеличивая вероятность отказа диска. When_failed: когда этот введенный режим отказа, если когда-либо Raw_value: внутреннее измерение диска, внесшего вклад в это значение - это не полезно для конечного пользователя, а более низкие или более высокие значения не обязательно указывают лучше или хуже.

Чтобы рассмотреть некоторые конкретные области отчета:

Результат теста самооценки SMART в целом: PASSED

Это отражает все прошлое. Ни один из измеренных показателей никогда не входил в состояние сбоя.

Журнал ошибок является относительно типичным для привода. Это не обязательно указывает на неустранимые ошибки или даже проблемы с самим приводом; их отчеты неясны, поэтому вы не можете сказать, что на самом деле произошло от этого, за исключением того, что это было во время передачи DMA на контроллере, но если что-то было важно, это отразилось бы в общем отчете о состоянии здравоохранения. В частности, это может быть что-то довольно невинное, как записи, которые были отменены на конце контроллера, или операционная система, запрашивающая некоторую функцию во время загрузки, которую диск не поддерживает, что может быть полностью нормальным при использовании возможностей зондирующего устройства.

Наконец, примечание о ошибках CRC или частотах ошибок: все диски имеют коэффициент ошибок. Приводы хранят данные с такой высокой плотностью, что ожидается определенное количество ошибок в битах и ​​предназначено для использования с помощью кода исправления ошибок. Код исправления ошибок гарантирует, что определенное количество бит-ошибок на кусок бит может произойти и исправлено на 100%. Привод постоянно применяет код исправления ошибок все время, а код исправления ошибок сконструирован так, что вероятность случайного возникновения неустранимой ошибки очень мала (как, впрочем, значительно меньше, чем выигрыш в лотерее) в хорошо функционирующем драйвере , Если вы видите коэффициент ошибок в любой статистике, и это рассматривается как неважно, это потому, что это не так, это просто исправленные ошибки.

2
ответ дан 17 July 2018 в 21:11

Некоторое время до 11 мая 2017 года вы обновили прошивку SSD. Однако новая версия была выпущена в сентябре 2017 года, и вы должны применить ее с помощью Windows.

Запустите fstrim, чтобы отменить неиспользуемые блоки в файловой системе:

$ sudo fstrim --verbose --all /mnt/c: 16 EiB (18446744073709551615 bytes) trimmed /mnt/e: 16 EiB (18446744073709551615 bytes) trimmed /: 23.4 GiB (25132920832 bytes) trimmed

В моем случае результаты для разделов Windows 10 /mnt/c и /mnt/e были вне этого мира. Таким образом, я проверил файлы и не повредил данные.

Запустите fsck -f на вашем SSD после загрузки с помощью Live-USB, когда раздел не установлен. Другая опция работает fsck -f с grub - September 2017 .

Как упоминалось в комментариях, плохой кабель SATA может вызвать ошибки. Но, как указывает этот ответ, ослабленное соединение также может вызывать ошибки. Чтобы исключить плохое / свободное соединение, удалите заглушки с вашего SSD, продуйте сжатый воздух над ними и штырьки на диске и прочно затяните кабели.

Сколько ваше время стоит?

Последний вопрос: сколько стоит ваше время. Предполагая, что вы потратили 10 часов на эту проблему, она работает до 5 долларов США за час, потому что многие новые SSD-накопители на 120 ГБ SATA III можно приобрести у этого ответа

Feb 23/2018 update

Сегодня я прочитал все остальные ответы. Один ответ говорит, чтобы вернуть его. Но если вы это сделаете, и они не найдут ничего плохого, они просто отправят его обратно, и вы будете без диска в течение от 2 недель до 2 месяцев.

Еще один ответ говорит, что smartctl сообщает, что нет ничего плохого в драйвере .

В этом ответе я предложил запустить fsck -f, и вы ответили, что никаких ошибок не сообщалось.

Запустите fsck каждую загрузку

В качестве компромисса между отрицательный ответ (верните его) и положительный ответ (ничего не получается), моя склонность - запустить fsck при каждой загрузке. Если обнаружена ошибка, загрузка приостанавливается, и вы можете прочитать сообщение об ошибке. Чтобы обобщить использование ссылки:

sudo tune2fs -c 1 /dev/sdX

Примечание: замените X буквой вашего диска, то есть a, b и т. Д.

Если через месяц без ошибок, измените значение от 1 до 30, что типично для большинства систем, которые, как я полагаю. На стандартном SSD fsck будет работать быстро.

Очистите и переустановите кабели SATA

Другие упомянули о замене кабеля SATA, который проблематичен для ноутбука. В качестве компромисса рассмотрите возможность отсоединения всех кабелей со стороны привода, используя сжатый воздух на мужских и женских концах, а затем плотно затяните кабели.

3
ответ дан 17 July 2018 в 21:11

Поскольку у вас есть только ошибки WRITE DMA, а короткие и длинные тесты не показывают ошибок.

И поскольку DMA, это о прямом доступе к памяти, попробуйте выяснить, есть ли у BIOS отдельный тест аппаратной диагностики , и попробуйте тесты, связанные с памятью.

Если нет встроенного теста BIOS, посмотрите сайт поддержки производителей, если доступна автономная аппаратная диагностика (например: загрузочный ISO-файл для записи на CD или USB- )

(BTW: у ubuntu cd есть также диагностика памяти)

Поскольку запись DMA - это IO, я бы попытался заменить кабель SATA и посмотреть, не добавлены ли новые номера ошибок после этого (последний здесь 298, но больше можно добавить уже)

0
ответ дан 23 July 2018 в 21:51
  • 1
    OP сказал в комментариях « никак не изменить разъем, и я не нахожусь на рынке покупок для новых ноутбуков » & quot; – Robert Riedl 22 February 2018 в 19:41

Замените ваш SSD

Люди пробовали много вещей в комментариях, но у этого SSD есть некоторые проблемы.

Судя по показаниям SMART, ваш диск не видел много действий (~ 250 ед. в день, ~ 6 ТБ написано), и вы говорите, что ему около 2 лет.

Мой совет:

немедленно сохранить все ваши данные (хотя вы говорите, что у вас уже есть) удалить / заменить SSD (в зависимости от вашего бюджета , конечно) отправьте диск производителю на замену

Ваши « люди пробовали много вещей в комментариях, но у этого SSD есть некоторые проблемы. " disk должны быть покрыты в соответствии с 5-летней гарантией Silicon Power

Просто отправьте их

6
ответ дан 23 July 2018 в 21:51
  • 1
    Он по-прежнему работает, не сделал ошибку, так как я ежедневно создаю резервные копии и делаю еженедельные образы системы. Мне нужно больше информации, чтобы решить. – Muaad ElSharif 19 February 2018 в 22:05
  • 2
    @MuaadElSharif, сократите свои потери и замените их. Вы потратили на это много времени! – Robert Riedl 20 February 2018 в 16:00

Нет ничего плохого в вашем драйвере. Все тесты проходят. Вы просто неправильно интерпретируете данные SMART.

Во-первых, первый скриншот содержит необработанные данные, и вы не можете делать никаких выводов об этом. Я понятия не имею, как использовать его создатель, чтобы данные были для кого угодно, но это ничего не значит. Если только значимые столбцы не могут быть достигнуты путем прокрутки прямо в окне или что-то в этом роде.

Позвольте мне объяснить столбцы в отчете SMART (последний отчет, который вы опубликовали).

Имя атрибута: имя метрики Значение: текущее значение, выше - лучше. Значения часто из 100, где 100 = лучше, но могут использовать любой масштаб, если выше, лучше. Даже если показатель является чем-то вроде «частоты ошибок», он нормализуется, поэтому более высокие значения означают более низкие коэффициенты ошибок. Хуже того: наихудшее наблюдаемое значение, лучше. Thresh: если значение падает ниже этого, это условие отказа. При или выше = проход. Тип: какое условие отказа будет означать для этой метрики. Old_age: эта метрика указывает на возраст / использование диска, а не на конкретную проблему. Pre-fail: эта метрика указывает на потенциальную проблему с приводом, увеличивая вероятность отказа диска. When_failed: когда этот введенный режим отказа, если когда-либо Raw_value: внутреннее измерение диска, внесшего вклад в это значение - это не полезно для конечного пользователя, а более низкие или более высокие значения не обязательно указывают лучше или хуже.

Чтобы рассмотреть некоторые конкретные области отчета:

Результат теста самооценки SMART в целом: PASSED

Это отражает все прошлое. Ни один из измеренных показателей никогда не входил в состояние сбоя.

Журнал ошибок является относительно типичным для привода. Это не обязательно указывает на неустранимые ошибки или даже проблемы с самим приводом; их отчеты неясны, поэтому вы не можете сказать, что на самом деле произошло от этого, за исключением того, что это было во время передачи DMA на контроллере, но если что-то было важно, это отразилось бы в общем отчете о состоянии здравоохранения. В частности, это может быть что-то довольно невинное, как записи, которые были отменены на конце контроллера, или операционная система, запрашивающая некоторую функцию во время загрузки, которую диск не поддерживает, что может быть полностью нормальным при использовании возможностей зондирующего устройства.

Наконец, примечание о ошибках CRC или частотах ошибок: все диски имеют коэффициент ошибок. Приводы хранят данные с такой высокой плотностью, что ожидается определенное количество ошибок в битах и ​​предназначено для использования с помощью кода исправления ошибок. Код исправления ошибок гарантирует, что определенное количество бит-ошибок на кусок бит может произойти и исправлено на 100%. Привод постоянно применяет код исправления ошибок все время, а код исправления ошибок сконструирован так, что вероятность случайного возникновения неустранимой ошибки очень мала (как, впрочем, значительно меньше, чем выигрыш в лотерее) в хорошо функционирующем драйвере , Если вы видите коэффициент ошибок в любой статистике, и это рассматривается как неважно, это потому, что это не так, это просто исправленные ошибки.

2
ответ дан 23 July 2018 в 21:51
  • 1
    Пользователь сообщал о частых проблемах с его системой в комментариях. [D0] Иногда зависает, сегодня он читается только на мне и черный экран с загрузочным ящиком. & quot; – Robert Riedl 22 February 2018 в 18:45
  • 2
    Я не видел информацию о зависаниях или проблемах с загрузкой, поскольку она была скрыта в комментариях. Тем не менее, похоже, что физическое здоровье SSD не похоже на то, что это причина этих проблем. – thomasrutter 22 February 2018 в 18:50
  • 3
    Но число CRC возрастает (сравните скриншот windows с выходом linux). Вы правы, обычно это не вызывает беспокойства, но число относительно высокое, продолжает расти, есть проблемы и т. Д. – Robert Riedl 22 February 2018 в 18:58

Некоторое время до 11 мая 2017 года вы обновили прошивку SSD. Однако новая версия была выпущена в сентябре 2017 года, и вы должны применить ее с помощью Windows.

Запустите fstrim, чтобы отменить неиспользуемые блоки в файловой системе:

$ sudo fstrim --verbose --all /mnt/c: 16 EiB (18446744073709551615 bytes) trimmed /mnt/e: 16 EiB (18446744073709551615 bytes) trimmed /: 23.4 GiB (25132920832 bytes) trimmed

В моем случае результаты для разделов Windows 10 /mnt/c и /mnt/e были вне этого мира. Таким образом, я проверил файлы и не повредил данные.

Запустите fsck -f на вашем SSD после загрузки с помощью Live-USB, когда раздел не установлен. Другая опция работает fsck -f с grub - September 2017 .

Как упоминалось в комментариях, плохой кабель SATA может вызвать ошибки. Но, как указывает этот ответ, ослабленное соединение также может вызывать ошибки. Чтобы исключить плохое / свободное соединение, удалите заглушки с вашего SSD, продуйте сжатый воздух над ними и штырьки на диске и прочно затяните кабели.

Сколько ваше время стоит?

Последний вопрос: сколько стоит ваше время. Предполагая, что вы потратили 10 часов на эту проблему, она работает до 5 долларов США за час, потому что многие новые SSD-накопители на 120 ГБ SATA III можно приобрести у этого ответа

Feb 23/2018 update

Сегодня я прочитал все остальные ответы. Один ответ говорит, чтобы вернуть его. Но если вы это сделаете, и они не найдут ничего плохого, они просто отправят его обратно, и вы будете без диска в течение от 2 недель до 2 месяцев.

Еще один ответ говорит, что smartctl сообщает, что нет ничего плохого в драйвере .

В этом ответе я предложил запустить fsck -f, и вы ответили, что никаких ошибок не сообщалось.

Запустите fsck каждую загрузку

В качестве компромисса между отрицательный ответ (верните его) и положительный ответ (ничего не получается), моя склонность - запустить fsck при каждой загрузке. Если обнаружена ошибка, загрузка приостанавливается, и вы можете прочитать сообщение об ошибке. Чтобы обобщить использование ссылки:

sudo tune2fs -c 1 /dev/sdX

Примечание: замените X буквой вашего диска, то есть a, b и т. Д.

Если через месяц без ошибок, измените значение от 1 до 30, что типично для большинства систем, которые, как я полагаю. На стандартном SSD fsck будет работать быстро.

Очистите и переустановите кабели SATA

Другие упомянули о замене кабеля SATA, который проблематичен для ноутбука. В качестве компромисса рассмотрите возможность отсоединения всех кабелей со стороны привода, используя сжатый воздух на мужских и женских концах, а затем плотно затяните кабели.

3
ответ дан 23 July 2018 в 21:51
  • 1
    Я проверил его несколько дней назад, никаких обновлений не было. Я обновил мой апрель 2017 года. – Muaad ElSharif 18 February 2018 в 04:21
  • 2
    @MuaadElSharif Является ли ссылка в моем ответе отличной от страницы, которую вы проверили? – WinEunuuchs2Unix 18 February 2018 в 04:22
  • 3
    Нет, я проверил использование SATA-инструмента в Windows и сказал, что прошивка находится на последней версии, обновление не доступно – Muaad ElSharif 18 February 2018 в 04:28
  • 4
    @MuaadElSharif После прочтения других ответов; один говорит, что он сломан и возвращает его, а другой говорит, что нет ничего плохого, я добавил компромиссный раздел к моему ответу выше. – WinEunuuchs2Unix 24 February 2018 в 04:33
  • 5
    @MuaadElSharif Извините за задержку субботы сверхурочно на работе. Рад, что вы получили fsck для каждой загрузки. Держать нас в курсе. – WinEunuuchs2Unix 25 February 2018 в 02:30

Другие вопросы по тегам:

Похожие вопросы: