У меня была аналогичная проблема с apt dist-upgrade. Я исправляю это, останавливая службу libvirt-bin и убивая все запущенные процессы libvirt.
Поскольку у вас есть только ошибки WRITE DMA, а короткие и длинные тесты не показывают ошибок.
И поскольку DMA, это о прямом доступе к памяти, попробуйте выяснить, есть ли у BIOS отдельный тест аппаратной диагностики , и попробуйте тесты, связанные с памятью.
Если нет встроенного теста BIOS, посмотрите сайт поддержки производителей, если доступна автономная аппаратная диагностика (например: загрузочный ISO-файл для записи на CD или USB- )
(BTW: у ubuntu cd есть также диагностика памяти)
Поскольку запись DMA - это IO, я бы попытался заменить кабель SATA и посмотреть, не добавлены ли новые номера ошибок после этого (последний здесь 298, но больше можно добавить уже)
Люди пробовали много вещей в комментариях, но у этого SSD есть некоторые проблемы.
Судя по показаниям SMART, ваш диск не видел много действий (~ 250 ед. в день, ~ 6 ТБ написано), и вы говорите, что ему около 2 лет.
Мой совет:
немедленно сохранить все ваши данные (хотя вы говорите, что у вас уже есть) удалить / заменить SSD (в зависимости от вашего бюджета , конечно) отправьте диск производителю на заменуВаши « люди пробовали много вещей в комментариях, но у этого SSD есть некоторые проблемы. " disk должны быть покрыты в соответствии с 5-летней гарантией Silicon Power
Нет ничего плохого в вашем драйвере. Все тесты проходят. Вы просто неправильно интерпретируете данные SMART.
Во-первых, первый скриншот содержит необработанные данные, и вы не можете делать никаких выводов об этом. Я понятия не имею, как использовать его создатель, чтобы данные были для кого угодно, но это ничего не значит. Если только значимые столбцы не могут быть достигнуты путем прокрутки прямо в окне или что-то в этом роде.
Позвольте мне объяснить столбцы в отчете SMART (последний отчет, который вы опубликовали).
Имя атрибута: имя метрики Значение: текущее значение, выше - лучше. Значения часто из 100, где 100 = лучше, но могут использовать любой масштаб, если выше, лучше. Даже если показатель является чем-то вроде «частоты ошибок», он нормализуется, поэтому более высокие значения означают более низкие коэффициенты ошибок. Хуже того: наихудшее наблюдаемое значение, лучше. Thresh: если значение падает ниже этого, это условие отказа. При или выше = проход. Тип: какое условие отказа будет означать для этой метрики. Old_age: эта метрика указывает на возраст / использование диска, а не на конкретную проблему. Pre-fail: эта метрика указывает на потенциальную проблему с приводом, увеличивая вероятность отказа диска. When_failed: когда этот введенный режим отказа, если когда-либо Raw_value: внутреннее измерение диска, внесшего вклад в это значение - это не полезно для конечного пользователя, а более низкие или более высокие значения не обязательно указывают лучше или хуже.Чтобы рассмотреть некоторые конкретные области отчета:
Результат теста самооценки SMART в целом: PASSEDЭто отражает все прошлое. Ни один из измеренных показателей никогда не входил в состояние сбоя.
Журнал ошибок является относительно типичным для привода. Это не обязательно указывает на неустранимые ошибки или даже проблемы с самим приводом; их отчеты неясны, поэтому вы не можете сказать, что на самом деле произошло от этого, за исключением того, что это было во время передачи DMA на контроллере, но если что-то было важно, это отразилось бы в общем отчете о состоянии здравоохранения. В частности, это может быть что-то довольно невинное, как записи, которые были отменены на конце контроллера, или операционная система, запрашивающая некоторую функцию во время загрузки, которую диск не поддерживает, что может быть полностью нормальным при использовании возможностей зондирующего устройства.
Наконец, примечание о ошибках CRC или частотах ошибок: все диски имеют коэффициент ошибок. Приводы хранят данные с такой высокой плотностью, что ожидается определенное количество ошибок в битах и предназначено для использования с помощью кода исправления ошибок. Код исправления ошибок гарантирует, что определенное количество бит-ошибок на кусок бит может произойти и исправлено на 100%. Привод постоянно применяет код исправления ошибок все время, а код исправления ошибок сконструирован так, что вероятность случайного возникновения неустранимой ошибки очень мала (как, впрочем, значительно меньше, чем выигрыш в лотерее) в хорошо функционирующем драйвере , Если вы видите коэффициент ошибок в любой статистике, и это рассматривается как неважно, это потому, что это не так, это просто исправленные ошибки.
Некоторое время до 11 мая 2017 года вы обновили прошивку SSD. Однако новая версия была выпущена в сентябре 2017 года, и вы должны применить ее с помощью Windows.
Запустите fstrim, чтобы отменить неиспользуемые блоки в файловой системе:
$ sudo fstrim --verbose --all
/mnt/c: 16 EiB (18446744073709551615 bytes) trimmed
/mnt/e: 16 EiB (18446744073709551615 bytes) trimmed
/: 23.4 GiB (25132920832 bytes) trimmed
В моем случае результаты для разделов Windows 10 /mnt/c и /mnt/e были вне этого мира. Таким образом, я проверил файлы и не повредил данные.
Запустите fsck -f на вашем SSD после загрузки с помощью Live-USB, когда раздел не установлен. Другая опция работает fsck -f с grub - September 2017 .
Как упоминалось в комментариях, плохой кабель SATA может вызвать ошибки. Но, как указывает этот ответ, ослабленное соединение также может вызывать ошибки. Чтобы исключить плохое / свободное соединение, удалите заглушки с вашего SSD, продуйте сжатый воздух над ними и штырьки на диске и прочно затяните кабели.
Последний вопрос: сколько стоит ваше время. Предполагая, что вы потратили 10 часов на эту проблему, она работает до 5 долларов США за час, потому что многие новые SSD-накопители на 120 ГБ SATA III можно приобрести у этого ответа
Сегодня я прочитал все остальные ответы. Один ответ говорит, чтобы вернуть его. Но если вы это сделаете, и они не найдут ничего плохого, они просто отправят его обратно, и вы будете без диска в течение от 2 недель до 2 месяцев.
Еще один ответ говорит, что smartctl сообщает, что нет ничего плохого в драйвере .
В этом ответе я предложил запустить fsck -f, и вы ответили, что никаких ошибок не сообщалось.
В качестве компромисса между отрицательный ответ (верните его) и положительный ответ (ничего не получается), моя склонность - запустить fsck при каждой загрузке. Если обнаружена ошибка, загрузка приостанавливается, и вы можете прочитать сообщение об ошибке. Чтобы обобщить использование ссылки:
sudo tune2fs -c 1 /dev/sdX
Примечание: замените X буквой вашего диска, то есть a, b и т. Д.
Если через месяц без ошибок, измените значение от 1 до 30, что типично для большинства систем, которые, как я полагаю. На стандартном SSD fsck будет работать быстро.
Другие упомянули о замене кабеля SATA, который проблематичен для ноутбука. В качестве компромисса рассмотрите возможность отсоединения всех кабелей со стороны привода, используя сжатый воздух на мужских и женских концах, а затем плотно затяните кабели.
Поскольку у вас есть только ошибки WRITE DMA, а короткие и длинные тесты не показывают ошибок.
И поскольку DMA, это о прямом доступе к памяти, попробуйте выяснить, есть ли у BIOS отдельный тест аппаратной диагностики , и попробуйте тесты, связанные с памятью.
Если нет встроенного теста BIOS, посмотрите сайт поддержки производителей, если доступна автономная аппаратная диагностика (например: загрузочный ISO-файл для записи на CD или USB- )
(BTW: у ubuntu cd есть также диагностика памяти)
Поскольку запись DMA - это IO, я бы попытался заменить кабель SATA и посмотреть, не добавлены ли новые номера ошибок после этого (последний здесь 298, но больше можно добавить уже)
Люди пробовали много вещей в комментариях, но у этого SSD есть некоторые проблемы.
Судя по показаниям SMART, ваш диск не видел много действий (~ 250 ед. в день, ~ 6 ТБ написано), и вы говорите, что ему около 2 лет.
Мой совет:
немедленно сохранить все ваши данные (хотя вы говорите, что у вас уже есть) удалить / заменить SSD (в зависимости от вашего бюджета , конечно) отправьте диск производителю на заменуВаши « люди пробовали много вещей в комментариях, но у этого SSD есть некоторые проблемы. " disk должны быть покрыты в соответствии с 5-летней гарантией Silicon Power
Нет ничего плохого в вашем драйвере. Все тесты проходят. Вы просто неправильно интерпретируете данные SMART.
Во-первых, первый скриншот содержит необработанные данные, и вы не можете делать никаких выводов об этом. Я понятия не имею, как использовать его создатель, чтобы данные были для кого угодно, но это ничего не значит. Если только значимые столбцы не могут быть достигнуты путем прокрутки прямо в окне или что-то в этом роде.
Позвольте мне объяснить столбцы в отчете SMART (последний отчет, который вы опубликовали).
Имя атрибута: имя метрики Значение: текущее значение, выше - лучше. Значения часто из 100, где 100 = лучше, но могут использовать любой масштаб, если выше, лучше. Даже если показатель является чем-то вроде «частоты ошибок», он нормализуется, поэтому более высокие значения означают более низкие коэффициенты ошибок. Хуже того: наихудшее наблюдаемое значение, лучше. Thresh: если значение падает ниже этого, это условие отказа. При или выше = проход. Тип: какое условие отказа будет означать для этой метрики. Old_age: эта метрика указывает на возраст / использование диска, а не на конкретную проблему. Pre-fail: эта метрика указывает на потенциальную проблему с приводом, увеличивая вероятность отказа диска. When_failed: когда этот введенный режим отказа, если когда-либо Raw_value: внутреннее измерение диска, внесшего вклад в это значение - это не полезно для конечного пользователя, а более низкие или более высокие значения не обязательно указывают лучше или хуже.Чтобы рассмотреть некоторые конкретные области отчета:
Результат теста самооценки SMART в целом: PASSEDЭто отражает все прошлое. Ни один из измеренных показателей никогда не входил в состояние сбоя.
Журнал ошибок является относительно типичным для привода. Это не обязательно указывает на неустранимые ошибки или даже проблемы с самим приводом; их отчеты неясны, поэтому вы не можете сказать, что на самом деле произошло от этого, за исключением того, что это было во время передачи DMA на контроллере, но если что-то было важно, это отразилось бы в общем отчете о состоянии здравоохранения. В частности, это может быть что-то довольно невинное, как записи, которые были отменены на конце контроллера, или операционная система, запрашивающая некоторую функцию во время загрузки, которую диск не поддерживает, что может быть полностью нормальным при использовании возможностей зондирующего устройства.
Наконец, примечание о ошибках CRC или частотах ошибок: все диски имеют коэффициент ошибок. Приводы хранят данные с такой высокой плотностью, что ожидается определенное количество ошибок в битах и предназначено для использования с помощью кода исправления ошибок. Код исправления ошибок гарантирует, что определенное количество бит-ошибок на кусок бит может произойти и исправлено на 100%. Привод постоянно применяет код исправления ошибок все время, а код исправления ошибок сконструирован так, что вероятность случайного возникновения неустранимой ошибки очень мала (как, впрочем, значительно меньше, чем выигрыш в лотерее) в хорошо функционирующем драйвере , Если вы видите коэффициент ошибок в любой статистике, и это рассматривается как неважно, это потому, что это не так, это просто исправленные ошибки.
Некоторое время до 11 мая 2017 года вы обновили прошивку SSD. Однако новая версия была выпущена в сентябре 2017 года, и вы должны применить ее с помощью Windows.
Запустите fstrim, чтобы отменить неиспользуемые блоки в файловой системе:
$ sudo fstrim --verbose --all
/mnt/c: 16 EiB (18446744073709551615 bytes) trimmed
/mnt/e: 16 EiB (18446744073709551615 bytes) trimmed
/: 23.4 GiB (25132920832 bytes) trimmed
В моем случае результаты для разделов Windows 10 /mnt/c и /mnt/e были вне этого мира. Таким образом, я проверил файлы и не повредил данные.
Запустите fsck -f на вашем SSD после загрузки с помощью Live-USB, когда раздел не установлен. Другая опция работает fsck -f с grub - September 2017 .
Как упоминалось в комментариях, плохой кабель SATA может вызвать ошибки. Но, как указывает этот ответ, ослабленное соединение также может вызывать ошибки. Чтобы исключить плохое / свободное соединение, удалите заглушки с вашего SSD, продуйте сжатый воздух над ними и штырьки на диске и прочно затяните кабели.
Последний вопрос: сколько стоит ваше время. Предполагая, что вы потратили 10 часов на эту проблему, она работает до 5 долларов США за час, потому что многие новые SSD-накопители на 120 ГБ SATA III можно приобрести у этого ответа
Сегодня я прочитал все остальные ответы. Один ответ говорит, чтобы вернуть его. Но если вы это сделаете, и они не найдут ничего плохого, они просто отправят его обратно, и вы будете без диска в течение от 2 недель до 2 месяцев.
Еще один ответ говорит, что smartctl сообщает, что нет ничего плохого в драйвере .
В этом ответе я предложил запустить fsck -f, и вы ответили, что никаких ошибок не сообщалось.
В качестве компромисса между отрицательный ответ (верните его) и положительный ответ (ничего не получается), моя склонность - запустить fsck при каждой загрузке. Если обнаружена ошибка, загрузка приостанавливается, и вы можете прочитать сообщение об ошибке. Чтобы обобщить использование ссылки:
sudo tune2fs -c 1 /dev/sdX
Примечание: замените X буквой вашего диска, то есть a, b и т. Д.
Если через месяц без ошибок, измените значение от 1 до 30, что типично для большинства систем, которые, как я полагаю. На стандартном SSD fsck будет работать быстро.
Другие упомянули о замене кабеля SATA, который проблематичен для ноутбука. В качестве компромисса рассмотрите возможность отсоединения всех кабелей со стороны привода, используя сжатый воздух на мужских и женских концах, а затем плотно затяните кабели.