Несколько месяцев назад я использовал Ubuntu 16.04 на Thinkpad T570 в течение приблизительно одного года, когда моя работа с окнами ноутбука, разрушенная впервые. Я перезапустил его, и это вернулось к нормальному в течение приблизительно одной недели прежде, чем сделать его снова. За следующие несколько недель это сделало это полдюжину раз. В течение следующих двух недель после этого, это было абсолютно стабильно и не заморозилось однажды. На прошлой неделе это начало отказывать снова.
Признаки:
Я выполнил встроенную аппаратную диагностику Lenovo, и все возвращается прекрасное. Таким образом, я решил попытаться обновить до Ubuntu 18.04, чтобы видеть, решит ли это проблему. Я не сделал чистой установки, но обновленный вместо этого.
На неделе начиная с обновления, 18.04 отказал дважды. Поведение очень похоже на 16,04 катастрофических отказов, хотя сообщения об ошибках и скорость катастрофического отказа кажутся несколько отличающимися.
Сообщения об ошибках от этого последнего катастрофического отказа, которые повторяются непрерывно, пока я трудно завершение работы не:
EXT4-fs error (device nvme0n1p2) ext3_find_entry:1436: inode#[NUMBER]: comm gmain: reading directory lblock 0
systemd-journald[268]: Failed to write entry ([NUMBER] items [NUMBER] bytes), ignoring: Read-only file system
Кроме этого, у меня нет других конкретных точек данных для помогания отнести гвоздя, что продолжается. Но вот несколько других мыслей, которые могли бы быть полезными:
Любые мысли о том, что могло бы продолжаться, будут значительно цениться!Спасибо!
В ответе на @heynnema предложение:
SMART Data & Tests
кнопка отображается серым и не может быть нажата (ни на каком устройстве/разделе). Я сделал: sudo apt install smartmontools
, после которого SMART Data & Tests
кнопка осталась серой. В попытке получить некоторую релевантную информацию, я затем работал sudo smartctl -a /dev/nvme0n1p2
. Это не производит информации включая "сектор", но вывод ниже:
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.15.0-29-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Number: SAMSUNG MZVLW256HEHP-000L7
Serial Number: S35ENX0J599958
Firmware Version: 4L7QCXB7
PCI Vendor/Subsystem ID: 0x144d
IEEE OUI Identifier: 0x002538
Total NVM Capacity: 256,060,514,304 [256 GB]
Unallocated NVM Capacity: 0
Controller ID: 2
Number of Namespaces: 1
Namespace 1 Size/Capacity: 256,060,514,304 [256 GB]
Namespace 1 Utilization: 168,824,696,832 [168 GB]
Namespace 1 Formatted LBA Size: 512
Local Time is: Thu Feb 28 18:47:38 2019 UTC
Firmware Updates (0x16): 3 Slots, no Reset required
Optional Admin Commands (0x0017): Security Format Frmw_DL *Other*
Optional NVM Commands (0x001f): Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Warning Comp. Temp. Threshold: 69 Celsius
Critical Comp. Temp. Threshold: 72 Celsius
Supported Power States
St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat
0 + 7.60W - - 0 0 0 0 0 0
1 + 6.00W - - 1 1 1 1 0 0
2 + 5.10W - - 2 2 2 2 0 0
3 - 0.0400W - - 3 3 3 3 210 1500
4 - 0.0050W - - 4 4 4 4 2200 6000
Supported LBA Sizes (NSID 0x1)
Id Fmt Data Metadt Rel_Perf
0 + 512 0 0
=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
SMART/Health Information (NVMe Log 0x02, NSID 0x1)
Critical Warning: 0x00
Temperature: 28 Celsius
Available Spare: 100%
Available Spare Threshold: 10%
Percentage Used: 1%
Data Units Read: 3,685,965 [1.88 TB]
Data Units Written: 8,000,875 [4.09 TB]
Host Read Commands: 54,265,691
Host Write Commands: 86,676,003
Controller Busy Time: 399
Power Cycles: 1,823
Power On Hours: 646
Unsafe Shutdowns: 93
Media and Data Integrity Errors: 0
Error Information Log Entries: 267
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 28 Celsius
Temperature Sensor 2: 29 Celsius
Error Information (NVMe Log 0x01, max 64 entries)
Num ErrCount SQId CmdId Status PELoc LBA NSID VS
0 267 0 0x0008 0x4004 - 0 0 -
1 266 0 0x0016 0x4016 0x004 0 1 -
2 265 0 0x0008 0x4004 - 0 0 -
3 264 0 0x0016 0x4016 0x004 0 1 -
4 263 0 0x0008 0x4004 - 0 0 -
5 262 0 0x0008 0x4004 - 0 0 -
6 261 0 0x0008 0x4004 - 0 0 -
7 260 0 0x0026 0x4016 0x004 0 1 -
8 259 0 0x0008 0x4004 - 0 0 -
9 258 0 0x0008 0x4004 - 0 0 -
10 257 0 0x0008 0x4004 - 0 0 -
11 256 0 0x0016 0x4016 0x004 0 1 -
12 255 0 0x0008 0x4004 - 0 0 -
13 254 0 0x0008 0x4004 - 0 0 -
14 253 0 0x0008 0x4004 - 0 0 -
15 252 0 0x0008 0x4004 - 0 0 -
... (48 entries not shown)
Я также смотрел на smartctl
страница справочника, но это не было очевидно, какой флаг (флаги) мог бы дать больше информации о секторах.
Даже при том, что у меня было несколько катастрофических отказов за последние несколько дней, ls -al /var/crash
не показывает катастрофических отказов в тот период времени:
jessime@jessime-t570:~$ ls -al /var/crash
total 59072
drwxrwsrwt 2 root whoopsie 4096 Mar 5 11:05 .
drwxr-xr-x 15 root root 4096 Jan 31 2018 ..
-rw-r----- 1 jessime whoopsie 37795148 Mar 1 10:39 _usr_bin_gedit.1000.crash
-rw-rw-r-- 1 jessime whoopsie 0 Mar 1 10:39 _usr_bin_gedit.1000.upload
-rw------- 1 whoopsie whoopsie 0 Mar 1 10:40 _usr_bin_gedit.1000.uploaded
-rw-r----- 1 jessime whoopsie 22683033 Feb 27 19:04 _usr_bin_pulseaudio.1000.crash
Позволяет проверяют Вашу файловую систему Ubuntu сначала...
terminal
окноsudo fdisk -l
sudo fsck -f /dev/XXXX
# замена XXXX с числом Вы нашли ранееreboot
Обновление № 1:
Затем позволяет, проверяют УМНЫЕ Данные...
Disks
приложениеSMART Data & Tests
от значка гамбургераОбновление № 2:
Я думаю, что у Вас есть проблема встроенного микропрограммного обеспечения SSD. Посмотрите это обновление, но перепроверка, что у меня есть правильный для Вашей машины. И Lenovo и Samsung имеют updater инструменты, немного домашней работы - также. Сделайте резервное копирование СНАЧАЛА и затем сделайте обновление. Необходимо будет выполнить updater в Windows.