Около недели назад я переключил компьютер, который я использую в качестве NAS, с Windows на Ubuntu 20.04 LTS, и с тех пор у меня возникали проблемы с сбоями NAS каждые 1-2 дня.
Когда NAS выходит из строя, весь экран зависает, включая движение мыши. Даже REISUB не перезагружает систему. Мне всегда приходится нажимать кнопку сброса на компьютере.
NAS работает на процессоре Ryzen 7 1700, поэтому я подумал, что это может быть проблема с состоянием питания. Большинство советов, которые я нашел по этому поводу, касаются отключения состояния C6 Power в BIOS моей материнской платы, но на моей материнской плате (Asus x370-f strix), похоже, нет такой возможности.
Я нашел кого-то, кто использовал MX Linux, которые сказали, что они отключили состояние C6 Power с помощью команды cpupower idle-set --disable c6
.
Я пробовал это, но проблема все еще не устранена.
Я выполнил команду journalctl | grep error
после последнего сбоя, и это единственные сообщения об ошибках со дня последнего сбоя.
Jun 03 21:22:22 NAS-PC kernel: EXT4-fs (sdb2): re-mounted. Opts: errors=remount-ro
Jun 03 21:22:25 NAS-PC systemd[1]: Condition check resulted in Process error reports when automatic reporting is enabled (file watch) being skipped.
Jun 03 21:22:26 NAS-PC gnome-session[1435]: gnome-session-binary[1435]: WARNING: Falling back to non-systemd startup procedure due to error: GDBus.Error:org.freedesktop.DBus.Error.Spawn.ChildExited: Process org.freedesktop.systemd1 exited with status 1
Jun 03 21:22:26 NAS-PC gnome-session-binary[1435]: WARNING: Falling back to non-systemd startup procedure due to error: GDBus.Error:org.freedesktop.DBus.Error.Spawn.ChildExited: Process org.freedesktop.systemd1 exited with status 1
Jun 03 21:22:33 NAS-PC /usr/lib/gdm3/gdm-x-session[2177]: (WW) warning, (EE) error, (NI) not implemented, (??) unknown.
Я новичок в Linux, поэтому понятия не имею, следует ли использовать эту команду для журналов ошибок. Пожалуйста, дайте мне знать, есть ли лучший метод проверки ошибок.
Любая помощь будет принята с благодарностью, спасибо.
РЕДАКТИРОВАТЬ: Вот результаты команд, которые меня попросили запустить.
nas@NAS-PC:~$ sudo dmidecode -s bios-version
3803
nas@NAS-PC:~$ free -h
total used free shared buff/cache available
Mem: 15Gi 2.0Gi 11Gi 5.0Mi 2.2Gi 13Gi
Swap: 2.0Gi 0B 2.0Gi
nas@NAS-PC:~$ sysctl vm.swappiness
vm.swappiness = 60
nas@NAS-PC:~$ sudo lshw -C memory
*-firmware
description: BIOS
vendor: American Megatrends Inc.
physical id: 0
version: 3803
date: 01/22/2018
size: 64KiB
capacity: 16MiB
capabilities: pci apm upgrade shadowing cdboot bootselect socketedrom edd int13floppy1200 int13floppy720 int13floppy2880 int5printscreen int9keyboard int14serial int17printer acpi usb biosbootspecification uefi
*-memory
description: System Memory
physical id: b
slot: System board or motherboard
size: 16GiB
*-bank:0
description: [empty]
product: Unknown
vendor: Unknown
physical id: 0
serial: Unknown
slot: DIMM_A1
*-bank:1
description: DIMM DDR4 Synchronous Unbuffered (Unregistered) 2133 MHz (0.5 ns)
product: CMW16GX4M2C3200C16
vendor: Unknown
physical id: 1
serial: 00000000
slot: DIMM_A2
size: 8GiB
width: 64 bits
clock: 2133MHz (0.5ns)
*-bank:2
description: [empty]
product: Unknown
vendor: Unknown
physical id: 2
serial: Unknown
slot: DIMM_B1
*-bank:3
description: DIMM DDR4 Synchronous Unbuffered (Unregistered) 2133 MHz (0.5 ns)
product: CMW16GX4M2C3200C16
vendor: Unknown
physical id: 3
serial: 00000000
slot: DIMM_B2
size: 8GiB
width: 64 bits
clock: 2133MHz (0.5ns)
*-cache:0
description: L1 cache
physical id: d
slot: L1 - Cache
size: 768KiB
capacity: 768KiB
clock: 1GHz (1.0ns)
capabilities: pipeline-burst internal write-back unified
configuration: level=1
*-cache:1
description: L2 cache
physical id: e
slot: L2 - Cache
size: 4MiB
capacity: 4MiB
clock: 1GHz (1.0ns)
capabilities: pipeline-burst internal write-back unified
configuration: level=2
*-cache:2
description: L3 cache
physical id: f
slot: L3 - Cache
size: 16MiB
capacity: 16MiB
clock: 1GHz (1.0ns)
capabilities: pipeline-burst internal write-back unified
configuration: level=3
РЕДАКТИРОВАТЬ: Материнская плата представляет собой игровой процесс asus rog stix x370-f.
Вот результат grep -i sdb2 / var / log / syslog *
Он ничего не показывает с момента сбоя 3 июня, но у меня на самом деле сегодня было несколько сбоев при попытке настроить memtest на USB-накопитель. Надеюсь, данные, которые здесь есть, пригодятся.
/var/log/syslog:Jun 4 09:55:54 NAS-PC kernel: [ 1.566219] sdb: sdb1 sdb2
/var/log/syslog:Jun 4 09:55:54 NAS-PC kernel: [ 4.959148] EXT4-fs (sdb2): mounted filesystem with ordered data mode. Opts: (null)
/var/log/syslog:Jun 4 09:55:54 NAS-PC kernel: [ 5.499027] EXT4-fs (sdb2): re-mounted. Opts: errors=remount-ro
/var/log/syslog:Jun 4 10:00:29 NAS-PC kernel: [ 1.554147] sdb: sdb1 sdb2
/var/log/syslog:Jun 4 10:00:29 NAS-PC kernel: [ 4.965393] EXT4-fs (sdb2): mounted filesystem with ordered data mode. Opts: (null)
/var/log/syslog:Jun 4 10:00:29 NAS-PC kernel: [ 5.441670] EXT4-fs (sdb2): re-mounted. Opts: errors=remount-ro
/var/log/syslog:Jun 4 10:08:32 NAS-PC kernel: [ 1.546202] sdb: sdb1 sdb2
/var/log/syslog:Jun 4 10:08:32 NAS-PC kernel: [ 4.973591] EXT4-fs (sdb2): mounted filesystem with ordered data mode. Opts: (null)
/var/log/syslog:Jun 4 10:08:32 NAS-PC kernel: [ 5.444522] EXT4-fs (sdb2): re-mounted. Opts: errors=remount-ro
/var/log/syslog:Jun 4 10:18:38 NAS-PC kernel: [ 1.542013] sdb: sdb1 sdb2
/var/log/syslog:Jun 4 10:18:38 NAS-PC kernel: [ 4.934979] EXT4-fs (sdb2): mounted filesystem with ordered data mode. Opts: (null)
/var/log/syslog:Jun 4 10:18:38 NAS-PC kernel: [ 5.395831] EXT4-fs (sdb2): re-mounted. Opts: errors=remount-ro
/var/log/syslog:Jun 4 10:30:06 NAS-PC kernel: [ 1.549958] sdb: sdb1 sdb2
/var/log/syslog:Jun 4 10:30:06 NAS-PC kernel: [ 4.848546] EXT4-fs (sdb2): mounted filesystem with ordered data mode. Opts: (null)
/var/log/syslog:Jun 4 10:30:06 NAS-PC kernel: [ 5.322608] EXT4-fs (sdb2): re-mounted. Opts: errors=remount-ro
Binary file /var/log/syslog.1 matches
У меня есть 3 диска в системе: 1x 120gb SSD, 2x 6tb HDD setup в RAID 1 с mdadm. Ни на одном из них не установлены окна.
Вот результат sudo fdisk -l
:
Disk /dev/loop0: 55.48 MiB, 58159104 bytes, 113592 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk /dev/loop1: 138.93 MiB, 145657856 bytes, 284488 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk /dev/loop2: 55.43 MiB, 58114048 bytes, 113504 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk /dev/loop3: 218.102 MiB, 229629952 bytes, 448496 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk /dev/loop4: 51.4 MiB, 53522432 bytes, 104536 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk /dev/loop5: 162.89 MiB, 170778624 bytes, 333552 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk /dev/loop6: 32.9 MiB, 33644544 bytes, 65712 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk /dev/loop7: 64.79 MiB, 67915776 bytes, 132648 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk /dev/sda: 5.47 TiB, 6001175126016 bytes, 11721045168 sectors
Disk model: WDC WD6002FFWX-6
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disklabel type: gpt
Disk identifier: 25D7A7C5-BE1E-4DE1-BE76-AF1CCCA56E55
Device Start End Sectors Size Type
/dev/sda1 2048 11721043967 11721041920 5.5T Microsoft basic data
Disk /dev/sdb: 111.81 GiB, 120034123776 bytes, 234441648 sectors
Disk model: KINGSTON SA400S3
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: gpt
Disk identifier: 1FFE61F6-6E4D-45CD-80EB-61F0F8CFF851
Device Start End Sectors Size Type
/dev/sdb1 2048 1050623 1048576 512M EFI System
/dev/sdb2 1050624 234440703 233390080 111.3G Linux filesystem
Disk /dev/sdc: 5.47 TiB, 6001175126016 bytes, 11721045168 sectors
Disk model: WDC WD6002FFWX-6
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disklabel type: gpt
Disk identifier: 78290624-A970-432A-978C-B8D7F9A79561
Device Start End Sectors Size Type
/dev/sdc1 2048 11721043967 11721041920 5.5T Microsoft basic data
Disk /dev/md0: 5.47 TiB, 6001038196736 bytes, 11720777728 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disklabel type: dos
Disk identifier: 0x00000000
Disk /dev/loop8: 32.1 MiB, 33660928 bytes, 65744 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk /dev/loop9: 65.1 MiB, 68259840 bytes, 133320 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk /dev/loop10: 141.4 MiB, 148254720 bytes, 289560 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Вот скриншоты смарт-данных ДИСКОВ (сам массив RAID явно не есть какие-либо интеллектуальные данные)
KINGSTON SA400S37120G (SBFK71E0)
WDC WD6002FFWX-68TZ4N0 (83.H0A83) (NCGWXW2V)
WDC WD6002FFWX-83TZ4NA NCH9XLDS)
РЕДАКТИРОВАТЬ: Вот ls -al / var / crash. Cpupower-gui был частью моей попытки отключить состояние питания C6, я не использовал это приложение.
total 15744
drwxrwsrwt 2 root whoopsie 4096 Jun 4 07:37 .
drwxr-xr-x 14 root root 4096 Feb 10 05:56 ..
-rw-r----- 1 nas whoopsie 66768 Jun 2 11:52 _usr_bin_cpupower-gui.1000.crash
-rw-rw-r-- 1 nas whoopsie 0 Jun 2 11:52 _usr_bin_cpupower-gui.1000.upload
-rw------- 1 whoopsie whoopsie 37 Jun 2 11:52 _usr_bin_cpupower-gui.1000.uploaded
-rw-r----- 1 plex whoopsie 16036359 May 30 02:15 '_usr_lib_plexmediaserver_Plex Media Server.998.crash'
РЕДАКТИРОВАТЬ: Вот свежая sudo lshw -C memory
Новая оперативная память отсутствует в QVL
*-firmware
description: BIOS
vendor: American Megatrends Inc.
physical id: 0
version: 5603
date: 07/28/2020
size: 64KiB
capacity: 16MiB
capabilities: pci apm upgrade shadowing cdboot bootselect socketedrom edd int13floppy1200 int13floppy720 int13floppy2880 int5printscreen int9keyboard int14serial int17printer acpi usb biosbootspecification uefi
*-memory
description: System Memory
physical id: 2c
slot: System board or motherboard
size: 16GiB
*-bank:0
description: Project-Id-Version: lshwReport-Msgid-Bugs-To: FULL NAME <EMAIL@ADDRESS>PO-Revision-Date: 2012-02-02 13:04+0000Last-Translator: Joel Addison <jaddi27@gmail.com>Language-Team: English (Australia) <en_AU@li.org>MIME-Version: 1.0Content-Type: text/plain; charset=UTF-8Content-Transfer-Encoding: 8bitX-Launchpad-Export-Date: 2021-01-21 18:43+0000X-Generator: Launchpad (build 2d1d5e352f0d063d660df2300e31f66bed027fa5)Project-Id-Version: lshwReport-Msgid-Bugs-To: FULL NAME <EMAIL@ADDRESS>PO-Revision-Date: 2012-02-02 13:04+0000Last-Translator: Joel Addison <jaddi27@gmail.com>Language-Team: English (Australia) <en_AU@li.org>MIME-Version: 1.0Content-Type: text/plain; charset=UTF-8Content-Transfer-Encoding: 8bitX-Launchpad-Export-Date: 2021-01-21 18:43+0000X-Generator: Launchpad (build 2d1d5e352f0d063d660df2300e31f66bed027fa5) [empty]
product: Unknown
vendor: Unknown
physical id: 0
serial: Unknown
slot: DIMM_A1
*-bank:1
description: DIMM DDR4 Synchronous Unbuffered (Unregistered) 2400 MHz (0.4 ns)
product: KHX2400C15D4/8G
vendor: Kingston
physical id: 1
serial: 9321D353
slot: DIMM_A2
size: 8GiB
width: 64 bits
clock: 2400MHz (0.4ns)
*-bank:2
description: Project-Id-Version: lshwReport-Msgid-Bugs-To: FULL NAME <EMAIL@ADDRESS>PO-Revision-Date: 2012-02-02 13:04+0000Last-Translator: Joel Addison <jaddi27@gmail.com>Language-Team: English (Australia) <en_AU@li.org>MIME-Version: 1.0Content-Type: text/plain; charset=UTF-8Content-Transfer-Encoding: 8bitX-Launchpad-Export-Date: 2021-01-21 18:43+0000X-Generator: Launchpad (build 2d1d5e352f0d063d660df2300e31f66bed027fa5)Project-Id-Version: lshwReport-Msgid-Bugs-To: FULL NAME <EMAIL@ADDRESS>PO-Revision-Date: 2012-02-02 13:04+0000Last-Translator: Joel Addison <jaddi27@gmail.com>Language-Team: English (Australia) <en_AU@li.org>MIME-Version: 1.0Content-Type: text/plain; charset=UTF-8Content-Transfer-Encoding: 8bitX-Launchpad-Export-Date: 2021-01-21 18:43+0000X-Generator: Launchpad (build 2d1d5e352f0d063d660df2300e31f66bed027fa5) [empty]
product: Unknown
vendor: Unknown
physical id: 2
serial: Unknown
slot: DIMM_B1
*-bank:3
description: DIMM DDR4 Synchronous Unbuffered (Unregistered) 2400 MHz (0.4 ns)
product: KHX2400C15D4/8G
vendor: Kingston
physical id: 3
serial: 90216553
slot: DIMM_B2
size: 8GiB
width: 64 bits
clock: 2400MHz (0.4ns)
*-cache:0
description: L1 cache
physical id: 2e
slot: L1 - Cache
size: 768KiB
capacity: 768KiB
clock: 1GHz (1.0ns)
capabilities: pipeline-burst internal write-back unified
configuration: level=1
*-cache:1
description: L2 cache
physical id: 2f
slot: L2 - Cache
size: 4MiB
capacity: 4MiB
clock: 1GHz (1.0ns)
capabilities: pipeline-burst internal write-back unified
configuration: level=2
*-cache:2
description: L3 cache
physical id: 30
slot: L3 - Cache
size: 16MiB
capacity: 16MiB
clock: 1GHz (1.0ns)
capabilities: pipeline-burst internal write-back unified
configuration: level=3
BIOS
ASUS ROG STRIX X370-F GAMING
У вас очень старый BIOS версии 3803 от 1/22/2018. Существует более новый BIOS, версия 5603 от 8/10/2020, который можно загрузить с здесь.
Примечание: Подтвердите, что я указал правильную веб-страницу для вашей модели # материнской платы.
Примечание: Перед обновлением BIOS создайте хорошие резервные копии.
Примечание: Некоторые BIOS позволяют выполнять обновление непосредственно в текущем BIOS. В противном случае, если у вас нет Windows, попробуйте FreeDOS по адресу http://www.freedos.org/.
ПАМЯТЬ
Ryzen 7 1700
Процессоры Ryzen очень привередливы к оперативной памяти.
Corsair CMW16GX4M2C3200C16 не фигурирует в списке поддерживаемой памяти. См. документацию по процессору/памяти здесь.
Зайдите на https://www.memtest86.com/ и загрузите/запустите их бесплатный memtest
для проверки памяти. Для подтверждения хорошей памяти пройдите хотя бы один полный тест на 4/4. Это может занять много часов.
DISK
KINGSTON SA400S37120G (SBFK71E0)
Note: Проверьте наличие обновлений микропрограммы для твердотельного накопителя. Получите Kingston SSD Manager
здесь.
/dev/sdb2 перемонтируется только для чтения.
Данные SMART выглядят нормально.
Проверим файловую систему Linux на /dev/sdb2...
терминала
, нажав Ctrl+Alt+Tsudo fdisk -... l
sudo fsck -f /dev/sdb2
, заменив sdXX
на номер, который вы нашли ранееfsck
, если были ошибкиreboot
SWAP
Ваш 2G /swapfile слишком мал. Давайте увеличим его до 4G...
Примечание: Неправильное использование команд rm
и dd
может привести к потере данных. Предложите копировать/вставить.
В терминале
...
sudo swapoff -a # turn off swap
sudo rm -i /swapfile # remove old /swapfile
sudo dd if=/dev/zero of=/swapfile bs=1M count=4096
sudo chmod 600 /swapfile # set proper file protections
sudo mkswap /swapfile # init /swapfile
sudo swapon /swapfile # turn on swap
free -h # confirm 16G RAM and 4G swap
Отредактируйте /etc/fstab, используя sudo -H gedit /etc/fstab
или sudo pico /etc/fstab
.
Подтвердите эту строку /swapfile в /etc/fstab... и подтвердите отсутствие других строк "swap"... используйте ПРОБЕЛЫ в этой строке... подтвердите отсутствие ТАБЛИЦ...
/swapfile none swap sw 0 0
reboot # reboot and verify operation
Обновление #1:
memtest
не сработал с оригинальной памятью. Память заменена. memtest
теперь работает без ошибок.
Обновление #2:
Перепрошивка GPU.