В среде Ubuntu произошла незапланированная перезагрузка системы, и единственный доступ к этой системе, который у вас есть, - через удаленный терминал. • На что вы бы посмотрели, чтобы определить основную причину проблемы? • Если перезагрузка была связана с ошибкой приложения (т. Е. Сбоем), как бы вы это определили? Пожалуйста, предоставьте несколько конкретных примеров, таких как команды, которые вы могли бы использовать для решения данного сценария.
При сбоях приложений файлы сбоев находятся в / var / crash /; Я бы также изучил обычные системные журналы, которые лучше всего подходят для вас. Если аппаратное отключение, вы ничего не увидите в журналах systemd и сообщений ( ОГРОМНАЯ подсказка !! . Если Ubuntu знала об отключении, вы тоже это увидите, поскольку увидите причины для выключения. ( Если подробности не найдены, вам необходимо проверить журналы машины; например, ОС HOST, если виртуальная машина или аппаратные журналы, если они подключены к металлу )
Чтобы просмотреть сбой приложения в этом поле
guiverc@d960-ubu2:/de2900/ubuntu_64$ ls -la /var/crash
total 113484
drwxrwsrwt 2 root whoopsie 4096 Feb 27 12:00 .
drwxr-xr-x 16 root root 4096 Nov 29 2018 ..
-rw------- 1 root whoopsie 1214905 Feb 26 08:28 irssi-scripts.0.crash
-rw------- 1 root whoopsie 1193193 Feb 25 15:04 lvm2.0.crash
-rw-r----- 1 guiverc whoopsie 101162337 Feb 19 13:00 _usr_bin_clementine.1000.crash
-rw-r----- 1 guiverc whoopsie 5962296 Feb 26 23:31 _usr_bin_gnome-control-center.1000.crash
-rw-r----- 1 guiverc whoopsie 1519149 Feb 20 08:28 _usr_bin_light-locker.1000.crash
-rw-r----- 1 guiverc whoopsie 1327084 Feb 27 12:00 _usr_bin_totem-video-thumbnailer.1000.crash
-rw-r----- 1 guiverc whoopsie 96196 Feb 22 13:55 _usr_games_sgt-launcher.1000.crash
-rw-r----- 1 guiverc whoopsie 3685288 Feb 22 00:34 _usr_lib_ibus_ibus-ui-gtk3.1000.crash
Начиная с сбои приложений - это просто, поэтому я сначала посмотрю туда, однако я не могу понять, почему сбой приложения может вызвать перезагрузку или завершение работы; поэтому я не ожидал увидеть там что-то значимое (если это полезно; это '' будет после системных журналов).
Для просмотра системных сообщений (для текущего сеанса) вы можете использовать dmesg
. Поскольку он покажет только текущий сеанс, вы не увидите причину для последнего выключение (это был последний сеанс), но после некорректного выключения я ожидал увидеть результаты fsck
(из-за незапланированного выключения).
Однако лучшие подсказки находятся в журналах systemd или journalctl
. Вот где я действительно буду искать подсказки при последнем выключении, т.е. именно здесь я ожидал увидеть отсутствие обычных сообщений о выключении, что означает, что это признак выключения оборудования (например, выключение процессора из-за экстремального теплового порога; контакт заземляется, а ОС не имеет понятия, поэтому сообщения просто останавливаются! и далее сообщение - это обычная загрузка следующего сеанса; такие сообщения будут найдены в журналах оборудования, предполагая сервер предприятия; потребительский уровень обычно не ведет журналы оборудования).
Иногда в журналах все равно можно увидеть признаки перегрева; плохо, если у блока питания есть проблемы (PWR_GOOD падает) ничего не будет найдено, так как ЦП даже не знал о завершении работы; Я подозреваю, что в аппаратных журналах также может отсутствовать этот тип завершения работы (но отсутствие записей по-прежнему является ключом!)
Чтобы сузить круг вопросов, где искать, это будет зависеть от того, какой тип сервера, что на нем запущено, и подробности которые не были предоставлены.