Ubuntu Server 20.04 LTS висит случайным образом

Я борюсь, чтобы найти причину, почему мой сервер Ubuntu зависает / сбоит.

Я установил barebone ubuntu Server 20.04.2 LTS на моем старом компьютере, чтобы попытаться использовать его как персональный сервер для проведения моих моих проектов.

Моя проблема через несколько часов, иногда на расстоянии от 2 до 3 часов или до тех пор, как от 8 до 12, мой сервер в конечном итоге повесил.

Я получаю визуальный вывод, но он полностью не отвечает для любой клавиатуры, мыши или SSH. Иногда это будет входить в систему CPU #x застрял для XS! Но никогда, кажется, идет от того же места. Иногда Kwarders , иногда МД-Удев , иногда SystemD-Networkd . В других случаях я совсем не визуальный вывод вообще и просто должен заставить перезагрузку.

Поэтому в настоящее время работает на моем сервере:

  • UFW
  • OpenVPN
  • Cockpit
  • Portainer
  • Контейнер Docker Container с реверсным прокси NGINX
  • Давайте шифрованием контейнера Docker
  • 2 NextCloud Docker
  • Около 5 других контейнеров Docker работает небольшими приложениями / веб-приложениями

Что загадоло мне больше всего, я вообще не регистрируюсь, я проверял мои журналы ядра и системных журналов, и обычно последняя строка - не связанная UFW Block Команда некоторых спамера IP-адреса, но ничего более существенного. Я также пытался смотреть на / var / crash / , но то же самое, пустое или журнал моей перезагрузки.

Я осмотрел этот сайт, и люди обычно, кажется, указывают, что это может быть аппаратным вопросом, но у меня никогда не было никакой проблемы, запускающей эту систему в течение ночи в Windows 10, когда она была моей главной установкой.

Что я пробовал:

  • Несколько чистых переустановка Ubuntu Server 20.04.2
  • Обновил мой BIOS и удалить любой разгон, который я мог бы применить
  • , проверил мои температуры и нагрузку на систему, оба ок
  • Проверял мою оперативную память с MemTest86 для прогонов 3x4, на общую сумму более 12 часов и не получил ошибок

Мои спецификации системы:

Ryzen 1700 @stock
16 GB CORSAIR GDDR4 @2133MHz but rated for 3200Mhz
MSI B350 Gaming PLUS MOBO
Gigabyte GTX 1080
Samsung 960 EVO 512GB nVme SSD 
650W corsair power supply
Plenty of cooling

Если кто-либо из вас есть какие-либо лидеры или советы о том, как диагностировать мою настройку, или еще несколько шагов, которые я мог бы попробуй я буду благодарен.

Спасибо за вашу помощь


Редактировать 2021-03-03

После некоторого количества копания ubuntu ryzen и замораживает, я наткнулся на эту нить на форумах AMD . Это говорит о том, что существуют вопросы с государством C6 на 1-м генере Ryzen. Их совет состоит в том, чтобы переключить состояние мощности в BIOS на типичный текущий холостый , который, по-видимому, оказывает влияние на состояние C6. Я попробую это и посмотрю, изменяется ли что-нибудь.

4
задан 6 March 2021 в 14:59

3 ответа

Хорошо, думаю, я отвечу на свой вопрос.

Моя проблема могла быть связана с тем, что процессоры Ryzen плохо работают с Linux. Согласно этому AMD форуму tread, многие люди сталкивались со схожими проблемами с процессорами Ryzen и Linux, когда они простаивали, и Reddit thread с операционными системами, сообщающими о похожих проблемах. Похоже, что существует связь между C6 состоянием процессора и зависанием.

Как исправить это

BIOS

Посмотрите в свой BIOS и попробуйте найти Управление простоями источника питания или Глобальное управление С-состоянием и измените это значение с Auto или Low Current Idle на Typical Current Idle.

Отключить состояние C6

Если это не было исправлено или у вас не было возможности, другой способ отключить его можно найти на этом github repo.


У меня была опция в BIOS моей материнской платы MSI, я применил правильное значение и работал 48 часов без каких-либо проблем, хотя, возможно, и с немного большим энергопотреблением.

Это, конечно, было неприятной проблемой при отладке, но в конце концов я узнал кое-что новое и снова сделал свой сервер несколько стабильным.

Спасибо всем, кто принимал участие и разделял мое разочарование, я надеюсь, что эта тема может быть полезна кому-нибудь еще.

1
ответ дан 18 March 2021 в 23:29

Без сомнения, это ужасно разочаровывающая ситуация. Без предоставления ответа основным процессом устранения неполадок, без сомнения , была бы замена каждого (или партии) компонентов (будь то аппаратное или программное обеспечение.)

Мое отступление: У меня есть система Xigmanas BSD, которая иногда работала нормально в течение нескольких дней или недель, пока внешний массив не зависал и даже не пытался выполнить требуемый сброс zfs в файловой системе было недостаточно, чтобы система продолжала работать. Не казалось, что должна быть причина для блокировки всей системы, но это был результат. Удалил массив, и все идет отлично в течение нескольких месяцев.

Точно так же у меня есть MacBook Pro, который работает практически во всех ситуациях, но когда у меня было запущено программное обеспечение для захвата экрана, оно зависало так регулярно, что я просто отказывался от попыток использовать это программное обеспечение на этом компьютере (отлично работает везде!)


Это действительно похоже на фантомную аппаратную проблему, возможно, проявляющуюся только при определенных конфигурациях программного обеспечения.

Проще говоря - попробуйте другую настройку , если не по какой-либо другой причине, кроме дальнейшей изоляции проблемы. Попробуйте выпуск Debian или CentOS (вставьте сюда другие комментарии по выбору ОС). Есть ли какая-то важная причина для использования 20.04?

Смена ОС должна быть одной из самых простых, если у вас нет другого совместимого запасного оборудования (HD, память, МБ и т. Д.)

Извините, это не волшебство "здесь это ответ или очевидный путь к файлу журнала с ответом «answer. :)

1
ответ дан 18 March 2021 в 23:29

У меня также было та же проблема. Я пробовал много способов решить это, но ничего не сработало. Insead I Установил другую версию Ubuntu 20.04, то есть Ubuntu 20.04.2.0 (FOSCAL FOSCA) или Ubuntu 20.10.

1
ответ дан 18 March 2021 в 23:29

Другие вопросы по тегам:

Похожие вопросы: