Сбой: Ubuntu 20.04, Aorus x570 Elite и Ryzen 5 3600

Симптом:

Система зависает от двух минут до часа после загрузки, а затем самопроизвольно перезагружается примерно через десять секунд. Не имеет значения, сидит ли система на экране входа в систему, бездействует на рабочем столе, смотрит видео и т. Д. Показания температуры нормальные, вплоть до зависания + перезагрузки.

Я думал, что это подразумевает проблему с памятью, но я пробовал переустановить модули, поменять местами слоты, увеличить напряжение DRAM и т. Д. Потоки на Ryzen и материнской плате Aorus отправили меня в кроличьи норы, и я отключил c-состояния , увеличение мощности DRAM в режиме ожидания и т. д. Никакой радости.

Обратите внимание, что этот AMD Ryzen 5 3600 не неисправный компонент ЦП; Я заменил его на AMD через обмен RMA и не увидел никакой разницы! (Когда я устанавливаю AMD Ryzen 3400G в качестве процессора, система оказывается надежной. Однако я не могу использовать этот процессор / APU в течение длительного времени для этой системы.)

Ниже приводится все, что вы можете выдержать. Пожалуйста, дайте мне знать, если я пропустил что-нибудь, что может помочь в дальнейшей диагностике неисправности.

Я потратил недели драгоценного времени на то, чтобы сделать эту сборку стабильной. В этот момент я чувствую, что перепробовал все, кроме надувания дохлого цыпленка над головой. Пожалуйста, помогите мне найти первопричину! Я на грани своего остроумия и чувствую себя очень обескураженным.: (

Краткий список (потенциально) соответствующих других потоков:

Оборудование

  • Материнская плата Gigabyte x570 Aorus Elite (версии UEFI: F11 или F20)
  • 6-ядерный процессор AMD Ryzen 5 3600
  • 16 ГБ памяти Corsair Vengeance LPX (DDR4 2x8 ГБ)
  • MSI GeForce GTX 970 GAMING 4G
    • 08: 00.0 VGA-совместимый контроллер [0300]: NVIDIA Corporation GM204 [GeForce GTX 970] [10de: 13c2] (rev a1)

Изображение основных компонентов

То, что я пробовал без изменений

  • Тщательно протестировали память (за ночь, проблем не обнаружено)
  • Перезагрузка памяти
  • Перестановка памяти в противоположный банк памяти
  • Перестановка карт памяти в том же банке
  • Перестановка ЦП через RMA с AMD
  • Различные версии UEFI (F11 и F20)

Ошибки, сообщаемые при загрузке, обычно выглядят следующим образом:

sudo journalctl | grep -i "hardware err"

Jul 13 17:28:36 obelisk-ubuntu kernel: mce: [Hardware Error]: Machine check events logged

Jul 13 17:28:36 obelisk-ubuntu kernel: mce: [Hardware Error]: CPU 2: Machine Check: 0 Bank 5: bea0000000000108

Jul 13 17:28:36 obelisk-ubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR 1ffff87930eee MISC d012000100000000 SYND 4d000000 IPID 500b000000000

Jul 13 17:28:36 obelisk-ubuntu kernel: mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1594686497 SOCKET 0 APIC 4 microcode 8701013

Jul 13 20:06:36 obelisk-ubuntu kernel: mce: [Hardware Error]: Machine check events logged

Jul 13 20:06:36 obelisk-ubuntu kernel: mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 5: bea0000000000108

Jul 13 20:06:36 obelisk-ubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR 1ffffbbf30eee MISC d012000100000000 SYND 4d000000 IPID 500b000000000

Jul 13 20:06:36 obelisk-ubuntu kernel: mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1594695977 SOCKET 0 APIC a microcode 8701021

Jul 15 16:57:44 obelisk-ubuntu kernel: mce: [Hardware Error]: Machine check events logged

Jul 15 16:57:44 obelisk-ubuntu kernel: mce: [Hardware Error]: CPU 1: Machine Check: 0 Bank 5: bea0000000000108

Jul 15 16:57:44 obelisk-ubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR 1ffff89330eee MISC d012000100000000 SYND 4d000000 IPID 500b000000000

Jul 15 16:57:44 obelisk-ubuntu kernel: mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1594857445 SOCKET 0 APIC 1 microcode 8701021

Подробнее:

Настройки UEFI

Настройки на картинке ниже относятся к F20, самому последнему стабильному выпуску UEFI.

Вещи, которые я пробовал без изменений (обратите внимание на НИКАКОГО разгона)

  • Каждая версия UEFI Gigabyte между F11 и F20 с настройками «оптимизировано по умолчанию»
  • Повышение напряжения ядра DRAM до 1,35 В
  • Многие из настроек ниже / на рисунке переключаются в ту или иную сторону:
    • Частота тактовой частоты ЦП: Авто (36,00)
    • Управление тактовой частотой ЦП: Авто (100,00 МГц)
    • Экстремальный профиль памяти (X.M.P): выключено
    • CPU Vcore: Auto
    • CPU Vcore Loadline Calibration: Auto
    • CSM Support: Enabled
    • SMT Mode: Disabled
    • Power Supply Control Idle Control: Typical Current Idle
    • IOMMU: Включено
    • Режим SVM: Включено
    • ACS Включено: Авто
    • Включено ограничение AER: Авто
    • Глобальное управление C-состоянием: отключено
    • Параметры питания DRAM> Power Down Enable: Disabled

Программное обеспечение

Ubuntu 20.04 LTS

$ uname -a 
Kernel: Linux obelisk-ubuntu 5.4.0-40-generic #44-Ubuntu SMP Tue Jun 23 00:01:04 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux
$ grep GRUB_CMDLINE_LINUX_DEFAULT /etc/default/grub
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash atkbd.reset=1 i8042.reset pci=assign-busses apicmaintimer idle=poll reboot=cold,hard processor.max_cstate=1 rcu_nocbs=0-11"

Я также пробовал установить пакет ZenStates и отключить C6.

Вот суть со всем остальным, я думаю, вы могли бы попросить .

1
задан 26 July 2020 в 23:50

0 ответов

Другие вопросы по тегам:

Похожие вопросы: