Симптом:
Система зависает от двух минут до часа после загрузки, а затем самопроизвольно перезагружается примерно через десять секунд. Не имеет значения, сидит ли система на экране входа в систему, бездействует на рабочем столе, смотрит видео и т. Д. Показания температуры нормальные, вплоть до зависания + перезагрузки.
Я думал, что это подразумевает проблему с памятью, но я пробовал переустановить модули, поменять местами слоты, увеличить напряжение DRAM и т. Д. Потоки на Ryzen и материнской плате Aorus отправили меня в кроличьи норы, и я отключил c-состояния , увеличение мощности DRAM в режиме ожидания и т. д. Никакой радости.
Обратите внимание, что этот AMD Ryzen 5 3600 не неисправный компонент ЦП; Я заменил его на AMD через обмен RMA и не увидел никакой разницы! (Когда я устанавливаю AMD Ryzen 3400G в качестве процессора, система оказывается надежной. Однако я не могу использовать этот процессор / APU в течение длительного времени для этой системы.)
Ниже приводится все, что вы можете выдержать. Пожалуйста, дайте мне знать, если я пропустил что-нибудь, что может помочь в дальнейшей диагностике неисправности.
Я потратил недели драгоценного времени на то, чтобы сделать эту сборку стабильной. В этот момент я чувствую, что перепробовал все, кроме надувания дохлого цыпленка над головой. Пожалуйста, помогите мне найти первопричину! Я на грани своего остроумия и чувствую себя очень обескураженным.: (
Изображение основных компонентов
То, что я пробовал без изменений
Ошибки, сообщаемые при загрузке, обычно выглядят следующим образом:
sudo journalctl | grep -i "hardware err"
Jul 13 17:28:36 obelisk-ubuntu kernel: mce: [Hardware Error]: Machine check events logged
Jul 13 17:28:36 obelisk-ubuntu kernel: mce: [Hardware Error]: CPU 2: Machine Check: 0 Bank 5: bea0000000000108
Jul 13 17:28:36 obelisk-ubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR 1ffff87930eee MISC d012000100000000 SYND 4d000000 IPID 500b000000000
Jul 13 17:28:36 obelisk-ubuntu kernel: mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1594686497 SOCKET 0 APIC 4 microcode 8701013
Jul 13 20:06:36 obelisk-ubuntu kernel: mce: [Hardware Error]: Machine check events logged
Jul 13 20:06:36 obelisk-ubuntu kernel: mce: [Hardware Error]: CPU 4: Machine Check: 0 Bank 5: bea0000000000108
Jul 13 20:06:36 obelisk-ubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR 1ffffbbf30eee MISC d012000100000000 SYND 4d000000 IPID 500b000000000
Jul 13 20:06:36 obelisk-ubuntu kernel: mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1594695977 SOCKET 0 APIC a microcode 8701021
Jul 15 16:57:44 obelisk-ubuntu kernel: mce: [Hardware Error]: Machine check events logged
Jul 15 16:57:44 obelisk-ubuntu kernel: mce: [Hardware Error]: CPU 1: Machine Check: 0 Bank 5: bea0000000000108
Jul 15 16:57:44 obelisk-ubuntu kernel: mce: [Hardware Error]: TSC 0 ADDR 1ffff89330eee MISC d012000100000000 SYND 4d000000 IPID 500b000000000
Jul 15 16:57:44 obelisk-ubuntu kernel: mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1594857445 SOCKET 0 APIC 1 microcode 8701021
Подробнее:
Настройки на картинке ниже относятся к F20, самому последнему стабильному выпуску UEFI.
Вещи, которые я пробовал без изменений (обратите внимание на НИКАКОГО разгона)
Ubuntu 20.04 LTS
$ uname -a
Kernel: Linux obelisk-ubuntu 5.4.0-40-generic #44-Ubuntu SMP Tue Jun 23 00:01:04 UTC 2020 x86_64 x86_64 x86_64 GNU/Linux
$ grep GRUB_CMDLINE_LINUX_DEFAULT /etc/default/grub
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash atkbd.reset=1 i8042.reset pci=assign-busses apicmaintimer idle=poll reboot=cold,hard processor.max_cstate=1 rcu_nocbs=0-11"
Я также пробовал установить пакет ZenStates и отключить C6.
Вот суть со всем остальным, я думаю, вы могли бы попросить .