Регулярное замораживание системы на основе Ryzen, 16.04 LTS и более новое ядро

Я запускаю Ryzen 1700X CPU и делаю вычисления. Время от времени система выходит из строя при работе 16.04 LTS (Kernel 4.10). Система не перезагружается. На дисплее нет сигнала, и клавиатура + мышь не работает. Я не могу подключиться через SSH.

Я сохранил файлы kern.log и syslog во время работы 16.04 LTS.

После прочтения нескольких сообщений и чтения вопросов о новой архитектуре и проблемах я решил попробовать более новое ядро, и я перешел к 4.12.8 (датируется 16 августа 2017 года) из kern.log . Я использовал этот пост в AskUbuntu для обновления ядра.

Примерно через ~ 11 часов снова сработала система с теми же сообщениями в syslog, что и ядро ​​4.10 на 16.04 LTS, приведенное ниже , {Файлы ядра и syslog с ядром 4.12: сообщение в AskUbuntu и syslog }

Aug 18 17:27:13 vriksha systemd[1]: Starting Cleanup of Temporary Directories... Aug 18 17:27:13 vriksha systemd-tmpfiles[4661]: [/usr/lib/tmpfiles.d/var.conf:14] Duplicate line for path "/var/log", ignoring. Aug 18 17:27:13 vriksha systemd[1]: Started Cleanup of Temporary Directories. Aug 18 17:28:25 vriksha ntpd[1516]: 209.242.224.117 local addr 192.168.2.15 -> Aug 18 17:35:01 vriksha CRON[4821]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1) Aug 18 17:35:40 vriksha systemd[1]: Started Session 5 of user vani. Aug 18 17:42:18 vriksha sensord: Chip: amdgpu-pci-2700 Aug 18 17:42:18 vriksha sensord: Adapter: PCI adapter Aug 18 17:42:18 vriksha sensord: fan1: 1423 RPM Aug 18 17:42:18 vriksha sensord: temp1: 43.0 C Aug 18 17:42:18 vriksha sensord: Chip: asus-isa-0000 Aug 18 17:42:18 vriksha sensord: Adapter: ISA adapter Aug 18 17:42:18 vriksha sensord: cpu_fan: 0 RPM Aug 18 17:45:01 vriksha CRON[6142]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1) Aug 18 17:55:01 vriksha CRON[6431]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1) Aug 18 18:05:01 vriksha CRON[6607]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1) Aug 18 18:09:52 vriksha kernel: [ 3459.913711] perf: interrupt took too long (2529 > 2500), lowering kernel.perf_event_max_sample_rate to 79000 Aug 18 18:12:18 vriksha sensord: Chip: amdgpu-pci-2700 Aug 18 18:12:18 vriksha sensord: Adapter: PCI adapter Aug 18 18:12:18 vriksha sensord: fan1: 1431 RPM Aug 18 18:12:18 vriksha sensord: temp1: 40.0 C Aug 18 18:12:18 vriksha sensord: Chip: asus-isa-0000 Aug 18 18:12:18 vriksha sensord: Adapter: ISA adapter Aug 18 18:12:18 vriksha sensord: cpu_fan: 0 RPM Aug 18 18:15:01 vriksha CRON[6785]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1) Aug 18 18:17:01 vriksha CRON[6825]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly) Aug 18 18:25:01 vriksha CRON[6967]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)

После последней строки в приведенном выше сообщении (в syslog) система застыла. Мне пришлось перезагрузиться снова. Это произошло снова с новым ядром.

Сведения о системе:

CPU-1700X Ryzen, No SMT, BIOS version- 3401 dated 12/08/2017 (AGESA 1071) RAM 32 GB AMD RX 470 GPU Lubuntu 16.04 LTS, LXDE with Openbox

Может кто-нибудь помочь мне.

Обновления

Приложение Я бегу не использую gcc, g++.

lspci вывод здесь. Выход dmesg | egrep 'drm|radeon' здесь (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1) связан с пакетом sysstat, который я удалил. Проблема все еще существует. glxinfo | grep -i open для AMD RX 470 GPU приведен ниже glxinfo | grep -i open OpenGL vendor string: X.Org OpenGL renderer string: Gallium 0.4 on AMD POLARIS10 (DRM 3.15.0 / 4.12.8-041208-generic, LLVM 4.0.0) OpenGL core profile version string: 4.5 (Core Profile) Mesa 17.0.7 OpenGL core profile shading language version string: 4.50 OpenGL core profile context flags: (none) OpenGL core profile profile mask: core profile OpenGL core profile extensions: OpenGL version string: 3.0 Mesa 17.0.7 OpenGL shading language version string: 1.30 OpenGL context flags: (none) OpenGL extensions: OpenGL ES profile version string: OpenGL ES 3.1 Mesa 17.0.7 OpenGL ES profile shading language version string: OpenGL ES GLSL ES 3.10 OpenGL ES profile extensions: . Я подключил к этому компьютеру только один дисплей. Аварии случаются только при выполнении задач интенсивной работы с ЦП при длительных длительностях. (Я оставляю систему с выключенным дисплеем, контролируя ее, проверяя ее с помощью SSH-соединения. Через 5-6 часов или около того соединение SSH становится недоступным. После возвращения к машине движущиеся мыши и клавиатура ничего не делают для отображения дисплея назад. Требуется жесткий сброс). Чтобы проверить, связано ли это с графическим процессором или нет, я изменил его на nVidia GTX 1080, для которого я установил проприетарный драйвер и все еще под такой же нагрузкой, система зависает. Я снова вернулся к графическому процессору AMD, и проблема не устранена. Я исключаю это поведение из-за типа сборки GPU. Для карты nVidia следует выход glxinfo | grep -i open; OpenGL vendor string: NVIDIA Corporation OpenGL renderer string: GeForce GTX 1080/PCIe/SSE2 OpenGL core profile version string: 4.5.0 NVIDIA 384.81 OpenGL core profile shading language version string: 4.50 NVIDIA OpenGL core profile context flags: (none) OpenGL core profile profile mask: core profile OpenGL core profile extensions: OpenGL version string: 4.5.0 NVIDIA 384.81 OpenGL shading language version string: 4.50 NVIDIA OpenGL context flags: (none) OpenGL profile mask: (none) OpenGL extensions: OpenGL ES profile version string: OpenGL ES 3.2 NVIDIA 384.81 OpenGL ES profile shading language version string: OpenGL ES GLSL ES 3.20 OpenGL ES profile extensions: Обновлен BIOS до версии 3401 (12/08/2017, AGESA 1071), и проблема не устранена.

4
задан 18 December 2017 в 16:11

11 ответов

У меня была такая же проблема, как и вы. Ryzen 1800x

Я предлагаю вам:

Повторно включить SMT - нет необходимости отключать его.

Вернитесь к нормальному текущему ядру для Ubuntu 16.04, который в настоящее время 4.4.0-93

Отключить все опции «энергосбережения» Global C-State в BIOS.

Отключить прохладный n тихий вариант.

Увеличьте напряжение вашего SoC до 1,1 для стабильности, это рекомендуется. Как указано в этом видео: https://www.hardocp.com/news/2017/05/01/how_to_stabilize_your_amd_ryzen_memory_cpu_overclocking_attempts

Вышеуказанная рекомендация действительна, если вы подчеркиваете CPU или работаете на холостом ходу.

Загрузите последние драйверы AMD на веб-сайт AMD для своей карты. Вы также можете попробовать новейшие драйверы с открытым исходным кодом через: «Дополнительные драйверы» в разделе «Программное обеспечение и обновления». Я рекомендую эту опцию сначала.

Прежде чем делать это, просто сбросьте BIOS по умолчанию и проверьте, есть ли более новая версия.

1
ответ дан 18 July 2018 в 08:17

У меня была такая же проблема, как и вы. Ryzen 1800x

Я предлагаю вам:

Повторно включить SMT - нет необходимости отключать его.

Вернитесь к нормальному текущему ядру для Ubuntu 16.04, который в настоящее время 4.4.0-93

Отключить все опции «энергосбережения» Global C-State в BIOS.

Отключить прохладный n тихий вариант.

Увеличьте напряжение вашего SoC до 1,1 для стабильности, это рекомендуется. Как указано в этом видео: https://www.hardocp.com/news/2017/05/01/how_to_stabilize_your_amd_ryzen_memory_cpu_overclocking_attempts

Вышеуказанная рекомендация действительна, если вы подчеркиваете CPU или работаете на холостом ходу.

Загрузите последние драйверы AMD на веб-сайт AMD для своей карты. Вы также можете попробовать новейшие драйверы с открытым исходным кодом через: «Дополнительные драйверы» в разделе «Программное обеспечение и обновления». Я рекомендую эту опцию сначала.

Прежде чем делать это, просто сбросьте BIOS по умолчанию и проверьте, есть ли более новая версия.

1
ответ дан 24 July 2018 в 19:03
  • 1
    Я отключил SMT умышленно, так как приложения (я), которые я использую, могут пострадать от промаха в кеше и, следовательно, численной точности результатов. Эти сценарии происходят при высокопроизводительных вычислениях при параллельных вычислениях в течение длительного времени. – ankit7540 15 September 2017 в 14:15

У меня была такая же проблема, как и вы. Ryzen 1800x

Я предлагаю вам:

Перезапустить SMT - нет необходимости отключать его.

Вернитесь в нормальное текущее ядро ​​для Ubuntu 16.04, которое в настоящее время 4.4.0-93

Отключить все опции «Экономия энергии» Global C-State в BIOS.

Отключить прохладный n тихий вариант.

Увеличьте напряжение вашего SoC до 1,1 для стабильности, это рекомендуется. Как указано в этом видео: https://www.hardocp.com/news/2017/05/01/how_to_stabilize_your_amd_ryzen_memory_cpu_overclocking_attempts

Вышеуказанная рекомендация действительна, если вы подчеркиваете CPU или если вы находитесь на холостом ходу.

Загрузите последние драйверы AMD на веб-сайт AMD для своей карты. Вы также можете попробовать новейшие драйверы с открытым исходным кодом через: «Дополнительные драйверы» в разделе «Программное обеспечение и обновления». Я рекомендую этот вариант в первую очередь.

Прежде чем делать это, просто сбросьте BIOS по умолчанию и проверьте, есть ли более новая версия.

1
ответ дан 31 July 2018 в 13:05

У меня была такая же проблема, как и вы. Ryzen 1800x

Я предлагаю вам:

Перезапустить SMT - нет необходимости отключать его.

Вернитесь в нормальное текущее ядро ​​для Ubuntu 16.04, которое в настоящее время 4.4.0-93

Отключить все опции «Экономия энергии» Global C-State в BIOS.

Отключить прохладный n тихий вариант.

Увеличьте напряжение вашего SoC до 1,1 для стабильности, это рекомендуется. Как указано в этом видео: https://www.hardocp.com/news/2017/05/01/how_to_stabilize_your_amd_ryzen_memory_cpu_overclocking_attempts

Вышеуказанная рекомендация действительна, если вы подчеркиваете CPU или если вы находитесь на холостом ходу.

Загрузите последние драйверы AMD на веб-сайт AMD для своей карты. Вы также можете попробовать новейшие драйверы с открытым исходным кодом через: «Дополнительные драйверы» в разделе «Программное обеспечение и обновления». Я рекомендую этот вариант в первую очередь.

Прежде чем делать это, просто сбросьте BIOS по умолчанию и проверьте, есть ли более новая версия.

1
ответ дан 31 July 2018 в 22:07

У меня была такая же проблема, как и вы. Ryzen 1800x

Я предлагаю вам:

Перезапустить SMT - нет необходимости отключать его.

Вернитесь в нормальное текущее ядро ​​для Ubuntu 16.04, которое в настоящее время 4.4.0-93

Отключить все опции «Экономия энергии» Global C-State в BIOS.

Отключить прохладный n тихий вариант.

Увеличьте напряжение вашего SoC до 1,1 для стабильности, это рекомендуется. Как указано в этом видео: https://www.hardocp.com/news/2017/05/01/how_to_stabilize_your_amd_ryzen_memory_cpu_overclocking_attempts

Вышеуказанная рекомендация действительна, если вы подчеркиваете CPU или если вы находитесь на холостом ходу.

Загрузите последние драйверы AMD на веб-сайт AMD для своей карты. Вы также можете попробовать новейшие драйверы с открытым исходным кодом через: «Дополнительные драйверы» в разделе «Программное обеспечение и обновления». Я рекомендую этот вариант в первую очередь.

Прежде чем делать это, просто сбросьте BIOS по умолчанию и проверьте, есть ли более новая версия.

1
ответ дан 2 August 2018 в 15:24

У меня была такая же проблема, как и вы. Ryzen 1800x

Я предлагаю вам:

Перезапустить SMT - нет необходимости отключать его.

Вернитесь в нормальное текущее ядро ​​для Ubuntu 16.04, которое в настоящее время 4.4.0-93

Отключить все опции «Экономия энергии» Global C-State в BIOS.

Отключить прохладный n тихий вариант.

Увеличьте напряжение вашего SoC до 1,1 для стабильности, это рекомендуется. Как указано в этом видео: https://www.hardocp.com/news/2017/05/01/how_to_stabilize_your_amd_ryzen_memory_cpu_overclocking_attempts

Вышеуказанная рекомендация действительна, если вы подчеркиваете CPU или если вы находитесь на холостом ходу.

Загрузите последние драйверы AMD на веб-сайт AMD для своей карты. Вы также можете попробовать новейшие драйверы с открытым исходным кодом через: «Дополнительные драйверы» в разделе «Программное обеспечение и обновления». Я рекомендую этот вариант в первую очередь.

Прежде чем делать это, просто сбросьте BIOS по умолчанию и проверьте, есть ли более новая версия.

1
ответ дан 3 August 2018 в 19:27

У меня была такая же проблема, как и вы. Ryzen 1800x

Я предлагаю вам:

Перезапустить SMT - нет необходимости отключать его.

Вернитесь в нормальное текущее ядро ​​для Ubuntu 16.04, которое в настоящее время 4.4.0-93

Отключить все опции «Экономия энергии» Global C-State в BIOS.

Отключить прохладный n тихий вариант.

Увеличьте напряжение вашего SoC до 1,1 для стабильности, это рекомендуется. Как указано в этом видео: https://www.hardocp.com/news/2017/05/01/how_to_stabilize_your_amd_ryzen_memory_cpu_overclocking_attempts

Вышеуказанная рекомендация действительна, если вы подчеркиваете CPU или если вы находитесь на холостом ходу.

Загрузите последние драйверы AMD на веб-сайт AMD для своей карты. Вы также можете попробовать новейшие драйверы с открытым исходным кодом через: «Дополнительные драйверы» в разделе «Программное обеспечение и обновления». Я рекомендую этот вариант в первую очередь.

Прежде чем делать это, просто сбросьте BIOS по умолчанию и проверьте, есть ли более новая версия.

1
ответ дан 5 August 2018 в 04:14

У меня была такая же проблема, как и вы. Ryzen 1800x

Я предлагаю вам:

Перезапустить SMT - нет необходимости отключать его.

Вернитесь в нормальное текущее ядро ​​для Ubuntu 16.04, которое в настоящее время 4.4.0-93

Отключить все опции «Экономия энергии» Global C-State в BIOS.

Отключить прохладный n тихий вариант.

Увеличьте напряжение вашего SoC до 1,1 для стабильности, это рекомендуется. Как указано в этом видео: https://www.hardocp.com/news/2017/05/01/how_to_stabilize_your_amd_ryzen_memory_cpu_overclocking_attempts

Вышеуказанная рекомендация действительна, если вы подчеркиваете CPU или если вы находитесь на холостом ходу.

Загрузите последние драйверы AMD на веб-сайт AMD для своей карты. Вы также можете попробовать новейшие драйверы с открытым исходным кодом через: «Дополнительные драйверы» в разделе «Программное обеспечение и обновления». Я рекомендую этот вариант в первую очередь.

Прежде чем делать это, просто сбросьте BIOS по умолчанию и проверьте, есть ли более новая версия.

1
ответ дан 6 August 2018 в 21:15

У меня была такая же проблема, как и вы. Ryzen 1800x

Я предлагаю вам:

Перезапустить SMT - нет необходимости отключать его.

Вернитесь в нормальное текущее ядро ​​для Ubuntu 16.04, которое в настоящее время 4.4.0-93

Отключить все опции «Экономия энергии» Global C-State в BIOS.

Отключить прохладный n тихий вариант.

Увеличьте напряжение вашего SoC до 1,1 для стабильности, это рекомендуется. Как указано в этом видео: https://www.hardocp.com/news/2017/05/01/how_to_stabilize_your_amd_ryzen_memory_cpu_overclocking_attempts

Вышеуказанная рекомендация действительна, если вы подчеркиваете CPU или если вы находитесь на холостом ходу.

Загрузите последние драйверы AMD на веб-сайт AMD для своей карты. Вы также можете попробовать новейшие драйверы с открытым исходным кодом через: «Дополнительные драйверы» в разделе «Программное обеспечение и обновления». Я рекомендую этот вариант в первую очередь.

Прежде чем делать это, просто сбросьте BIOS по умолчанию и проверьте, есть ли более новая версия.

1
ответ дан 9 August 2018 в 01:45

У меня была такая же проблема, как и вы. Ryzen 1800x

Я предлагаю вам:

Перезапустить SMT - нет необходимости отключать его.

Вернитесь в нормальное текущее ядро ​​для Ubuntu 16.04, которое в настоящее время 4.4.0-93

Отключить все опции «Экономия энергии» Global C-State в BIOS.

Отключить прохладный n тихий вариант.

Увеличьте напряжение вашего SoC до 1,1 для стабильности, это рекомендуется. Как указано в этом видео: https://www.hardocp.com/news/2017/05/01/how_to_stabilize_your_amd_ryzen_memory_cpu_overclocking_attempts

Вышеуказанная рекомендация действительна, если вы подчеркиваете CPU или если вы находитесь на холостом ходу.

Загрузите последние драйверы AMD на веб-сайт AMD для своей карты. Вы также можете попробовать новейшие драйверы с открытым исходным кодом через: «Дополнительные драйверы» в разделе «Программное обеспечение и обновления». Я рекомендую этот вариант в первую очередь.

Прежде чем делать это, просто сбросьте BIOS по умолчанию и проверьте, есть ли более новая версия.

1
ответ дан 14 August 2018 в 19:54
  • 1
    Я отключил SMT умышленно, так как приложения (я), которые я использую, могут пострадать от промаха в кеше и, следовательно, численной точности результатов. Эти сценарии происходят при высокопроизводительных вычислениях при параллельных вычислениях в течение длительного времени. – ankit7540 15 September 2017 в 14:15

У меня была та же проблема ... Что я сделал для решения этой проблемы:

Производительность:

sudo cpufreq-set -r -g performance

Установить при загрузке:

sudo apt-get install cpufrequtils
echo 'GOVERNOR="performance"' | sudo tee /etc/default/cpufrequtils
sudo systemctl disable ondemand
0
ответ дан 7 October 2018 в 23:29

Другие вопросы по тегам:

Похожие вопросы: