новой системе с ошибками pcie нужна помощь в отладке

Я получаю некоторые ошибки и надеюсь, что кто-то может помочь отладить.

Запуск материнской платы Aorus Gaming 7 с процессором Threadripper 1950x и Nvidia 1070 с последними драйверами.

Запуск материнской платы Aorus Gaming 7 с процессором Threadripper 1950x и Nvidia 1070. [ ! d1]

Вот ссылка на пасту

system log ------------------------- 8/23/17 9:30 PM -x399 kernel [19510.161819] dpc 0000:00:01.1:pcie010: DPC containment event, status:0x1f00 source:0x0000 8/23/17 9:30 PM -x399 kernel [19510.161833] pcieport 0000:00:01.1: AER: Corrected error received: id=0000 8/23/17 9:30 PM -x399 kernel [19510.161837] pcieport 0000:00:01.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0009(Receiver ID) 8/23/17 9:30 PM -x399 kernel [19510.161840] pcieport 0000:00:01.1: device [1022:1453] error status/mask=00000040/00006000 8/23/17 9:30 PM -x399 kernel [19510.161842] pcieport 0000:00:01.1: [ 6] Bad TLP 8/23/17 9:31 PM -x399 kernel [19539.323943] dpc 0000:00:01.1:pcie010: DPC containment event, status:0x1f00 source:0x0000 8/23/17 9:31 PM -x399 kernel [19539.323957] pcieport 0000:00:01.1: AER: Corrected error received: id=0000 8/23/17 9:31 PM -x399 kernel [19539.323961] pcieport 0000:00:01.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0009(Receiver ID) 8/23/17 9:31 PM -x399 kernel [19539.323964] pcieport 0000:00:01.1: device [1022:1453] error status/mask=00000040/00006000 8/23/17 9:31 PM -x399 kernel [19539.323967] pcieport 0000:00:01.1: [ 6] Bad TLP 8/23/17 9:42 PM -x399 kernel [20194.657679] dpc 0000:00:01.1:pcie010: DPC containment event, status:0x1f00 source:0x0000 8/23/17 9:42 PM -x399 kernel [20194.657692] pcieport 0000:00:01.1: AER: Corrected error received: id=0000 8/23/17 9:42 PM -x399 kernel [20194.657696] pcieport 0000:00:01.1: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0009(Receiver ID) 8/23/17 9:42 PM -x399 kernel [20194.657699] pcieport 0000:00:01.1: device [1022:1453] error status/mask=00000040/00006000 8/23/17 9:42 PM -x399 kernel [20194.657702] pcieport 0000:00:01.1: [ 6] Bad TLP lspci output ------------------------- 00:00.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1450 00:00.2 IOMMU: Advanced Micro Devices, Inc. [AMD] Device 1451 00:01.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 00:01.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 1453 00:01.2 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 1453 00:02.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 00:03.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 00:04.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 00:07.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 00:07.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 1454 00:08.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 00:08.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 1454 00:14.0 SMBus: Advanced Micro Devices, Inc. [AMD] FCH SMBus Controller (rev 59) 00:14.3 ISA bridge: Advanced Micro Devices, Inc. [AMD] FCH LPC Bridge (rev 51) 00:18.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1460 00:18.1 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1461 00:18.2 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1462 00:18.3 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1463 00:18.4 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1464 00:18.5 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1465 00:18.6 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1466 00:18.7 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1467 00:19.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1460 00:19.1 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1461 00:19.2 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1462 00:19.3 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1463 00:19.4 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1464 00:19.5 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1465 00:19.6 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1466 00:19.7 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1467 01:00.0 USB controller: Advanced Micro Devices, Inc. [AMD] Device 43ba (rev 02) 01:00.1 SATA controller: Advanced Micro Devices, Inc. [AMD] Device 43b6 (rev 02) 01:00.2 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 43b1 (rev 02) 02:00.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 43b4 (rev 02) 02:02.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 43b4 (rev 02) 02:03.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 43b4 (rev 02) 02:04.0 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 43b4 (rev 02) 03:00.0 USB controller: ASMedia Technology Inc. Device 1343 04:00.0 Network controller: Intel Corporation Device 24fd (rev 78) 05:00.0 Ethernet controller: Qualcomm Atheros Device e0b1 (rev 10) 07:00.0 Non-Volatile memory controller: Samsung Electronics Co Ltd Device a804 08:00.0 Non-Essential Instrumentation [1300]: Advanced Micro Devices, Inc. [AMD] Device 145a 08:00.2 Encryption controller: Advanced Micro Devices, Inc. [AMD] Device 1456 08:00.3 USB controller: Advanced Micro Devices, Inc. [AMD] Device 145c 09:00.0 Non-Essential Instrumentation [1300]: Advanced Micro Devices, Inc. [AMD] Device 1455 09:00.2 SATA controller: Advanced Micro Devices, Inc. [AMD] FCH SATA Controller [AHCI mode] (rev 51) 09:00.3 Audio device: Advanced Micro Devices, Inc. [AMD] Device 1457 40:00.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1450 40:00.2 IOMMU: Advanced Micro Devices, Inc. [AMD] Device 1451 40:01.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 40:02.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 40:03.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 40:03.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 1453 40:04.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 40:07.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 40:07.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 1454 40:08.0 Host bridge: Advanced Micro Devices, Inc. [AMD] Device 1452 40:08.1 PCI bridge: Advanced Micro Devices, Inc. [AMD] Device 1454 41:00.0 VGA compatible controller: NVIDIA Corporation Device 1b81 (rev a1) 41:00.1 Audio device: NVIDIA Corporation Device 10f0 (rev a1) 42:00.0 Non-Essential Instrumentation [1300]: Advanced Micro Devices, Inc. [AMD] Device 145a 42:00.2 Encryption controller: Advanced Micro Devices, Inc. [AMD] Device 1456 42:00.3 USB controller: Advanced Micro Devices, Inc. [AMD] Device 145c 43:00.0 Non-Essential Instrumentation [1300]: Advanced Micro Devices, Inc. [AMD] Device 1455 43:00.2 SATA controller: Advanced Micro Devices, Inc. [AMD] FCH SATA Controller [AHCI mode] (rev 51)
0
задан 24 August 2017 в 07:49

3 ответа

Кажется, что эта проблема возникает на многих материнских платах с x99 на Intel до x399 на AMD.

Я могу дать хотя бы несколько подробностей, хотя я не могу в полной мере объяснить, что происходит.

Первоначально я думал, что TLP - это проблема власти, но после небольшого исследования я обнаружил, что это действительно обозначает пакеты уровня транзакций (TLP).

Аппаратное обеспечение обычно обнаруживает неисправные пакеты, а ядро ​​Linux сообщает об этом как сообщения.

Опция ядра pci = nommconf отключает конфигурационное пространство PCI с памятью. Вы можете добавить это, отредактировав grub с помощью этой команды.

sudo nano /etc/default/grub

Найти переменную GRUB_CMDLINE_LINUX_DEFAULT и добавить строку ниже в кавычки в конце.

pci=nommconf

Mine выглядела как после этого.

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash pci=nommconf"

Это может быть аппаратная ошибка в устройствах или контроллере или что-то еще.

Хотя это фактическое решение, которое устраняет ошибки и не просто подавляет их, которые без особых технических знаний чувствуют себя как хорошее решение. Хотя лично я буду искать дополнительные обновления BIO для материнских плат вместе с обновлениями ядра и временно удалить это изменение, чтобы узнать, разрешено ли это.

0
ответ дан 22 May 2018 в 19:07

Кажется, что эта проблема возникает на многих материнских платах с x99 на Intel до x399 на AMD.

Я могу дать хотя бы несколько подробностей, хотя я не могу в полной мере объяснить, что происходит.

Первоначально я думал, что TLP - это проблема власти, но после небольшого исследования я обнаружил, что это действительно обозначает пакеты уровня транзакций (TLP).

Аппаратное обеспечение обычно обнаруживает неисправные пакеты, а ядро ​​Linux сообщает об этом как сообщения.

Опция ядра pci = nommconf отключает конфигурационное пространство PCI с памятью. Вы можете добавить это, отредактировав grub с помощью этой команды.

sudo nano /etc/default/grub

Найти переменную GRUB_CMDLINE_LINUX_DEFAULT и добавить строку ниже в кавычки в конце.

pci=nommconf

Mine выглядела как после этого.

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash pci=nommconf"

Это может быть аппаратная ошибка в устройствах или контроллере или что-то еще.

Хотя это фактическое решение, которое устраняет ошибки и не просто подавляет их, которые без особых технических знаний чувствуют себя как хорошее решение. Хотя лично я буду искать дополнительные обновления BIO для материнских плат вместе с обновлениями ядра и временно удалить это изменение, чтобы узнать, разрешено ли это.

0
ответ дан 18 July 2018 в 08:00

Кажется, что эта проблема возникает на многих материнских платах с x99 на Intel до x399 на AMD.

Я могу дать хотя бы несколько подробностей, хотя я не могу в полной мере объяснить, что происходит.

Первоначально я думал, что TLP - это проблема власти, но после небольшого исследования я обнаружил, что это действительно обозначает пакеты уровня транзакций (TLP).

Аппаратное обеспечение обычно обнаруживает неисправные пакеты, а ядро ​​Linux сообщает об этом как сообщения.

Опция ядра pci = nommconf отключает конфигурационное пространство PCI с памятью. Вы можете добавить это, отредактировав grub с помощью этой команды.

sudo nano /etc/default/grub

Найти переменную GRUB_CMDLINE_LINUX_DEFAULT и добавить строку ниже в кавычки в конце.

pci=nommconf

Mine выглядела как после этого.

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash pci=nommconf"

Это может быть аппаратная ошибка в устройствах или контроллере или что-то еще.

Хотя это фактическое решение, которое устраняет ошибки и не просто подавляет их, которые без особых технических знаний чувствуют себя как хорошее решение. Хотя лично я буду искать дополнительные обновления BIO для материнских плат вместе с обновлениями ядра и временно удалить это изменение, чтобы узнать, разрешено ли это.

0
ответ дан 24 July 2018 в 18:57

Другие вопросы по тегам:

Похожие вопросы: