nvidia-smi перестала работать после установки cuda-toolkit

TLDR

Я пытаюсь получить резервную копию nvidia-smi, которая работала нормально, пока я не установил cuda-toolkit. Удаление cuda-toolkit не помогло. Как восстановить вывод nvidia-smi?

NVIDIA-SMI не удалось установить связь с NVIDIA. Водитель. Убедитесь, что установлена ​​последняя версия драйвера NVIDIA и Бег.


Подробнее

У меня есть GEFORCE RTX 2070 на моем ноутбуке с Ubuntu 18.04, и я успешно установил драйвер из официального файла запуска NVIDIA-Linux-x86_64-470.63.01.run. Вот вывод nvidia-smi из этой установки:

enter image description here

Затем я установил cuda-toolkit из официального файла запуска cuda_11.4.2_470.57.02_linux.run, убедившись, для отмены установки драйвера. Вот окно терминала сразу после завершения установки:

enter image description here

Сразу после этого, когда я выполнил nvidia-smi, я получил:

NVIDIA-SMI не удалось, поскольку не удалось связаться с NVIDIA Водитель. Убедитесь, что установлена ​​последняя версия драйвера NVIDIA и Бег.

Поскольку установка cuda-toolkit предположительно «сломала» nvidia-smi, я удалил cuda-toolkit (запустив cuda-uninstaller, найденный в /usr/ local/cuda-11.4/bin, как указано в сгенерированном тексте после установки).

К сожалению, это не помогает, и nvidia-smi по-прежнему поврежден. Причина, по которой я устанавливаю из официальных файлов запуска NVIDIA, заключается в том, что ранее у меня были проблемы с установкой драйвера из репозиториев Ubuntu, но я мог заставить его работать с официальным драйвером. Поэтому я решил попробовать то же самое с cuda-toolkit.

Как мне вернуть nvidia-smi?

Выводы некоторых команд, если они нужны

  • какой nvidia-smi : /usr/bin/nvidia-smi
  • mokutil --sb-state : SecureBoot отключен
  • nvidia-settings :
    • ОШИБКА: драйвер NVIDIA не загружен
    • ОШИБКА: невозможно загрузить информацию из любой доступной системы
  • ls /sys/firmware/efi/ :
    • config_table efivars esrt fw_platform_size fw_vendor среда выполнения runtime-map systab vars
  • lspci -k | grep -EA2 'VGA|3D' :

00:02.0 VGA-совместимый контроллер: Intel Corporation CometLake-H GT2 [Графика UHD] (версия 05)
Подсистема: Micro-Star International Co., Ltd. [MSI] Устройство 12ae
Используемый драйвер ядра: i915

01:00.0 VGA-совместимый контроллер: NVIDIA Corporation TU106M [GeForce RTX 2070 Mobile / > Max-Q Refresh] (rev a1)
Подсистема: Micro-Star International Co., Ltd. [MSI] Device 12ae
Модули ядра: nvidiafb, nouveau

  • cat /etc/modprobe.d/blacklist-nouveau.conf :

новый черный список
черный список vga16b
черный список rivafb
черный список nvidiafb
черный список rivatv
черный список amd76_edac
псевдоним nouveau off
псевдоним lbm-nouveau off
options nouveau modeset=0

  • cat /proc/version :

    • Linux версии 5.4.0-84-generic (buildd@lcy01-amd64-007) (версия gcc 7.5.0 (Ubuntu 7.5.0- 3ubuntu1~18.04)) #94~18.04.1-Ubuntu SMP Чт, 26 августа, 23:17:46 UTC 2021
  • sudo lshw -c video : (дисплей NVIDIA «невостребован»,но так должно быть)

enter image description here

  • статус dkms : нет вывода
  • lsmod | grep nvidia :
    • i2c_nvidia_gpu 16384 0
  • echo $XDG_SESSION_TYPE : x11
  • где nvidia :
    • nvidia: /usr/lib/x86_64-linux-gnu/nvidia /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-470.63.01/nvidia
  • grep nvidia /etc/modprobe .d/* /lib/modprobe.d/*:

/etc/modprobe.d/blacklist-framebuffer.conf:blacklist nvidiafb
/etc/modprobe.d/blacklist-nouveau.conf:черный список nvidiafb
/etc/modprobe.d/nvidia-installer-disable-nouveau.conf:# сгенерировано nvidia-installer
/lib/modprobe.d/nvidia-runtimepm.conf:options nvidia "NVreg_DynamicPowerManagement=0x02"

Сообщения/вопросы, которые я уже рассматривал:

0
задан 17 September 2021 в 20:38

0 ответов

Другие вопросы по тегам:

Похожие вопросы: