TLDR
Я пытаюсь получить резервную копию nvidia-smi
, которая работала нормально, пока я не установил cuda-toolkit. Удаление cuda-toolkit не помогло. Как восстановить вывод nvidia-smi
?
NVIDIA-SMI не удалось установить связь с NVIDIA. Водитель. Убедитесь, что установлена последняя версия драйвера NVIDIA и Бег.
У меня есть GEFORCE RTX 2070 на моем ноутбуке с Ubuntu 18.04, и я успешно установил драйвер из официального файла запуска NVIDIA-Linux-x86_64-470.63.01.run
. Вот вывод nvidia-smi
из этой установки:
Затем я установил cuda-toolkit из официального файла запуска cuda_11.4.2_470.57.02_linux.run
, убедившись, для отмены установки драйвера. Вот окно терминала сразу после завершения установки:
Сразу после этого, когда я выполнил nvidia-smi
, я получил:
NVIDIA-SMI не удалось, поскольку не удалось связаться с NVIDIA Водитель. Убедитесь, что установлена последняя версия драйвера NVIDIA и Бег.
Поскольку установка cuda-toolkit предположительно «сломала» nvidia-smi
, я удалил cuda-toolkit (запустив cuda-uninstaller
, найденный в /usr/ local/cuda-11.4/bin
, как указано в сгенерированном тексте после установки).
К сожалению, это не помогает, и nvidia-smi
по-прежнему поврежден. Причина, по которой я устанавливаю из официальных файлов запуска NVIDIA, заключается в том, что ранее у меня были проблемы с установкой драйвера из репозиториев Ubuntu, но я мог заставить его работать с официальным драйвером. Поэтому я решил попробовать то же самое с cuda-toolkit.
Как мне вернуть nvidia-smi
?
какой nvidia-smi
: /usr/bin/nvidia-smi
mokutil --sb-state
: SecureBoot отключен
nvidia-settings
:
ОШИБКА: драйвер NVIDIA не загружен
ОШИБКА: невозможно загрузить информацию из любой доступной системы
ls /sys/firmware/efi/
:
config_table efivars esrt fw_platform_size fw_vendor среда выполнения runtime-map systab vars
lspci -k | grep -EA2 'VGA|3D'
:00:02.0 VGA-совместимый контроллер: Intel Corporation CometLake-H GT2 [Графика UHD] (версия 05)
Подсистема: Micro-Star International Co., Ltd. [MSI] Устройство 12ae
Используемый драйвер ядра: i91501:00.0 VGA-совместимый контроллер: NVIDIA Corporation TU106M [GeForce RTX 2070 Mobile / > Max-Q Refresh] (rev a1)
Подсистема: Micro-Star International Co., Ltd. [MSI] Device 12ae
Модули ядра: nvidiafb, nouveau
cat /etc/modprobe.d/blacklist-nouveau.conf
:новый черный список
черный список vga16b
черный список rivafb
черный список nvidiafb
черный список rivatv
черный список amd76_edac
псевдоним nouveau off
псевдоним lbm-nouveau off
options nouveau modeset=0
cat /proc/version
:
Linux версии 5.4.0-84-generic (buildd@lcy01-amd64-007) (версия gcc 7.5.0 (Ubuntu 7.5.0- 3ubuntu1~18.04)) #94~18.04.1-Ubuntu SMP Чт, 26 августа, 23:17:46 UTC 2021
sudo lshw -c video
: (дисплей NVIDIA «невостребован»,но так должно быть)
статус dkms
: нет выводаlsmod | grep nvidia
:
i2c_nvidia_gpu 16384 0
echo $XDG_SESSION_TYPE
: x11
где nvidia
:
nvidia: /usr/lib/x86_64-linux-gnu/nvidia /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-470.63.01/nvidia
grep nvidia /etc/modprobe .d/* /lib/modprobe.d/*
:/etc/modprobe.d/blacklist-framebuffer.conf:blacklist nvidiafb
/etc/modprobe.d/blacklist-nouveau.conf:черный список nvidiafb
/etc/modprobe.d/nvidia-installer-disable-nouveau.conf:# сгенерировано nvidia-installer
/lib/modprobe.d/nvidia-runtimepm.conf:options nvidia "NVreg_DynamicPowerManagement=0x02"