SMI Nvidia перестал работать, потому что он не мог связаться с драйвером NVIDIA. Удостоверьтесь, что последний драйвер NVIDIA установлен и выполнение

Я просто установил CUDA в ноутбуке как это:

sudo apt-get install cuda

Как сказанный здесь.

Компиляция wokrs очень хорошо, но когда я пытаюсь работать, я получил следующую проблему: ошибка CUDA в файле cu:128 code=35 (cudaErrorInsufficientDriver) "cudaStreamCreate (и (поток [я]))"

Моя nvcc версия:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

Информация о видеокарте:

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

Я также установил VirtualGL, Nvidia шмеля, primus, freeglut3-dev. После этого.

Когда я пытаюсь выполнить что-то на шмеле, я получил это: optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

драйвер Nvidia, не работающий.

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Похоже, что версия nvidia 375 устанавливается, но я не могу сделать это работами.

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

И некоторая информация о драйвере.

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

Я думаю, что это может быть некоторая проблема версии драйвера:

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

Что я пропускаю?

13
задан 19 June 2017 в 21:42

8 ответов

Я отключил Защищенную загрузку, и она работала довольно прекрасная.

@rod-smith aswered другой вопрос более определенное объяснение, как сделать это, в основном является конфигурацией установки, но он также пишет хорошую статью о том, как сделать это в здесь .

4
ответ дан 23 November 2019 в 03:16

Если Ваш nvidia-smi не удалось связаться, но Вы установили драйвер так много раз, проверить prime-select.

  1. Выполненный prime-select query получить все возможные варианты. Необходимо видеть, по крайней мере, nvidia | intel.
  2. Выбрать prime-select nvidia.
  3. Если это говорит nvidia is already selected, выберите другой, например. prime-select intel, затем переключитесь назад на Nvidia prime-select nvidia
  4. Перезагрузка и проверка nvidia-smi.
9
ответ дан 23 November 2019 в 03:16

Можно хотеть установить cuda инструментарий. Используя следующую команду для установки его.

sudo apt install nvidia-cuda-toolkit

После того как установка сделана, перезагрузите машину. nvidia-smi должен работать.

8
ответ дан 23 November 2019 в 03:16

Для будущих читателей:

Я нахожусь на экземпляре виртуальной машины (Платформа Google Cloud)

и я следую за этой сутью для установки Cuda и CuDNn на моем VM.

Я должен был вручную загрузить CuDNn часть. (Просто помещение его там.)

Теперь, добираясь до ошибки:

У меня была эта проблема, но полный перезапуск экземпляра сделал задание. И полным перезапуском я означаю останавливать экземпляр и снова включать его снова.

Я надеюсь, что это помогает кому-то.

0
ответ дан 23 November 2019 в 03:16

так как я не могу прокомментировать ответ @Rodolfo выше (недостаточно репутации), я добавляю новый ответ.

На моей машине я должен был настроить Защищенную загрузку соответственно к моей ОС. У меня есть системная плата ASUS под управлением Ubuntu 18.04 и попробованный для установки Обновления NVIDIA CUDA 10.1 2 с упакованным драйвером NVIDIA. Я столкнулся с той же проблемой, как описано выше. Как оказалось, Защищенная загрузка была установлена на режим Windows UEFI. Изменение его к Другой ОС зафиксировало его для меня.

2
ответ дан 23 November 2019 в 03:16

Если вы ищете решение для Google Cloud Platform, лучше последовать совету Google и использовать только рекомендуемую версию Ubuntu (на момент написания статьи в мае 2020 г. используйте либо 16.04, либо 18.04). , новая версия 20.04 еще не поддерживается) и следуйте официальным инструкциям по установке поддержки CUDA для Google Cloud VM здесь. Это даст вам правильную версию драйвера, который работает с GCP VM. Затем перезапустите экземпляр с помощью sudo reboot или из консоли.

Если вы устанавливаете CUDA для GCP VM каким-либо другим способом, вы все равно можете добиться успеха, но столкнуться с такими проблемами, как «NVIDIA-SMI не удалось установить связь с драйвером NVIDIA» или какой-либо проблемой зависимости. .

ПС! Я не буду копировать инструкции здесь, так как они могут измениться в любое время, всегда обращайтесь к оригинальному источнику GCP для получения последнего рабочего решения.

2
ответ дан 20 May 2020 в 02:55

Решение Маркуса привело меня к лучшему решению. Так что это связано с Secure Boot, но его не нужно деактивировать.

Чтобы устранить проблему, выполните 3 шага: деактивируйте драйвер Nvidia, выбрав X.Org с помощью инструмента «Дополнительные драйверы», перезагрузите компьютер, затем активируйте драйвер Nvidia, перезагрузитесь и зарегистрируйте ключ в безопасной загрузке.

Обычно, когда вы активируете драйвер Nvidia с помощью инструмента «Дополнительные драйверы», вам будет предложено ввести (новый) пароль для безопасной загрузки. После перезагрузки ПК переходит к настройкам безопасной загрузки, и вам предлагается зарегистрировать новый ключ MOK, который необходимо подтвердить тем же паролем. После этого драйвер получит доступ к карте Nvidia и будет работать.

5
ответ дан 17 June 2020 в 21:02

Многие пользователи упомянули, что не могут установить Nvidia-toolkit, и sudo apt install nvidia-cuda-toolkit не работает. Убедитесь, что вы используете последнюю версию компилятора GCC. Использование более старого компилятора GCC, такого как 4.9, не сможет скомпилировать набор инструментов Nvidia Cuda. Попробуйте установить после использования последнего компилятора GCC, такого как v9.3.

0
ответ дан 24 August 2020 в 01:14

Другие вопросы по тегам:

Похожие вопросы: