Ошибка NVIDIA CUDA при использовании другой карты для отображения

Я установил CUDA для своей видеокарты NVIDIA около месяца назад, на чистой установке Ubuntu 16.04. Я использовал самый последний файл запуска для установки, и, насколько я могу судить, следуют инструкциям письма, за исключением того, что изменения в PATH и LD_LIBRARY_PATH, указанные в инструкциях, неверны. Установка была успешной и даже удалось запустить без вмешательства в X - у моей машины также есть графическая карта Intel, которая использовалась для отображения.

Сегодня утром программы CUDA перестали работать, а nvidia-smi сообщил, что он не может связаться с графической картой, поскольку он неактивен. Я исправил это, поставив дисплей на графическую карту NVIDIA с очевидным результатом - экран не может обновляться, пока работает ядро ​​CUDA. Теперь, когда я переключу дисплей обратно на графическую карту Intel, я получаю новую ошибку: nvidia-smi reports:

NVIDIA-SMI couldn't find libnvidia-ml.so library in your system. Please make sure that the NVIDIA Display Driver is properly installed and present in your system. Please also try adding directory that contains libnvidia-ml.so to your system PATH.

Каталог, содержащий libnvidia-ml.so, находится в системе PATH. Эта ошибка, я должен подчеркнуть, исчезает, когда карта NVIDIA установлена ​​в качестве моей основной карты.

Всякий раз, когда я запускаю программу CUDA любого типа с установленным в Intel дисплеем, я получаю ошибку 35: «CUDA версии драйвера недостаточно для версии исполнения CUDA ». Это невозможно: «cat / proc / driver / nvidia / version» дает версию драйвера 375.39, и, как я понимаю, это совместимо с CUDA 8.

Используя

LD_PRELOAD=/usr/lib/nvidia-375/libnvidia-ml.so nvidia-smi

исправляет первую ошибку, но не вторую.

Я неохотно переустанавливаю CUDA, не зная, что здесь не так. Я бы предпочел не заниматься этим раз в месяц. Любые предложения?

Обновление: Когда я начинаю с X, работающего на карте NVIDIA, и выполняю следующую последовательность команд (после загрузки пакета CUDA .deb):

sudo apt-get purge nvidia-* sudo apt-get install nvidia-375 sudo apt-get install cuda

it работает. Но я думаю, это связано с тем, что я каким-то образом обманул карту NVIDIA, думая, что она работает X, без фактического запуска X; когда я перезагружаюсь, проблема возникает (если я запускаю X на карте NVIDIA, все в порядке, но я не могу запускать программы CUDA, не замораживая экран, а если я запускаю X на карте Intel, функциональность CUDA не работает).

0
задан 26 May 2017 в 22:21

2 ответа

Ubuntu 16.04, cuda-8.0 и Nvidia 375 работают просто отлично, но есть много путающих более старых направлений. Начните с сайта Intel, установки Intel Ubuntu и используйте файл deb как самый системный метод установки. Компиляторы по умолчанию gcc5 отлично подходят для 16.04.

Сначала установите драйверы Ubuntu Nvidia, прежде чем начинать с любых установок cuda. Включите Canonical Partners под обновлением программного обеспечения, кнопку «Настройки» / другое программное обеспечение. И проприетарные драйверы под вкладкой Ubuntu Software. Обновите индекс пакета, а затем в разделе Дополнительные драйверы установите драйвер видео Nvidia (протестирован). Пропустите любое предложение драйверов Nvidia из пакета cuda.

Загрузите пакет Intel cuda 8.0 deb и используйте dpkg -i для его установки. Обратите внимание на расположение каталога cuda-8.0, вы будете использовать его для изменения PATH и LD_LIBRARY_PATH, добавления / bin для PATH и / lib64 для библиотек. Скопируйте каталог образцов из места cuda-8.0 в место, которое вы можете записать, чтобы вы могли создавать в нем вещи. Используйте apt-get для установки cuda и cuda-toolkit-8-0, они принесут много других пакетов cuda. Вот так, make-файлы в каталогах образцов должны запускаться (если конкретный образец не нуждается в дополнительных библиотеках, никто не делает этого, поэтому сначала попробуйте его).

Теперь драйверы Nvidia находятся в движении, я установил 367 и обновился до 375. У меня не было проблем с этим, но я нашел 367 подключенных к образцам cuda, так что будьте осторожны, если попробуете для очистки старых каталогов. Библиотеки Nvidia находятся в нормальных / usr / lib / nvidia-375 местах, поэтому для них не нужны пути.

Взгляните на установку nuidia Intel Ubuntu и решите проблему, подобную вашей. Зависит от аппаратного обеспечения.

0
ответ дан 18 July 2018 в 13:00

Ubuntu 16.04, cuda-8.0 и Nvidia 375 работают просто отлично, но есть много путающих более старых направлений. Начните с сайта Intel, установки Intel Ubuntu и используйте файл deb как самый системный метод установки. Компиляторы по умолчанию gcc5 отлично подходят для 16.04.

Сначала установите драйверы Ubuntu Nvidia, прежде чем начинать с любых установок cuda. Включите Canonical Partners под обновлением программного обеспечения, кнопку «Настройки» / другое программное обеспечение. И проприетарные драйверы под вкладкой Ubuntu Software. Обновите индекс пакета, а затем в разделе Дополнительные драйверы установите драйвер видео Nvidia (протестирован). Пропустите любое предложение драйверов Nvidia из пакета cuda.

Загрузите пакет Intel cuda 8.0 deb и используйте dpkg -i для его установки. Обратите внимание на расположение каталога cuda-8.0, вы будете использовать его для изменения PATH и LD_LIBRARY_PATH, добавления / bin для PATH и / lib64 для библиотек. Скопируйте каталог образцов из места cuda-8.0 в место, которое вы можете записать, чтобы вы могли создавать в нем вещи. Используйте apt-get для установки cuda и cuda-toolkit-8-0, они принесут много других пакетов cuda. Вот так, make-файлы в каталогах образцов должны запускаться (если конкретный образец не нуждается в дополнительных библиотеках, никто не делает этого, поэтому сначала попробуйте его).

Теперь драйверы Nvidia находятся в движении, я установил 367 и обновился до 375. У меня не было проблем с этим, но я нашел 367 подключенных к образцам cuda, так что будьте осторожны, если попробуете для очистки старых каталогов. Библиотеки Nvidia находятся в нормальных / usr / lib / nvidia-375 местах, поэтому для них не нужны пути.

Взгляните на установку nuidia Intel Ubuntu и решите проблему, подобную вашей. Зависит от аппаратного обеспечения.

0
ответ дан 24 July 2018 в 20:05
  • 1
    Спасибо за подробные шаги, но это фактически не улучшило ситуацию. Я удалил CUDA и выполнил ваши инструкции, и у меня осталась одна и та же проблема - она ​​работает нормально, пока NVIDIA GPU является тем, который используется для X, но не для того, чтобы поместить X на графический процессор Intel. – Reese 26 May 2017 в 20:33

Другие вопросы по тегам:

Похожие вопросы: