Невозможно использовать графический процессор NVIDIA в Ubuntu 18.04 для задачи компьютерного зрения (GeForce GTX 1060)

Моя машина - ASUS ROG SCAR-GL703GM-EE033T с NVIDIA GeForce GTX1060. Я установил на него Ubuntu 18.04 и необходимое программное обеспечение, необходимое для запуска приложений глубокого обучения с использованием его графического процессора.

Я установил:

  • Cuda 10.0
  • cuDNN 7.5.0
  • tenenflow-gpu 1.13.1

и все выглядит хорошо, как при запуске следующей команды в терминале Python:

tensorflow.test.is_gpu_available()

выводит характеристики карты NVIDIA и «True». Таким образом, установка выглядит правильно.

Однако, когда я запускаю приложение для компьютерного зрения, которое использует pytesseract, я удивляюсь тому, что длительное время выполнения может указывать на то, что GPU на самом деле не используется. Чтобы убедиться, что во время выполнения кода я отображаю в другом терминале команду nvidia-smi, которая выводит: этот снимок экрана команды nvidia-smi, когда код выполняется

. Как вы можете видеть, Драйвер NVIDIA составляет 418,67. Это не тот сайт, который рекомендует NVIDIA ( здесь с 64-битной GeForce / GeForce 10 Series / GeForce GTX1060 / Linux), но я безуспешно пытался установить драйвер 430.67 со следующим сообщением:

nvidia-installer log file '/var/log/nvidia-installer.log'
creation time: Thu Jul 11 17:56:00 2019
installer version: 430.34

PATH: /usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/snap/bin

nvidia-installer command line:
    ./nvidia-installer

Unable to load: nvidia-installer ncurses v6 user interface

Using: nvidia-installer ncurses user interface
-> Detected 12 CPUs online; setting concurrency level to 12.
ERROR: An NVIDIA kernel module 'nvidia-uvm' appears to already be loaded in your kernel.  This may be because it is in use (for example, by an X server, a CUDA program, or the NVIDIA Persistence Daemon), but this may also happen if your kernel was configured without support for module unloading.  Please be sure to exit any programs that may be using the GPU(s) before attempting to upgrade your driver.  If no GPU-based programs are running, you know that your kernel supports module unloading, and you still receive this message, then an error may have occured that has corrupted an NVIDIA kernel module's usage count, for which the simplest remedy is to reboot your computer.
ERROR: Installation has failed.  Please see the file '/var/log/nvidia-installer.log' for details.  You may find suggestions on fixing installation problems in the README available on the Linux driver download page at www.nvidia.com.

Затем я попытался с драйвером 418, который в результате получил тензор потока, распознающий доступный графический процессор, поэтому я продолжил его.

Кроме того, как вы можете видеть на скриншоте, ни один процесс не использует GPU. И, как вы можете видеть на скриншоте, версия Cuda показала 10.1, хотя до установки 10.0, которая выглядела лучше всего, я стерла все следы ранее установленной 10.1. Почему nvidia-smi получит эту версию Cuda 10.1?

Знаете ли вы, с моей текущей конфигурацией / установкой, как сделать GPU постоянно доступным для моего работающего кода? Видите ли вы пропущенную точку в моей установке?

Спасибо за вашу помощь, я постарался предоставить как можно больше деталей!

Тео

2
задан 11 July 2019 в 19:18

0 ответов

Другие вопросы по тегам:

Похожие вопросы: