Как установить tensorflow для NVIDIA GPU RTX 2070 СУПЕР на Ubuntu 18.04

Я пытался установить Tensorflow на свой новый 2070 RTX Супер. Я следовал следующим инструкциям:

шаги

проверьте, что система имеет cuda-способный gpu

загрузите и установите Nvidia cuda инструментарий и cudnn

установите переменные окружения

проверьте установку

#

Если у Вас есть предыдущая установка, удаляют его сначала.

sudo apt-get purge nvidia*
sudo apt remove nvidia-*
sudo rm /etc/apt/sources.list.d/cuda*
sudo apt-get autoremove && sudo apt-get autoclean
sudo rm -rf /usr/local/cuda*

проверить Ваш gpu - cuda, включают проверку

lspci | grep -i nvidia

компилятор gcc требуется для разработки с помощью cuda инструментария. для проверки версии установки gcc входят

gcc --version

системное обновление

sudo apt-get update
sudo apt-get upgrade

установите другие пакеты импорта

sudo apt-get install g++ freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev

сначала получите драйвер репозитория PPA

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
echo "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64 /" | sudo tee /etc/apt/sources.list.d/cuda.list

# установка CUDA-10.0

sudo apt-get -o Dpkg::Options::="--force-overwrite" install cuda-10-0 cuda-drivers

установите свои пути

echo 'export PATH=/usr/local/cuda-10.0/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
sudo ldconfig

cuDNN v7.5 установки

для загрузки cuDNN, необходимо быть regeistered здесь https://developer.nvidia.com/developer-program/signup

затем загрузите форму cuDNN v7.5 https://developer.nvidia.com/cudnn

CUDNN_TAR_FILE="cudnn-10.0-linux-x64-v7.5.0.56"
wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/v7.5.0.56/prod/10.0_20190219/cudnn-10.0-linux-x64-v7.5.0.56.tgz
tar -xzvf ${CUDNN_TAR_FILE}

скопируйте следующие файлы в cuda каталог инструментария.

sudo cp -P cuda/include/cudnn.h /usr/local/cuda-10.0/include
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda-10.0/lib64/
sudo chmod a+r /usr/local/cuda-10.0/lib64/libcudnn*

Наконец, для проверки установки проверить

nvidia-smi
nvcc -V

установите Tensorflow (платформа машинного обучения с открытым исходным кодом)

Я выбираю версию 1.13.1, потому что это стабильно и совместимо с инструментарием CUDA 10.0 и cuDNN 7.5

установка pip3 - пользователь tensorflow-gpu == 1.13.1

Однако, когда, когда я ввожу nvidia-smi Я получаю следующее: Не удалось инициализировать NVML: несоответствие версии драйвера/библиотеки

Я также пытался загрузить последний драйвер (440.35) NVIDIA, но я не имел никакого успеха, выполняющего .run файл. Это продолжало давать мне сообщение, говоря, что "Обеспеченные распределением предварительно устанавливают отказавший сценарий!"

Любая справка значительно ценилась бы!

1
задан 11 November 2019 в 02:44

2 ответа

Я смог к наконец установленному Tensorflow в моем GeForce RTX 2070 Супер со следующими установками:

Ubuntu 18.04

CuDNN 7.5

CUDA 10.0

Версия драйвера 430.50 NVIDIA

Затем я просто сделал pip3 install --user tensorflow-gpu==1.13.1 использование среды Conda.

1
ответ дан 22 December 2019 в 00:01

Этот графический процессор поддерживает cuda 10.2, который поддерживается версией драйвера >=440.
Возможно, сама Ubuntu 18.04 не поддерживает эту версию драйвера или ее нет в официальном репозитории. Вот почему всегда лучше устанавливать драйвер напрямую с сайта nvidia; используя скрипт *.run.
С вашими текущими настройками производительность будет неоптимальной.
В таком случае рекомендую скачать python wheels необходимых пакетов; или используя образы Docker со всем предустановленным программным обеспечением.

0
ответ дан 11 August 2020 в 14:09

Другие вопросы по тегам:

Похожие вопросы: