Как я правильно устанавливаю CUDA 8 на Azure VM под управлением Ubuntu 14.04 LTS?

Я попытался установить CUDA на трех различных VMs, но был неудачен в том, чтобы заставлять это распознать мой GPU.

Я использую Azure VM (Стандартный NV6) с M60 GPU.

С новым VM я выполняю следующие команды, взятые от этого руководства:

wget https://developer.nvidia.com/compute/cuda/8.0/Prod2/local_installers/cuda-repo-ubuntu1404-8-0-local-ga2_8.0.61-1_amd64-deb

sudo dpkg -i cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64-deb
sudo apt-get update
sudo apt-get install -y cuda

Это, кажется, работает успешный и не указывает, что были любые проблемы. Но когда я работаю

nvidia-smi

Я получаю следующее:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running

Я попробовал 16.04 LTS и различными другими экземплярами GPU. Google говорит мне, что другие используют эти экземпляры Azure GPU с Tensorflow, таким образом, это, кажется, не проблема с видеокартой.

Наконец, я рассмотрел то, что, кажется, каноническое руководство по установке CUDA на Ubuntu, но это перестало работать при выполнении

sudo ./NVIDIA-Linux-x86_64-331.62.run 

enter image description here

Сообщение в файле журнала:

ERROR: Unable to load the 'nvidia-drm' kernel module.

Мой вопрос

Каков самый надежный метод для установки CUDA 8 на Ubuntu 14.04 LTS?

Есть ли какие-либо специальные precauations, которые я должен взять при выполнении CUDA на VM?

Править: Дополнительная информация

uname -a возвраты

Linux 2017-02-21-josh-gpu 4.4.0-64-generic #85~14.04.1-Ubuntu SMP Mon Feb 20 12:10:54 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux

lsmod возвраты

Module                  Size  Used by
drm_kms_helper        151552  0
drm                   360448  1 drm_kms_helper
syscopyarea            16384  1 drm_kms_helper
sysfillrect            16384  1 drm_kms_helper
sysimgblt              16384  1 drm_kms_helper
fb_sys_fops            16384  1 drm_kms_helper
udf                    90112  0
crc_itu_t              16384  1 udf
dm_crypt               28672  0
joydev                 20480  0
hid_generic            16384  0
hid_hyperv             16384  0
hid                   118784  2 hid_hyperv,hid_generic
hyperv_keyboard        16384  0
hv_balloon             24576  0
input_leds             16384  0
serio_raw              16384  0
hv_netvsc              40960  0
hv_storvsc             20480  2
hv_utils               28672  2
scsi_transport_fc      65536  1 hv_storvsc
crct10dif_pclmul       16384  0
crc32_pclmul           16384  0
ghash_clmulni_intel    16384  0
hyperv_fb              20480  1
aesni_intel           167936  0
aes_x86_64             20480  1 aesni_intel
lrw                    16384  1 aesni_intel
gf128mul               16384  1 lrw
glue_helper            16384  1 aesni_intel
ablk_helper            16384  1 aesni_intel
cryptd                 20480  3 ghash_clmulni_intel,aesni_intel,ablk_helper
psmouse               126976  0
hv_vmbus               90112  7 hv_balloon,hyperv_keyboard,hv_netvsc,hid_hyperv,hv_utils,hyperv_fb,hv_storvsc
floppy                 73728  0
3
задан 13 April 2017 в 15:23

1 ответ

Чиновник документация Azure указывает:

В настоящее время, Linux поддержка GPU только доступна на Azure NC VMs рабочий Сервер Ubuntu 16.04 LTS. +

я не уверен, почему они даже позволяют Вам создать экземпляры GPU с 14,04 установленными, но надо надеяться это поможет распространить слово.

После создания новых 16,04 экземпляров я сделал следующее:

Первый, я должен был удалить/поместить в черный список драйверы Nouveau, которые прибывают предварительно установленные в Ubuntu 16.04. Они не совместимы с драйверами NVIDIA, которые мы пытаемся установить и вызовем ошибки позже, если мы не удаляем их.

 sudo nano /etc/modprobe.d/blacklist.conf

У основания файла добавляют следующие записи:

 amd76x_edac #this might not be required for x86 32 bit users.
 blacklist vga16fb
 blacklist nouveau
 blacklist rivafb
 blacklist nvidiafb
 blacklist rivatv

Перезагрузка VM с sudo reboot

я загрузил драйверы непосредственно с Microsoft, но можно занять место с предпочтительным источником:

wget -O NVIDIA-Linux-x86_64-384.73-grid.run https://go.microsoft.com/fwlink/?linkid=849941  

chmod +x NVIDIA-Linux-x86_64-384.73-grid.run

sudo ./NVIDIA-Linux-x86_64-384.73-grid.run

я просто нажал через выбранные опции значения по умолчанию в runfile.

Проверяют установку драйвера путем выполнения nvidia-smi

Установка Инструментарий CUDA 8

CUDA_REPO_PKG=cuda-repo-ubuntu1604_8.0.44-1_amd64.deb

wget -O /tmp/${CUDA_REPO_PKG} http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/${CUDA_REPO_PKG} 

sudo dpkg -i /tmp/${CUDA_REPO_PKG}

rm -f /tmp/${CUDA_REPO_PKG}

sudo apt-get update

sudo apt-get install cuda-drivers
2
ответ дан 1 December 2019 в 16:55

Другие вопросы по тегам:

Похожие вопросы: