Я попытался установить CUDA на трех различных VMs, но был неудачен в том, чтобы заставлять это распознать мой GPU.
Я использую Azure VM (Стандартный NV6) с M60 GPU.
С новым VM я выполняю следующие команды, взятые от этого руководства:
wget https://developer.nvidia.com/compute/cuda/8.0/Prod2/local_installers/cuda-repo-ubuntu1404-8-0-local-ga2_8.0.61-1_amd64-deb
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64-deb
sudo apt-get update
sudo apt-get install -y cuda
Это, кажется, работает успешный и не указывает, что были любые проблемы. Но когда я работаю
nvidia-smi
Я получаю следующее:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running
Я попробовал 16.04 LTS и различными другими экземплярами GPU. Google говорит мне, что другие используют эти экземпляры Azure GPU с Tensorflow, таким образом, это, кажется, не проблема с видеокартой.
Наконец, я рассмотрел то, что, кажется, каноническое руководство по установке CUDA на Ubuntu, но это перестало работать при выполнении
sudo ./NVIDIA-Linux-x86_64-331.62.run
Сообщение в файле журнала:
ERROR: Unable to load the 'nvidia-drm' kernel module.
Каков самый надежный метод для установки CUDA 8 на Ubuntu 14.04 LTS?
Есть ли какие-либо специальные precauations, которые я должен взять при выполнении CUDA на VM?
uname -a
возвраты
Linux 2017-02-21-josh-gpu 4.4.0-64-generic #85~14.04.1-Ubuntu SMP Mon Feb 20 12:10:54 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux
lsmod
возвраты
Module Size Used by
drm_kms_helper 151552 0
drm 360448 1 drm_kms_helper
syscopyarea 16384 1 drm_kms_helper
sysfillrect 16384 1 drm_kms_helper
sysimgblt 16384 1 drm_kms_helper
fb_sys_fops 16384 1 drm_kms_helper
udf 90112 0
crc_itu_t 16384 1 udf
dm_crypt 28672 0
joydev 20480 0
hid_generic 16384 0
hid_hyperv 16384 0
hid 118784 2 hid_hyperv,hid_generic
hyperv_keyboard 16384 0
hv_balloon 24576 0
input_leds 16384 0
serio_raw 16384 0
hv_netvsc 40960 0
hv_storvsc 20480 2
hv_utils 28672 2
scsi_transport_fc 65536 1 hv_storvsc
crct10dif_pclmul 16384 0
crc32_pclmul 16384 0
ghash_clmulni_intel 16384 0
hyperv_fb 20480 1
aesni_intel 167936 0
aes_x86_64 20480 1 aesni_intel
lrw 16384 1 aesni_intel
gf128mul 16384 1 lrw
glue_helper 16384 1 aesni_intel
ablk_helper 16384 1 aesni_intel
cryptd 20480 3 ghash_clmulni_intel,aesni_intel,ablk_helper
psmouse 126976 0
hv_vmbus 90112 7 hv_balloon,hyperv_keyboard,hv_netvsc,hid_hyperv,hv_utils,hyperv_fb,hv_storvsc
floppy 73728 0
Чиновник документация Azure указывает:
В настоящее время, Linux поддержка GPU только доступна на Azure NC VMs рабочий Сервер Ubuntu 16.04 LTS. +
я не уверен, почему они даже позволяют Вам создать экземпляры GPU с 14,04 установленными, но надо надеяться это поможет распространить слово.
После создания новых 16,04 экземпляров я сделал следующее:
Первый, я должен был удалить/поместить в черный список драйверы Nouveau, которые прибывают предварительно установленные в Ubuntu 16.04. Они не совместимы с драйверами NVIDIA, которые мы пытаемся установить и вызовем ошибки позже, если мы не удаляем их.
sudo nano /etc/modprobe.d/blacklist.conf
У основания файла добавляют следующие записи:
amd76x_edac #this might not be required for x86 32 bit users.
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
Перезагрузка VM с sudo reboot
я загрузил драйверы непосредственно с Microsoft, но можно занять место с предпочтительным источником:
wget -O NVIDIA-Linux-x86_64-384.73-grid.run https://go.microsoft.com/fwlink/?linkid=849941
chmod +x NVIDIA-Linux-x86_64-384.73-grid.run
sudo ./NVIDIA-Linux-x86_64-384.73-grid.run
я просто нажал через выбранные опции значения по умолчанию в runfile.
Проверяют установку драйвера путем выполнения nvidia-smi
Установка Инструментарий CUDA 8
CUDA_REPO_PKG=cuda-repo-ubuntu1604_8.0.44-1_amd64.deb
wget -O /tmp/${CUDA_REPO_PKG} http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/${CUDA_REPO_PKG}
sudo dpkg -i /tmp/${CUDA_REPO_PKG}
rm -f /tmp/${CUDA_REPO_PKG}
sudo apt-get update
sudo apt-get install cuda-drivers