Я загрузил и несколько раз устанавливал CUDA, и каждый раз, когда ему не удается передать испытательные образцы deviceQuery и checkBandwidth. Также tensorflow никогда не перечисляет GPU между доступными устройствами, только ЦП.
Мой текущий драйвер Nvidia 384.111, где, поскольку обновленная версия 384.130 всегда генерирует несоответствие библиотеки на nvidia-smi и делает человечность незагрузочной.
Каждый раз я пытаюсь установить CUDA 9.0 с .run файлом, который является единственным способом установить его, не обновляя драйверы Nvidia, он заканчивается с "неполным сообщением установки".. Работает на тестах, всегда отрицательны, со следующим выводом:
Установка CUDA 9.0 .deb с dpkg с веб-сайта Nvidia https://developer.nvidia.com/cuda-downloads? target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1710&target_type=deblocal это также обновляет драйвер Nvidia.
То, как я могу установить CUDA 9.0 для Ubuntu 17.10 с nvidia 384.111, не обновляя до 384,130, так, чтобы это правильно работало на образце, тестирует и позволяет tensorflow-gpu получать доступ к видеокарте?
PS: Каждый раз, когда я говорю, что "это перестало работать", сообщение об ошибке всегда является "НЕИЗВЕСТНОЙ ОШИБКОЙ"
Видеокартой в моей системе является NVIDIA GEFORCE GT 1080
Я тоже прошел через подобную борьбу. После попытки установить CUDA 9.0, 9.1, 9.2 я обнаружил, что для каждого инструментария требуется определенная версия драйвера Nvidia.
Официальное руководство по установке Nvidia CUDA призывает вас удалить драйверы Nvidia. Я думаю, что это неизбежно, если вы хотите выполнить установку на локальный компьютер, если вы не используете Docker + Nvidia Docker.
Это позволит вашему локальному компьютеру сохранять одинаковые драйверы Nvidia, и вы установите свой специальный инструментарий CUDA в разные образы контейнеров.
Это подход, с которым я пошел.