nvidia-smi: Несоответствие версии API ядра

Я устанавливаю cuda-10.0 на свой ubuntu 18.04. система. Я следовал инструкциям на официальном веб-сайте: https://docs.nvidia.com/cuda/cuda-installation-guide-linux/

При запуске образцов, предоставленных с помощью инструментария cuda, для проверки установки, Я получаю следующую ошибку:

/usr/local/cuda-10.0/samples/bin/x86_64/linux/release/deviceQuery Запуск ...

Версия CUDA Device Query (Runtime API) (статическое связывание CUDART)

cudaGetDeviceCount вернул 35 -> Версия драйвера CUDA недостаточна для версии среды выполнения CUDA Результат = FAIL

Я выполнил команду «nvidia-smi» и получил следующий результат:

Не удалось инициализировать NVML: Неизвестная ошибка

Ниже приведены выходные данные команды «dmesg»

[4424407.320909] NVRM: несоответствие API: у клиента версия 440.82, но NVRM: этот модуль ядра имеет версию 440.44. Пожалуйста NVRM: убедитесь, что этот модуль ядра и все драйверы NVIDIA NVRM: компоненты имеют одинаковую версию.

[4426448.420756] NVRM: несоответствие API: у клиента версия 340.108, но NVRM: этот модуль ядра имеет версию 440.44. Пожалуйста NVRM: убедитесь, что этот модуль ядра и все драйверы NVIDIA NVRM: компоненты имеют одинаковую версию.

Вывод команды «cat / proc / driver / nvidia / version»

Версия NVRM: NVIDIA UNIX x86_64 Kernel Module 440.44 Вс, 8 декабря, 03:38:56 UTC 2019

Версия GCC: версия gcc 7.4.0 (Ubuntu 7.4.0-1ubuntu1 ~ 18.04.1)

Я устанавливаю это в удаленной системе, через которую я получаю доступ ssh и AnyDesk (для доступа через графический интерфейс). Есть ли какое-либо решение, которое не потребовало бы от меня перезагрузки моей удаленной системы. Учитывая текущую ситуацию с Corona, для меня может возникнуть проблема, если я перезагружу удаленную систему.

0
задан 6 May 2020 в 17:31

1 ответ

Это происходит при установке драйверов Nvidia из файла .run, загруженного с Сайт Нвидиа.

В Ubuntu есть пакет libnvidia-compute-4xx, который предоставляет некоторую версию библиотеки (440.82 в вашем случае). Для nvidia-smi, представленного в файле .run, требуется немного другая версия (440.44). Решение состоит в том, чтобы удалить libnvidia-compute-4xx: # apt purge libnvidia-compute-4xx.

Все руководства по установке драйверов Nvidia советуют удалять пакеты apt с помощью # apt remove nvidia*, но пакет libnvidia-compute-4xx пропускает этот подстановочный знак, что приводит к несоответствию версии этой библиотеки. проблема.

Я нашел это решение, просмотрев команды в этом блоге: https://blog.csdn.net/weixin_43825748/article/details/112979312.

2
ответ дан 28 January 2021 в 01:27

Другие вопросы по тегам:

Похожие вопросы: