Ubuntu 18.04.3: Нуждаюсь в помощи с ROCm tensorflow: ошибка Сборки

У меня есть новая установка Ubuntu 18.04.3, и я пытаюсь установить tensorflow-rocm (для AMD GPU) версия 1.14.0.

значение по умолчанию pip3 устанавливает tensorflow-rocm, устанавливает v2.0, но кодовый набор, который я использую, был сделан на 1,14, таким образом, существуют некоторые ошибки, когда я пытаюсь выполнить то же на v2.0 главным образом из-за того, как были перемещены пакеты.

Таким образом, я нашел исходный код tensorflow-rocm v 1.14.0, но когда я пытаюсь создать его, я сталкиваюсь с ошибкой. Я понятия не имею почему. Я проверил, установлен ли rocm в моей системе, и согласно их официальному сайту это установлено.

Ошибка, с которой я сталкиваюсь, следующие:

Starting local Bazel server and connecting to it...
ERROR: Skipping '//tensorflow/tools/pip_package:build_pip_package': error loading package 'tensorflow/tools/pip_package': Encountered error while reading extension file 'rocm/build_defs.bzl': no such package '@local_config_rocm//rocm': Traceback (most recent call last):
    File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/rocm_configure.bzl", line 861
        _create_local_rocm_repository(repository_ctx)
    File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/rocm_configure.bzl", line 682, in _create_local_rocm_repository
        make_copy_dir_rule(repository_ctx, name = "rccl-inclu...", <2 more arguments>)
    File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 923, in make_copy_dir_rule
        _read_dir(repository_ctx, src_dir)
    File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 956, in _read_dir
        _execute(repository_ctx, ["find", src_dir, ..."], ...)
    File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 887, in _execute
        auto_configure_fail("\n".join([error_msg.strip() if ... ""]))
    File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 324, in auto_configure_fail
        fail(("\n%sCuda Configuration Error:%...)))

Cuda Configuration Error: Repository command failed
find: ‘/opt/rocm/rccl/include’: No such file or directory

WARNING: Target pattern parsing failed.
ERROR: error loading package 'tensorflow/tools/pip_package': Encountered error while reading extension file 'rocm/build_defs.bzl': no such package '@local_config_rocm//rocm': Traceback (most recent call last):
    File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/rocm_configure.bzl", line 861
        _create_local_rocm_repository(repository_ctx)
    File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/rocm_configure.bzl", line 682, in _create_local_rocm_repository
        make_copy_dir_rule(repository_ctx, name = "rccl-inclu...", <2 more arguments>)
    File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 923, in make_copy_dir_rule
        _read_dir(repository_ctx, src_dir)
    File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 956, in _read_dir
        _execute(repository_ctx, ["find", src_dir, ..."], ...)
    File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 887, in _execute
        auto_configure_fail("\n".join([error_msg.strip() if ... ""]))
    File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 324, in auto_configure_fail
        fail(("\n%sCuda Configuration Error:%...)))

Cuda Configuration Error: Repository command failed
find: ‘/opt/rocm/rccl/include’: No such file or directory

INFO: Elapsed time: 2.470s
INFO: 0 processes.
FAILED: Build did NOT complete successfully (0 packages loaded)
    currently loading: tensorflow/tools/pip_package

Исходный сайт tensorflow-rcom 1.14.0

0
задан 20 October 2019 в 08:06

1 ответ

Таким образом, после попытки находить ответы в течение многих часов, я наконец нашел rccl библиотеку (если вот что это значит названо), Если бы это было требованием, упомянутым на руководстве по установке ROCm, я знал бы.. печально или я полностью пропустил это, или это не там.

клонированный это от мерзавца

и затем используемый

sudo ./install.sh -i

Теперь мой tensorflow пакет делается. Если какая-либо другая ошибка возникнет, то она будет, скорее всего, по другим причинам, чем проблема, отправленная выше, таким образом, я совместно использую этот ответ.

btw нормальный./install.sh-i закончился с ошибкой при высказывании этого, не мог сделать необходимые файлы, потому что это не имело доступа, таким образом, я должен был использовать sudo.

Пакет RCCL

0
ответ дан 22 December 2019 в 00:17

Другие вопросы по тегам:

Похожие вопросы: