У меня есть новая установка Ubuntu 18.04.3, и я пытаюсь установить tensorflow-rocm (для AMD GPU) версия 1.14.0.
значение по умолчанию pip3 устанавливает tensorflow-rocm, устанавливает v2.0, но кодовый набор, который я использую, был сделан на 1,14, таким образом, существуют некоторые ошибки, когда я пытаюсь выполнить то же на v2.0 главным образом из-за того, как были перемещены пакеты.
Таким образом, я нашел исходный код tensorflow-rocm v 1.14.0, но когда я пытаюсь создать его, я сталкиваюсь с ошибкой. Я понятия не имею почему. Я проверил, установлен ли rocm в моей системе, и согласно их официальному сайту это установлено.
Ошибка, с которой я сталкиваюсь, следующие:
Starting local Bazel server and connecting to it...
ERROR: Skipping '//tensorflow/tools/pip_package:build_pip_package': error loading package 'tensorflow/tools/pip_package': Encountered error while reading extension file 'rocm/build_defs.bzl': no such package '@local_config_rocm//rocm': Traceback (most recent call last):
File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/rocm_configure.bzl", line 861
_create_local_rocm_repository(repository_ctx)
File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/rocm_configure.bzl", line 682, in _create_local_rocm_repository
make_copy_dir_rule(repository_ctx, name = "rccl-inclu...", <2 more arguments>)
File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 923, in make_copy_dir_rule
_read_dir(repository_ctx, src_dir)
File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 956, in _read_dir
_execute(repository_ctx, ["find", src_dir, ..."], ...)
File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 887, in _execute
auto_configure_fail("\n".join([error_msg.strip() if ... ""]))
File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 324, in auto_configure_fail
fail(("\n%sCuda Configuration Error:%...)))
Cuda Configuration Error: Repository command failed
find: ‘/opt/rocm/rccl/include’: No such file or directory
WARNING: Target pattern parsing failed.
ERROR: error loading package 'tensorflow/tools/pip_package': Encountered error while reading extension file 'rocm/build_defs.bzl': no such package '@local_config_rocm//rocm': Traceback (most recent call last):
File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/rocm_configure.bzl", line 861
_create_local_rocm_repository(repository_ctx)
File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/rocm_configure.bzl", line 682, in _create_local_rocm_repository
make_copy_dir_rule(repository_ctx, name = "rccl-inclu...", <2 more arguments>)
File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 923, in make_copy_dir_rule
_read_dir(repository_ctx, src_dir)
File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 956, in _read_dir
_execute(repository_ctx, ["find", src_dir, ..."], ...)
File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 887, in _execute
auto_configure_fail("\n".join([error_msg.strip() if ... ""]))
File "/home/heyitsabi/tensorflow-upstream/third_party/gpus/cuda_configure.bzl", line 324, in auto_configure_fail
fail(("\n%sCuda Configuration Error:%...)))
Cuda Configuration Error: Repository command failed
find: ‘/opt/rocm/rccl/include’: No such file or directory
INFO: Elapsed time: 2.470s
INFO: 0 processes.
FAILED: Build did NOT complete successfully (0 packages loaded)
currently loading: tensorflow/tools/pip_package
Таким образом, после попытки находить ответы в течение многих часов, я наконец нашел rccl библиотеку (если вот что это значит названо), Если бы это было требованием, упомянутым на руководстве по установке ROCm, я знал бы.. печально или я полностью пропустил это, или это не там.
клонированный это от мерзавца
и затем используемый
sudo ./install.sh -i
Теперь мой tensorflow пакет делается. Если какая-либо другая ошибка возникнет, то она будет, скорее всего, по другим причинам, чем проблема, отправленная выше, таким образом, я совместно использую этот ответ.
btw нормальный./install.sh-i закончился с ошибкой при высказывании этого, не мог сделать необходимые файлы, потому что это не имело доступа, таким образом, я должен был использовать sudo.