Как я могу загрузить PDF-файлы веб-сайта, используя только имя домена root?

Question 1

Я использую эту команду:

wget -nd -e robots=off --wait 0.25 -r -A.pdf http://yourWebsite.net/

, но я не могу получить PDF-файлы с сайта.

Например, у меня есть корневое доменное имя:

www.example.com

, и на этом сайте есть файлы PDF, DOC, HTML и т. д. Я хочу загрузить все PDF-файлы, вставив только имя домена root, а не точный адрес страницы загрузки.

Question 2

В случае, если выше не работает, попробуйте это: (замените URL)

lynx -listonly -dump http://www.philipkdickfans.com/resources/journals/pkd-otaku/ | grep pdf | awk '/^[ ]*[1-9][0-9]*\./{sub("^ [^.]*.[ ]*","",$0); print;}' | xargs -L1 -I {} wget {}

вам может потребоваться установить lynx:

sudo apt install lynx

Eduard Florinescu · Answer 1 · 24 May 2018 в 07:38

В случае, если выше не работает, попробуйте это: (замените URL)

lynx -listonly -dump http://www.philipkdickfans.com/resources/journals/pkd-otaku/ | grep pdf | awk '/^[ ]*[1-9][0-9]*\./{sub("^ [^.]*.[ ]*","",$0); print;}' | xargs -L1 -I {} wget {}

вам может потребоваться установить lynx:

sudo apt install lynx

Как я могу загрузить PDF-файлы веб-сайта, используя только имя домена root?

1 ответ

Другие вопросы по тегам:

Похожие вопросы: