Как я могу загрузить PDFs веб-сайта только при помощи корневого доменного имени?

Я использую эту команду:

wget -nd -e robots=off --wait 0.25 -r -A.pdf http://yourWebsite.net/

но я не могу получить PDFs от веб-сайта.

Например, у меня есть корневое доменное имя:

www.example.com

и этот сайт имеет PDFs, ДОКУМЕНТЫ, HTML, и т.д. Я хочу загрузить весь PDFs путем вставления только корневого доменного имени, не точного адреса страницы загрузки.

8
задан 18 May 2014 в 18:59

2 ответа

Следующая команда должна работать:

wget -r -A "*.pdf" "http://yourWebsite.net/"

См. man wget для большего количества информации

4
ответ дан 16 November 2019 в 17:52

В случае, если вышеупомянутое не работает, пробуют это: (замените URL),

lynx -listonly -dump http://www.philipkdickfans.com/resources/journals/pkd-otaku/ | grep pdf | awk '/^[ ]*[1-9][0-9]*\./{sub("^ [^.]*.[ ]*","",$0); print;}' | xargs -L1 -I {} wget {} 

Вы, возможно, должны были бы установить рысь:

sudo apt install lynx
0
ответ дан 23 November 2019 в 05:52

Другие вопросы по тегам:

Похожие вопросы: