Загрузите ВЕСЬ PDF с данного URL

Я красный этот ответ и работаю совершенно хороший. Но мне нужна еще некоторая информация относительно этого.

Команда, обеспеченная в решении выше, не может загрузить некоторые файлы PDF, которые не отображены на веб-странице.

Позвольте U1 быть базовым URL и U1/pdf1 и U1/pdf2 быть ссылкой для двух файлов PDF.

Но предположите, скрыта ли вторая ссылка (не доступный от веб-страницы) и может быть доступна, только если ссылка известна.

Команда в решении может способный получить pdf1, и не может способный получить pdf2. Как я могу загрузить pdf2 также с помощью человечности?

1
задан 25 January 2018 в 12:36

1 ответ

PDFs может быть загружен легко командой wget, как упомянуто ниже

#wget -c pdf_url_link_here 

и если Вы хотите загрузить все доступные файлы PDF с нескольких веб-сайтов в однажды. любезно сделайте текстовый файл (website_list) с именем веб-сайтов, как я сделал файл и игру ниже - упомянутый сценарий

#wget -c $(for website in $(cat websites_list); do     lynx -cache=0 -dump -listonly "$website" | awk '/.pdf$/{print $2}';done) 
остроты
0
ответ дан 8 December 2019 в 02:36

Другие вопросы по тегам:

Похожие вопросы: