Я красный этот ответ и работаю совершенно хороший. Но мне нужна еще некоторая информация относительно этого.
Команда, обеспеченная в решении выше, не может загрузить некоторые файлы PDF, которые не отображены на веб-странице.
Позвольте U1 быть базовым URL и U1/pdf1 и U1/pdf2 быть ссылкой для двух файлов PDF.
Но предположите, скрыта ли вторая ссылка (не доступный от веб-страницы) и может быть доступна, только если ссылка известна.
Команда в решении может способный получить pdf1, и не может способный получить pdf2. Как я могу загрузить pdf2 также с помощью человечности?
PDFs может быть загружен легко командой wget, как упомянуто ниже
#wget -c pdf_url_link_here
и если Вы хотите загрузить все доступные файлы PDF с нескольких веб-сайтов в однажды. любезно сделайте текстовый файл (website_list) с именем веб-сайтов, как я сделал файл и игру ниже - упомянутый сценарий
#wget -c $(for website in $(cat websites_list); do lynx -cache=0 -dump -listonly "$website" | awk '/.pdf$/{print $2}';done)
остроты