wget-команда для загрузки больше чем одной страницы

делает кто-либо знает точную команду, которую я должен использовать для загрузки части веб-сайта, который состоит больше чем из одной страницы (с wget). Пример:

Я хочу загрузить определенную страницу, которая существует в рамках форума. Существует статья, имеющая дело с "stderr" в рамках этого форума.

Адрес: "https://forum.ubuntuusers.de/topic/stderr-umleitungen /" И "https://forum.ubuntuusers.de/topic/stderr-umleitungen/2 /" поскольку это состоит из двух страниц.

То, что я хочу сделать, загрузить обе страницы одной командой, но не весь форум. Как я иду о вводе корректной команды?

Система: Linux/Lubuntu 16.04.2 LTS, 64 бита

0
задан 25 February 2017 в 21:05

1 ответ

wget -Ek https://example.com/foo/bar/{,2}

последний бит {,2} расширение фигурной скобки , который дает wget команду загружать:

https://example.com/foo/bar/
https://example.com/foo/bar/2

Для загрузки страниц 3 - 6 используйте любую из этих команд:

wget -Ek https://example.com/foo/bar/{3,4,5,6}
wget -Ek https://example.com/foo/bar/{3..6}

И существуют несколько действительно полезные wget опции :-E и-k.

-E: Если файл типа "текст/HTML" загружается, и URL не заканчивается regexp '\. [Гд] [Tt] [мм] [Ll]?', эта опция заставит суффикс ".html" быть добавленным к локальному имени файла.

К: После того, как загрузка завершена, преобразуйте ссылки в документе, чтобы сделать их подходящими для локального просмотра (т.е. преобразовать относительные ссылки на абсолютные ссылки).

прочитайте wget страницу справочника и руководство для получения дополнительной информации.

0
ответ дан 3 November 2019 в 17:07

Другие вопросы по тегам:

Похожие вопросы: