Скачать HTML / текст только с веб-страницы (исключая изображения и JavaScript)

Можно ли использовать какую-либо команду для загрузки только HTML / текста на странице и исключения всех изображений и сценариев на странице? Я думаю, что загруженная страница должна отображать только текст, как это делает текстовый браузер lynx.

Я попытался использовать эту команду из этого аналогичного вопроса , но она работает только для некоторых страниц, а не для этого конкретного URL (страницы IMDb), которые возвращают пустой текстовый файл вывода:

curl --user-agent "Chromium" https://www.imdb.com/name/nm0659173 -s | w3m -T text/html >output.txt
0
задан 18 June 2019 в 07:45

0 ответов

Другие вопросы по тегам:

Похожие вопросы: