Можно ли использовать какую-либо команду для загрузки только HTML / текста на странице и исключения всех изображений и сценариев на странице? Я думаю, что загруженная страница должна отображать только текст, как это делает текстовый браузер lynx.
Я попытался использовать эту команду из этого аналогичного вопроса , но она работает только для некоторых страниц, а не для этого конкретного URL (страницы IMDb), которые возвращают пустой текстовый файл вывода:
curl --user-agent "Chromium" https://www.imdb.com/name/nm0659173 -s | w3m -T text/html >output.txt