Wget с веб-страницы в html для многих текстовых файлов

Загрузить все страницы на один уровень ниже superSite.com Я:

wget -r -l1 http:/superSite.com

Но эти страницы сохраняются в формате .html. Как я могу их сохранить в формате .txt? (Мне нужно проанализировать часть численного содержания этих страниц, поэтому я не хочу потерять баннеры / изображения)

1
задан 25 July 2015 в 02:13

1 ответ

.html файлы - это текстовые файлы. Расширение файла не имеет абсолютно никакого значения. В конце концов все файлы содержат некоторую форму двоичного кода, и многие файлы содержат текст в конце. HTML-файлы просто состоят из разметки HTML как текста, который затем анализируется браузером, чтобы показать, что описывает HTML.

Если вы хотите просмотреть его как текст, используйте выделенный текстовый редактор и откройте HTML-файлы. Или, из вашего браузера файлов, выберите «Открыть как», «Открыть с» или аналогично.

1
ответ дан 23 May 2018 в 18:47

Другие вопросы по тегам:

Похожие вопросы: