Загрузить все страницы на один уровень ниже superSite.com Я:
wget -r -l1 http:/superSite.com
Но эти страницы сохраняются в формате .html. Как я могу их сохранить в формате .txt? (Мне нужно проанализировать часть численного содержания этих страниц, поэтому я не хочу потерять баннеры / изображения)
.html файлы - это текстовые файлы. Расширение файла не имеет абсолютно никакого значения. В конце концов все файлы содержат некоторую форму двоичного кода, и многие файлы содержат текст в конце. HTML-файлы просто состоят из разметки HTML как текста, который затем анализируется браузером, чтобы показать, что описывает HTML.
Если вы хотите просмотреть его как текст, используйте выделенный текстовый редактор и откройте HTML-файлы. Или, из вашего браузера файлов, выберите «Открыть как», «Открыть с» или аналогично.