Когда я пытался зеркально отразить веб-сайт с файлами Java, XML-файлами, файлами ActionScript, и т.д., wget только, кажется, загружает обычно известные файлы, такие как xml, txt, и т.д.
Это, кажется, не загружает .java, .as файлы.
Вот моя команда:
wget --no-parent --user=USERNAME--password=PASSWD-e robots=off --header "CUSTOM HEADERS" "http://URL" -r --timeout=25
Кажется, нет ничего плохого с ним мне. После того как загрузка закончена, ни один из .java или .as файлов не там.
Также существует ли способ перескочить через каждый каталог, который имеет строку в нем? Например, если каталог называют "backup3r98238943r3jrefi", я могу пропустить его для того, чтобы иметь слово "резервное копирование" в нем? Я хочу пропустить любой каталог, расположенный в любом dir/subdir на сайте с ключевым словом в нем.
Можно использовать --reject
или --exclude-directories
для пропуска вещей:
wget ... --reject '*backup*' ...
wget ... --exclude-directories '*backup*' ...