Я пытаюсь загрузить весь каталог с этого веб-сайта: https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/
То, что я попробовал:
wget --show-progress -A 'dgm_*.zip' https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/ -P /run/media/usr1/exthdd/dgm
То, что это должно сделать, насколько я понимаю это, является загрузкой все файлы, которые соответствуют имени schmea dgm_. zip*. Однако это возвращается только:
--2020-01-13 14:50:11-- https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/
CA-Zertifikat »/etc/ssl/certs/ca-certificates.crt« wurde geladen
Auflösen des Hostnamens data.geobasis-bb.de (data.geobasis-bb.de)… 194.99.76.18, 194.76.232.112
Verbindungsaufbau zu data.geobasis-bb.de (data.geobasis-bb.de)|194.99.76.18|:443 … verbunden.
HTTP-Anforderung gesendet, auf Antwort wird gewartet … 200 OK
Länge: nicht spezifiziert [text/html]
Wird in »/run/media/lgoldmann/lg_backup_diss/dgm/index.html.tmp.2« gespeichert.
index.html.tmp.2 [ <=> ] 2,65M 4,69MB/s in 0,6s
2020-01-13 14:50:15 (4,69 MB/s) - »/run/media/lgoldmann/lg_backup_diss/dgm/index.html.tmp.2« gespeichert [2778920]
Веб-сайт также предлагает предварительно введенную команду для завихрения, которое работает просто великолепно, но я пытаюсь узнать, что пошло не так, как надо с моей командой wget.
Необходимо использовать -r
опция получить все ссылки на странице.
Это мудро при использовании -r
использовать -np
исключить родительские ссылки и удостовериться wget
не переходит по ссылкам, которые являются одним уровнем или больше.
Также Вы не могли бы хотеть wget
восстановить структуру каталогов сайта локально и просто загрузить файлы, так также используют -nd
опция как так:
wget --show-progress -A 'dgm_*.zip' -r -np -nd https://data.geobasis-bb.de/geobasis/daten/dgm/xyz/ -P /run/media/usr1/exthdd/dgm