Обновите веб-сайт, который я получил с wget

Существует ли способ обновить веб-сайт, который скопировал для офлайнового просмотра в терминале? Я загрузил everquest.allakhazam.com и был просто любопытен, потому что это регулярно обновляется. Я не хочу должным быть проходить целый процесс загрузки многократно, потому что он требует времени.

Также я очень неопытен с Linux любого вида и супер не испытан в терминале. Поэтому будьте нежны. XD

Заранее спасибо!

0
задан 6 April 2017 в 13:14

3 ответа

wget -N http://www.yoururl.com/, где www.yoururl.com является URL, Вы хотите пересмотреть, должен добиться цели приятно. Эти -N переключатель попросит у сервера измененной в последний раз даты. Если локальный файл будет более новым, то удаленный файл не будет повторно выбран. Однако, если удаленный файл будет более свежим, [то 113] продолжится, выбирая его обычно. Обратите внимание, что Вы захотите запустить wget в том же каталоге, Вы запустили его первоначально.

примечание А по ограничениям заключило в кавычки от man wget:

 If a file is downloaded more than once in the same directory,
           Wget's behavior depends on a few options, including -nc.  In
           certain cases, the local file will be clobbered, or overwritten,
           upon repeated download.  In other cases it will be preserved.

           When running Wget without -N, -nc, -r, or -p, downloading the same
           file in the same directory will result in the original copy of file
           being preserved and the second copy being named file.1.  If that
           file is downloaded yet again, the third copy will be named file.2,
           and so on.  (This is also the behavior with -nd, even if -r or -p
           are in effect.)  When -nc is specified, this behavior is
           suppressed, and Wget will refuse to download newer copies of file.
       Therefore, ""no-clobber"" is actually a misnomer in this
       mode---it's not clobbering that's prevented (as the numeric
       suffixes were already preventing clobbering), but rather the
       multiple version saving that's prevented.

В зависимости от Вашей ситуации Вам, возможно, также понадобится -r (рекурсивный) и-l (глубина уровня) переключатели. Для получения дополнительной информации о многих переключателях и доступных опциях, см. man wget

, Если wget не работает на Вас:

альтернатива упомянула здесь к wget, httrack, который также способен к зеркальному отражению веб-сайта, а также обновлению ее.

httrack доступен первым включение репозитория Вселенной и затем установка или через центр программного обеспечения или из командной строки с Источниками команды sudo apt-get update && sudo apt-get install httrack

wget:

https://источник superuser.com/questions/283481/how-do-i-properly-set-wget-to-download-only-new-files

man wget

http://www.editcorp.com/Personal/Lars_Appel/wget/wget_5.html

httrack:

http://www.linuxcertif.com/man/1/httrack/

2
ответ дан 3 November 2019 в 12:17

От здесь я добрался для использования wget -N site.com. Как когда-либо это кажется, что необходимо загрузить веб-сайт wget -S site.com для проверки даты последнего изменения. Затем проверки-N для наблюдения, когда последняя modifaction дата была и если это более свежо, чем 'старая' версия это обновляет файл.

0
ответ дан 3 November 2019 в 12:17

wget действительно поддерживает это использование --timestamping опция (иначе -N). Это установит время изменения загруженного файла (файлов) к Last-Modified HTTP-заголовок.

Когда Вы попытаетесь загрузить файл (файлы) снова, он отправит If-Not-Modified-Since заголовок, к которому сервер мог бы ответить 304 Not Modified.

При попытке этого http://www.jasny.net Вы видите

$ wget --timestamping http://www.jasny.net
--2017-04-06 22:56:37--  http://www.jasny.net/
Resolving www.jasny.net (www.jasny.net)... 151.101.36.133
Connecting to www.jasny.net (www.jasny.net)|151.101.36.133|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 18433 (18K) [text/html]
Saving to: ‘index.html’

index.html

2017-04-06 22:56:37 (1,15 MB/s) - ‘index.html’ saved [18433/18433]

Чем второй раз

$ wget --timestamping http://www.jasny.net
--2017-04-06 22:56:38--  http://www.jasny.net/
Resolving www.jasny.net (www.jasny.net)... 151.101.36.133
Connecting to www.jasny.net (www.jasny.net)|151.101.36.133|:80... connected.
HTTP request sent, awaiting response... 304 Not Modified
File ‘index.html’ not modified on server. Omitting download.

К сожалению, everquest.allakhazam.com не отправляет a Last-Modified заголовок. Так использование --timestamping не будет работать. Также сервер не отвечает на If-Not-Modified-Since заголовок.

Без сервера, поддерживающего это, нет никакой другой опции, чем загрузить целый веб-сайт каждый раз.

0
ответ дан 3 November 2019 в 12:17

Другие вопросы по тегам:

Похожие вопросы: