Я хочу получить содержимое PDF-файла, который обновляется ежедневно. Я хотел бы установить это как задание cron и заставить его извлекать И датировать имя файла PDF (ежедневно), чтобы у меня всегда была копия каждого дня PDF VERSION-COPY.
Итак:
Это должно позволить мне сохранять копию ежедневного содержимого PDF с указанием имени папки / файла для индексации и поиска.
Это вообще возможно с помощью wget? Обратная связь приветствуется!
Редактируйте задания cron с помощью crontab -e
. Добавьте эту команду:
0 3 * * * /usr/bin/wget --output-file="/pathtofolder/wget.log" --output-document="/pathtofolder/Document$(date +\%Y-\%m-\%d-\%H-\%M).pdf" http://example.com/pathtopdf
Это будет выполняться в 3:00 каждый день.
Этот конфиг лучше для fcron:
%daily,mail(no) * * /usr/bin/wget --output-file="/pathtofolder/wget.log" --output-document="/pathtofolder/Document$(date +\%Y-\%m-\%d-\%H-\%M).pdf" http://example.com/pathtopdf
Лучшая альтернатива - сделать скрипт и поместить его в /etc/cron.daily/ и сделать его исполняемым
#!/usr/bin/env bash
wget --output-file="/pathtofolder/wget.log" --output-document="/pathtofolder/Document$(date +%Y-%m-%d-%H-%M).pdf" http://example.com/pathtopdf
Это создаст файлы в указанной папке, например «Document2019-04-24-20-36.pdf»