Существует ли программа/приложение для Ubuntu, которая позволяет загружать несколько изображений со страницы? Чтобы быть точным, я хочу получить некоторые изображения от сайта
http://www.cookingforengineers.com/
Некоторые recepies являются бесконечным списком рисунков, и я хочу получить их всех вместе.
Я попробовал DownThemAll Firefox, но 1. Я мог только получить миниатюры и 2. Я использую Chrome теперь.
Несмотря на то, чтобы быть незнакомым с кодированием, это должно все еще сделать то, что Вы хотите. Конечно, Вы - больше, чем приветствие для ожидания другого пользователя для регистрации решения GUI.
Просто скопируйте и вставьте следующий код в текстовый документ и сохраните его как dlimgs.py
. Я рекомендую делать новую папку в Вашем корневом каталоге названной bin
и сохранение его там.
#!/ust/bin/env python
import sys,urllib2,re
def main(url):
page = getpage(url)
start = page.find('articlebody')
page = page[start:]
lines = page.split('\n')
for l in lines:
if ('<img' in l) and ('.jpg' in l):
matches = re.search(".*<img.*'(.*\.jpg)'.*",l)
img = matches.group(1)
name = img[img.rfind('/')+1:]
print 'Downloading: '+name
img = getpage(img)
with open(name,'w') as f:
f.write(img)
def getpage(url):
user_agent = 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:31.0) Gecko/20100101 Firefox/31.0'
headers = {'User-Agent':user_agent}
req = urllib2.Request(url, None, headers);
response = urllib2.urlopen(req)
return response.read()
if __name__ == '__main__':
main(sys.argv[1])
Затем откройте терминал с Ctrl+Alt+T и сделайте следующее:
cd
команда (Пример: cd ~/bin
)python dlimgs.py <url>
Это загрузит все изображения и сохранит их в ~/bin
папка. Обратите внимание, что это было записано специально для веб-сайта, который Вы предоставили в вопросе и так пропустите изображения заголовка в верхней части страницы. Это, вероятно, бросит ошибки для других веб-сайтов. Еще одно примечание, это перезапишет любые изображения с теми же именами файлов в ~/bin
dir так быть осторожным.