Веб-паук для Ubuntu

Я использую apt-cache show <package> в течение 7 лет или около того, но здесь могут быть более сложные методы, с тех пор, например, вы можете попробовать aptitude.

1
задан 10 January 2014 в 20:42

3 ответа

Дайте httrack (CLI) или webhttrack (веб-интерфейс) выстрел, он находится в репозитории вселенной. Я не уверен, что вы описываете функцию поиска, но она предлагает множество легко настраиваемых параметров.

http://packages.ubuntu.com/de/oneiric/webhttrack

HTTrack Website Copier - бесплатное ПО Offline Browser (GNU GPL)

9
ответ дан 25 May 2018 в 15:44

Вы можете попробовать http ripper.

Вот некоторые функции, размещенные на веб-сайте:

Free Software (GPL 3)
Generic (works with almost every website)
Runs on GNU/Linux and Windows
Nearly undetectable / blockable by servers
Built with python and pygtk

Screen-shot [!d4 ]

Посмотрите учебник от разработчика httpripper:

httpripper.ogg.

Ссылка для скачивания:

httpripper.ogg.

Он работал для меня под Ubuntu 11.10 x64

3
ответ дан 25 May 2018 в 15:44

В CPAN Perl имеются соответствующие модули. Вам просто нужно немного скриптов perl.

В частности, посмотрите модуль WWW: Mechanize в модуле WWW: Mechanize.

-1
ответ дан 25 May 2018 в 15:44

Другие вопросы по тегам:

Похожие вопросы: