Я использую apt-cache show <package> в течение 7 лет или около того, но здесь могут быть более сложные методы, с тех пор, например, вы можете попробовать aptitude.
Дайте httrack (CLI) или webhttrack (веб-интерфейс) выстрел, он находится в репозитории вселенной. Я не уверен, что вы описываете функцию поиска, но она предлагает множество легко настраиваемых параметров.
http://packages.ubuntu.com/de/oneiric/webhttrack
HTTrack Website Copier - бесплатное ПО Offline Browser (GNU GPL)
Вы можете попробовать http ripper.
Вот некоторые функции, размещенные на веб-сайте:
Free Software (GPL 3)
Generic (works with almost every website)
Runs on GNU/Linux and Windows
Nearly undetectable / blockable by servers
Built with python and pygtk
Screen-shot [!d4 ]
Посмотрите учебник от разработчика httpripper:
httpripper.ogg.Ссылка для скачивания:
httpripper.ogg.Он работал для меня под Ubuntu 11.10 x64
В CPAN Perl имеются соответствующие модули. Вам просто нужно немного скриптов perl.
В частности, посмотрите модуль WWW: Mechanize в модуле WWW: Mechanize.