Что я могу использовать для поиска дубликатов фотографий, в том числе фотографий, которые были изменены?
fslint - графическая программа, которая может найти дубликаты файлов любого типа с помощью md5sum. Если изображения не идентичны, они не будут помечены как дубликаты. На рисунке ниже показана куча дубликатов PDF-файлов в каталоге загрузок:
Вы можете изменить расширенные параметры поиска для поиска по типу файла и ограничить себя только изображениями. Это делается путем изменения «дополнительных параметров поиска» в качестве параметров команды find. Например, здесь я ищу файлы *.jpg (по тому же пути, только глядя на папку «Загрузки»:
fdupes - это эквивалентный инструмент, основанный на командной строке. Оба доступны в репозиториях.
Вы можете использовать инструмент командной строки с именем fdupes для поиска дубликатов файлов (подробнее см. man fdupes). Я не знаю, как найти дубликаты, которые были изменены. Программа, которая сделала это, потребовала бы своего рода интеллектуальный алгоритм, который анализировал содержимое изображения, потому что, когда изображение изменяется, его данные изменяются, поэтому традиционные методы поиска дубликатов не будут работать.
imgSeek может найти дубликаты, а также похожие изображения (чтобы он мог находить измененные фотографии и фотографии с разными именами файлов и метаданных) и даже поиск фотографий на основе эскиза. Он доступен на настольных и серверных версиях.
Я даже не пробовал это сам.
dupeGuru Picture Edition работает отлично, и стоит попробовать.
У них есть dupeGuru Picture Edition , dupeguru (новый пакет все-в-одном) или [ f3] (старый пакет для редактирования изображений) можно установить с помощью этих команд:
sudo add-apt-repository ppa:hsoft/ppa
sudo apt-get update
sudo apt-get install dupeguru
Visipics - это бесплатное приложение Windows для этой функции, но, конечно, отлично работает на Linux, через вино (это лучше, чем geeqie / gqview относительно сортировки дубликатов (результаты geeqie абсолютно "un-sortable")).
Вы можете сказать, что он автоматически выбирает изображения на основе критериев, таких как размер меньшего размера, не сжатый тип, более низкое разрешение (оно не будет делать наоборот, но вам нужно будет сделать это вручную, что было бы не намного лучше, чем делать это на geeqie, за исключением того, что для выбора не требуется удерживать Shift / Ctrl) и даже устанавливать приоритеты в папках (но последний приоритет - приоритет папки).
Вы должны обратить внимание на символические ссылки, хотя - он может «произвольно» выбирать сохранение символической ссылки на файл при удалении фактического файла в виде «копии». Это позор.