Как найти дубликаты фотографий?

Что я могу использовать для поиска дубликатов фотографий, в том числе фотографий, которые были изменены?

1
задан 19 July 2014 в 03:41

5 ответов

FSlint

fslint - графическая программа, которая может найти дубликаты файлов любого типа с помощью md5sum. Если изображения не идентичны, они не будут помечены как дубликаты. На рисунке ниже показана куча дубликатов PDF-файлов в каталоге загрузок:

Вы можете изменить расширенные параметры поиска для поиска по типу файла и ограничить себя только изображениями. Это делается путем изменения «дополнительных параметров поиска» в качестве параметров команды find. Например, здесь я ищу файлы *.jpg (по тому же пути, только глядя на папку «Загрузки»:

enter image description here

FSlint

fdupes - это эквивалентный инструмент, основанный на командной строке. Оба доступны в репозиториях.

23
ответ дан 26 May 2018 в 01:21
  • 1
    Обратите внимание, что я сомневаюсь, что эти программы найдут измененные дубликаты. – Vadi 10 October 2012 в 04:51
  • 2
    @ Вади, это другой, более сложный вопрос. Tineye идентифицирует изображение, которое не зависит от метаданных, хэшей и т. д. (оно может идентифицировать похожие изображения), но это онлайн-сервис. Они предоставляют API , но я не знаю о каких-либо приложениях, которые используют это. Другое осложнение заключается в том, что вы не захотите удалять похожие изображения все время, например, если вы редактируете фотографии, но хотите сохранить копии оригиналов. Удаление идентичных дубликатов намного безопаснее. – jozzas 10 October 2012 в 05:03

fdupes

Вы можете использовать инструмент командной строки с именем fdupes для поиска дубликатов файлов (подробнее см. man fdupes). Я не знаю, как найти дубликаты, которые были изменены. Программа, которая сделала это, потребовала бы своего рода интеллектуальный алгоритм, который анализировал содержимое изображения, потому что, когда изображение изменяется, его данные изменяются, поэтому традиционные методы поиска дубликатов не будут работать.

8
ответ дан 26 May 2018 в 01:21
  • 1
    fdupes также пропустят дубликаты в разных каталогах; допустим, у вас есть две копии фотографии в папке с днем ​​рождения /, а другая в семейном файле / ... " fdupes -fr. " пропустит этот дубликат. – lrkwz 12 March 2014 в 04:57

imgSeek

imgSeek может найти дубликаты, а также похожие изображения (чтобы он мог находить измененные фотографии и фотографии с разными именами файлов и метаданных) и даже поиск фотографий на основе эскиза. Он доступен на настольных и серверных версиях.

Я даже не пробовал это сам.

5
ответ дан 26 May 2018 в 01:21
  • 1
    доступно только для Ubuntu 10.04, хотя есть библиотека perl для 12.04 – drevicko 30 March 2014 в 08:06
  • 2
    Версия сервера isk-daemon работает с 12.04, хотя я обнаружил, что мне нужно было установить из источника (pip install в соответствии с страница установки не работала) – drevicko 30 March 2014 в 16:46

dupeGuru Picture Edition работает отлично, и стоит попробовать.

У них есть dupeGuru Picture Edition , dupeguru (новый пакет все-в-одном) или [ f3] (старый пакет для редактирования изображений) можно установить с помощью этих команд:

sudo add-apt-repository ppa:hsoft/ppa
sudo apt-get update
sudo apt-get install dupeguru
3
ответ дан 26 May 2018 в 01:21
  • 1
    Похоже, у dupeGuru теперь нет отдельных изданий. Он работает хорошо, хотя пользовательский интерфейс может быть лучше. Он также доступен в AUR, если вы используете Arch. – user31389 11 November 2016 в 22:17

Visipics

Visipics - это бесплатное приложение Windows для этой функции, но, конечно, отлично работает на Linux, через вино (это лучше, чем geeqie / gqview относительно сортировки дубликатов (результаты geeqie абсолютно "un-sortable")).

Вы можете сказать, что он автоматически выбирает изображения на основе критериев, таких как размер меньшего размера, не сжатый тип, более низкое разрешение (оно не будет делать наоборот, но вам нужно будет сделать это вручную, что было бы не намного лучше, чем делать это на geeqie, за исключением того, что для выбора не требуется удерживать Shift / Ctrl) и даже устанавливать приоритеты в папках (но последний приоритет - приоритет папки).

Вы должны обратить внимание на символические ссылки, хотя - он может «произвольно» выбирать сохранение символической ссылки на файл при удалении фактического файла в виде «копии». Это позор.

1
ответ дан 26 May 2018 в 01:21

Другие вопросы по тегам:

Похожие вопросы: