Таким образом, у меня есть старая папка с большим количеством материала. Я думаю, что тут и там существуют дубликаты файлов.
Действительно ли это стоит того, чтобы сделать, squashfs копирует сначала? Или должен я просто 7zip это?
Вот мой резервный метод приема:
apt install -y squashfs-tools ;
cd /mnt/BackupDrive
mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs
-keep-as-directory
Вы конкретно упомянули, что у Вас есть дубликаты файлов, таким образом, стоит указать, что в целом, файловая система или форматы сжатия архива не удалят дублирование между дубликатами файлов. Исключением является tar.gz, но даже затем это не будет иметь огромного значения к месту, занятому дубликатами файлов. Если бы дубликаты файлов являются главной причиной, Вы хотите сжаться, было бы лучше сделать что-то, любят, выполняет средство поиска дубликата файла по нему и удаляют или жесткая ссылка вместе любые дубликаты (см. здесь ).
, Если Вы просто должны некогда от сжатия набор вещей, и Вам не будет нужен непрерывный доступ для записи новых файлов в тот архив, является самым легким только архивировать его (можно использовать с 7 zip). Обратите внимание, что на дисках большинства людей в эти дни большинство пространства взято форматами файлов, которые не сожмутся (например, фильмы, фотографии).
Предыдущий ответ, который указывает Squashfs, не делает, дублирующееся обнаружение является неправильным. Squashfs делает явное обнаружение дубликатов файлов и только хранит данные однажды. Это прежде и совершенно отдельное к сжатию.
BTW вывод Mksquashfs скажет Вам сколько дубликатов файлов, там.
Вы также изменяете алгоритм сжатия по умолчанию и размер блока от gzip и 128K. Это достигнет лучшего сжатия.
mksquashfs/mnt/OldSourceDrive/Резервное-копирование-Deduped.squashfs - сохраняют поскольку каталог - аккомпанируют xz-b 1M