Я думаю об использовании функций btrfs для дедупликации и сжатия моего хранилища ...
Мой вопрос: эффективен ли он?
Я имею в виду, эффективно ли он одновременно выполняет дедупликацию и сжатие?!
Я использую 64-битную версию Ubuntu 14.04. Кроме того, я планирую использовать его с raid0 поверх томов, оптимизированных для EBS, в среде облачных вычислений ...
Tks! Тьяго
Если Вы пишете о дедупликации с bedup
утилита, то ответ: дедупликация и сжатие являются абсолютно независимыми процессами .
Во время дедупликации, никакое содержание файла не переписывается (только метаданные), таким образом, нет никакой возможности сжать данные.
И я на 99% уверен, то состояние сжатия очевидно для bedup
, так как это почти невозможно для получения исходного, сжатого содержания файла из btrfs.
, С другой стороны, повторное сжатие старых данных происходит при дефрагментации диска (например, с btrfs filesystem defragment -r -v -clzo /
). Это будет в настоящее время повреждать дедупликацию файлов.
В настоящее время нет никакой дедупликации онлайн. Это запланировано, но еще не реализовано. Существует экспериментальный patchset (www.mail-archive.com/linux-btrfs%40vger.kernel.org/msg32862.html), если Вы хотите попробовать его.
Только от личного опыта нет никакого значимого хита производительности сжатия онлайн на hasswell i5 4460 при записи в ssd, и 3 HDD сразу (один из HDD форматирован с xfs, таким образом, никакое сжатие не выполнялось. Дефрагментация/пересжатие 3 диска btrfs дают загрузке ЦП приблизительно 50%, но система все еще чувствует себя гладкой. Это с lzo и сжатием, не вызванным (если Вы не вызываете его, btrfs прекращает пытаться сжать файл, если это несжимаемо + lzo, быстрее, чем zlib). Предел является все еще скоростью диска, даже с ssd.