Свободные решения по оптимизации хранения резервных копий

Исследование области

Среди свободных решений по оптимизации хранения резервных копий (сжатия, дедупликации), были выделены следующие решения:

    • высокие требования к оперативной памяти. Порты плохого качества на ОС Linux и FreeBSD
  • SDFS (OpenDedup) - написан на Java.
  • VDO - Недавно приобретен RedHat и открыт исходный код.
  • btrfs - Файловая система. Встроеные механизмы дедупликации блоков, мало кто может их полноценно реализовать.
  • QuadStor VTL - мало сведений. Маленькое community.
    • Заброшен автором, не обновляется с 2013 года.
  • ddumbfs
    • Не обновляется с 2013 года.
    • не обновляется с 2013 года.
  • Epitome (OpenBSD) - Заброшен

Таким образом было принято решение проверить наиболее актуальные из решений, а именно VDO, SDFS, btrfs, zfs, QuadStor VTL

Тестирование

Производилось тестирование путем сохранения образов виртуальных машин без использования стороннего ПО резервного копирования. Образ виртуальной машины записывался на хранилище.

KVM Backup

Windows 10 - Snapshot backup

Задача Virtial Data Optimizer (NFS)OpenDedup 
(NFS)
StoreOnce
(NFS)
btrfs bees (NFS)
1st full backup. Reduction:29%  37% 52%  16%
2nd full backup. Reduction:93%  97% 99% 35%
3nd full backup. Reduction:100%  75%  100%  -
4th full backup. Reduction:99% 100%  100%  -
5th full backup. Reduction:100% 100% 99%  -
Total 1 : 6,3 1 : 3,5 1 : 10 1 : 3,4

Результат

Из свободных продуктов VDO показывает самую эффективную дедупликацию образов виртуальных машин, на ровне с низким потреблением ресурсов сервера.

Bareos backup

Использовалось свободное ПО резервного копирования - Bareos. Производилось резервное копирование с использованием агента.

WIndows 10 - bareos-fd (agent)

Задача Virtial Data Optimizer (NFS)OpenDedup  (bareos-sd)StoreOnce over (NFS)QuadStor VTL over (iSCSI)
1st full backup. Reduction:27% 37% 61% 34%
2nd full backup. Reduction:25% 79% 88% 46%
3nd full backup. Reduction:26% 52 % 88% -
Total 1 : 1,4 1 : 3,1 1 : 5 1 : 1,6

Результат

Формат записи файлов резервной копии bareos не выровненный. Поэтому системы дедупликации без плавающего курсора и без изменяемого размера блока плохо справляются со своей задачей. Но несмотря на этот факт коэфициент дедупликации у OpenDedup достаточно неплохой.

У родительской ветки bareos - Bacula в версии enterprise (платная подписка) реализован функционал выравнивания блоков, для более лучшей дедупликации.

Commvault Backup

Резервное копирование с использованием платного программного продукта - Commvault.

Windows 10 - Commvault iDataAgent

Задача Virtial Data OptimizerOpenDedupStoreOnce
1st full backup. Reduction:1% 39% 61%
2nd full backup. Reduction:27% 68% 93%
3nd full backup. Reduction:60% 78% 95%
4th full backup. Reduction:27% 78% 95%
5th full backup. Reduction:37% 73% 96%
Total 1 : 1,27 1 : 3 1 : 8,6

Результат

Формат записи не оптимизирован для дедупликаторов с фиксированым блоком. При этом OpenDedup показывает неплохие показатели сжатия. Лучшие результаты у StoreOnce, так как он  рассчитан именно на такой сценарий использования.

Оценка финансовых показателей

Попробуем понять когда стоит использовать дедупликацию, а когда дешевле просто купить дополнительную емкость.

Сравним стоимость хранения на различных системах:

Effective Storage (TB)Суммарная стоимостьСтоимость $/tbСтоимость Р/гб
СХД EMC PowerVault ME4012 78 $28328 $363 23,05 ₽
СХД HPE MSA 1050 (16x12TB)151,2 $56532 $373 23,73 ₽
Storeonce 3640 180 $51202 $284 18,06 ₽
Cloud storage (3 years) 150 $112261 $748 47,51 ₽

Оценим затраты ПО дедупликации данных, с учетом ресурсов сервера и стоимости лицензий

Расход RAMРасход CPUСтоимость HardwareСтоимость SoftwareСтоимость ИтогоКэфициент уплотения емкостиСтоимость (в $/ТБ)Стоимость (в Р/ГБ)
StoreOnce VSA (up to 150 tb effective) 57 8 $5421 $204117 $209537 80% $1396 88,67 ₽
OpenDedup SDFS (up to 150 tb effective) 38 16 $6474 0 $6474 67% $43,16 2,74 ₽
Virtual Data Optimizer VDO (up to 100 backend storage)20 0 $1154 0 $1153 33% $7,69 0,49 ₽

Таким образом если использовать дедупликатор поверх систем хранения данных стоимость хранения будет следующей:

StoreOce VSAДедупликация SDFSДедупликация VDOStoreOnce 3640
Добавляет стоимости: $1396 $43 $7 н/д
Экономит емкости: 80% 67% 33% н/д
Модель СХД Стоимость СХД
СХД DELL PowerVault ME4012 (12x8TB)$363 $1469 $164 $249 н/д
СХД HPE MSA 1050 (16x12TB) $373 $1471 $167 $256 н/д
Cloud storage (3 years) $748 $1546 $292 $506 н/д
Storeonce 3640 $284

В процентном соотношении экономия стоимости хранения следующая:

SO VSASDFSVDO
СХД EMC PowerVault ME4012 -305% 55% 31%
СХД HPE MSA 1050 (16x12TB)-294% 55% 31%
Cloud storage (3 years) -107% 61% 32%

Результаты

Таким образом можно порекомендовать использовать VDO в качестве дедупликации выровненных данных, например образов виртуальных машин, не прошедших через ПО резервного копирования. Данный продукт слабо нагружает сервер и обладает высокой стабильностью работы.

SDFS написан на Java, поэтому требования к ресурсам выше, стабильность ниже. На некоторых сценариях использования позволяет добиться достаточно неплохой экономии. Рекомендуется использовать совместно со свободным ПО РК.