Basit anlamda “De-duplication”, verilerin sabit (fixed) ya da değişken (variable) büyüklüklerde parçalara bölünerek yedeklenmesi işlemidir. Aynı parçaların (identical segments) tek kopyası tutulur ve gerçek veri için linkler oluşturulur. De-duplication Block (byte/bit) seviyesinde yapıldığı takdirde daha iyi sonuçlar alınabilir.
Amaç: Büyük miktarlardaki verilerin daha küçük alanlarda depolanmasını sağlamak.
Faydaları:
Ne kadar Faydalı?
Örnek Hesaplama:
Yedeklenmek istenen toplam veri : 2 TB
Veri tipi : %50 kullanıcı dosyaları / %50 veri tabanları
Günlük ortalama değişim : %10
Yedekleme politikası : Her gün tüm veriler
Yedeklerin saklanma süresi : 90 gün
Diske yedeklemede kullanılan 1 TB alanın maliyeti : 1.000 USD
Normal bir yedekleme yaklaşımı ile bu kurumda yedekleme için 180 TB’lık alana ihtiyaç duyulmaktadır. Tekilleştirme kullanıldığında ise 38’e 1 oranında tekilleştirme yapılarak, yaklaşık 5 TB’lik bir alanda 90 günlük veri saklanabilir. Bu hesapla tam 175 TB’lık bir alandan tasarruf edilir; bu da yaklaşık 175.000 USD’lık bir yatırım tasarrufuna karşılık gelmektedir.
Nasıl çalışıyor?
Yedeklenecek olan veri parçalara ayrılarak önceden yedeklenmiş veri ile karşılaştırılır. Bu karşılaştırma sonucunda aynı olan veriler için referans oluşturulur, farklı olan veriler diske yazılır.
Çalışma Şekilleri:
Genelde 3 noktada de-duplication yapılmaktadır: