Yinelenen Verileri Kaldırma'nın mimarisini, bileşenlerini ve işlevselliğini tanımlama

Tamamlandı

Contoso da dahil olmak üzere çoğu kuruluş ve işletmenin artan veri hacmini işleme ve depolama ile ilgilenmesi gerekir. Verileri buluta boşaltmanıza ve arşivlemenize olanak sağlayan çözümler olsa da, çoğu durumda bunu şirket içi veri merkezlerinde tutmak gerekir. Bu tür verilerin verimli bir şekilde depolanması için uygun araçlar gerekir. Windows Server kullanırken, bu amaçla Yinelenen Verileri Kaldırma seçeneğiniz vardır.

Yinelenen Verileri Kaldırma nedir?

Yinelenen Verileri Kaldırma, veri bütünlüğünden ödün vermeden verilerdeki yinelemeleri tanımlayan ve kaldıran bir Windows Server rol hizmetidir. Bu, daha fazla veri depolama ve daha az fiziksel disk alanı kullanma hedeflerine ulaşır.

Yinelenen Verileri Kaldırma, disk kullanımını azaltmak için dosyaları tarar, sonra bu dosyaları öbeklere böler ve her öbeğin yalnızca bir kopyasını tutar. Yinelenenleri kaldırma sonrasında dosyalar artık bağımsız veri akışları olarak depolanmaz. Bunun yerine, Yinelenen Verileri Kaldırma, dosyaları ortak bir öbek deposunda depolayan veri bloklarına işaret eden saplamalarla değiştirir. Yinelenenleri kaldırılmış verilere erişme işlemi kullanıcılar ve uygulamalar için tamamen saydamdır.

Birçok durumda, birden çok dosya bellekte önbelleğe alınmış bir öbek paylaşabildiğinden, Veri Çoğaltma genel disk performansını artırır. Bu şekilde, yinelenenleri kaldırılmış dosyaları okurken küçük bir performans etkisini telafi eden daha az okuma işlemi gerçekleştirerek bu dosyalardan veri almak mümkün olabilir. Yinelenen verileri kaldırma, diskte zaten bulunan veriler için geçerli olduğundan disk yazma performansını etkilemez.

The concept of data deduplication, which replaces multiple copies of the same data with pointers to the chunk store, containing a single data instance.

Yinelenen Verileri Kaldırma'nın bileşenleri nelerdir?

Yinelenen Verileri Kaldırma rol hizmeti aşağıdaki bileşenlerden oluşur:

  • Filtre sürücüsü. Bu bileşen, okuma isteklerini istenen dosyanın parçası olan öbeklere yönlendirir. Her birim için bir filtre sürücüsü vardır.
  • Yinelenenleri kaldırma hizmeti. Bu bileşen aşağıdaki işleri yönetir:
    • Yinelenenleri kaldırma ve sıkıştırma. Bu işler dosyaları birimin yinelenen verileri kaldırma ilkesine göre işler. Bir dosya ilk iyileştirmeden sonra, dosya daha sonra değiştirilir ve iyileştirme için yinelenen verileri kaldırma ilkesi eşiğini karşılarsa, dosya yeniden iyileştirilir.
    • Çöp Toplama. Bu iş, birimdeki silinmiş veya değiştirilmiş verileri işler, böylece artık başvurulmamış veri öbekleri temizlenerek boş disk alanı elde edilir. Varsayılan olarak, Çöp Toplama haftalık olarak çalışır, ancak birçok dosyayı sildikten sonra çağırmayı da düşünebilirsiniz.
    • Ovma. Bu iş, veri bütünlüğü sorunlarını tanımlamak ve mümkün olduğunda otomatik olarak çözmek için sağlama toplamı doğrulaması ve meta veri tutarlılığı denetimi gibi dayanıklılık özelliklerine dayanır.

Dekont

Ek doğrulama özellikleri nedeniyle yinelenenleri kaldırma, veri bozulmasının erken işaretlerini algılayabilir ve raporlayabilir.

  • En iyi duruma getirme. Bu iş, birimdeki tüm iyileştirilmiş dosyalarda yinelenenleri kaldırma işlemini tersine çevirir. Bu iş türünü kullanmaya yönelik yaygın senaryolardan bazıları yinelenenleri kaldırılmış verilerle ilgili sorunları gidermeyi veya Yinelenen Verileri Kaldırmayı desteklemeyen başka bir sisteme veri geçişini içerir.

Dekont

Bu işe başlamadan önce, bir veya daha fazla birimdeki yinelenen verileri kaldırma etkinliğini devre dışı bırakmak için Windows PowerShell cmdlet'ini kullanmanız Disable-DedupVolume gerekir.

Dekont

Yinelenen Verileri Kaldırma devre dışı bırakıldıktan sonra birim yinelenenleri kaldırılmış durumda kalır ve var olan yinelenenleri kaldırılmış veriler erişilebilir durumda kalır; ancak sunucu birim için iyileştirme işlerini çalıştırmayı durdurur ve yeni verileri yinelenenleri kaldırmaz. Daha sonra, bir birimde yinelenenleri kaldırılmış mevcut verileri geri almak için iyileştirmeyi kaldırma işini kullanabilirsiniz. Başarılı bir iyileştirme kaldırma işinin sonunda, yinelenen verileri kaldırma meta verileri birimden silinir.

Önemli

İyileştirmeyi kaldırma işini kullanırken, yinelenenleri kaldırılan tüm dosyalar özgün boyutlarına geri döneceği için bu verileri barındıran birimde yeterli boş alan olduğundan emin olun.

The architecture of Data Deduplication, including file driver, deduplication service, its jobs, and the underlying file system chunk store.

Yinelenen Verileri Kaldırma Kapsamı

Yinelenen Verileri Kaldırma, seçili bir birimdeki tüm verileri işler ve aşağıdakiler de dahil olmak üzere birkaç özel durum vardır:

  • Yapılandırdığınız yinelenenleri kaldırma ilkesine uymayen dosyalar.
  • Yinelenenleri kaldırma kapsamından açıkça dışladığınız klasörlerdeki dosyalar.
  • Sistem durumu dosyaları.
  • Alternatif veri akışları.
  • Şifrelenmiş dosyalar.
  • Genişletilmiş özniteliklere sahip dosyalar.
  • 32 KB'tan küçük dosyalar.

Dekont

Windows Server 2019'dan bu yana, Dayanıklı Dosya Sistemi (ReFS), boyutu 64 terabayt (TB) ve boyutu 4 TB'a kadar olan dosyalar için yinelenen verileri kaldırmayı destekler. Ayrıca, disk alanı tasarrufunu en üst düzeye çıkarmak için isteğe bağlı sıkıştırma içeren değişken boyutlu bir öbek deposuna dayanırken, çok iş parçacıklı işlem sonrası mimarisi performans etkisini en düşük düzeyde tutar.