Yinelenen Verileri Kaldırmayı Anlama

Bu belgede Yinelenen Verileri Kaldırma'nın nasıl çalıştığı açıklanmaktadır.

Yinelenen Verileri Kaldırma nasıl çalışır?

Windows Server'da Yinelenen Verileri Kaldırma aşağıdaki iki ilkeyle oluşturulmuştur:

  1. İyileştirme, diske yazma işlemlerine yol vermemelidir Yinelenen Verileri Kaldırma, bir işlem sonrası modeli kullanarak verileri iyileştirir. Tüm veriler diske iyileştirilmemiş olarak yazılır ve daha sonra Yinelenen Verileri Kaldırma tarafından iyileştirilir.

  2. İyileştirme erişim semantiğini değiştirmemelidir İyileştirilmiş bir birimdeki verilere erişen kullanıcılar ve uygulamalar, eriştikleri dosyaların yinelenenlerinin kaldırıldığından tamamen habersizdirler.

Bir birim için etkinleştirildikten sonra Yinelenen Verileri Kaldırma arka planda şu şekilde çalışır:

  • Bu birimdeki dosyalar arasında yinelenen desenleri belirleyin.
  • Bu parçaları veya öbekleri, öbeklerin benzersiz bir kopyasına işaret eden yeniden ayrıştırma noktaları olarak adlandırılan özel işaretçilerle sorunsuz bir şekilde taşıyın.

Bu, aşağıdaki dört adımda gerçekleşir:

  1. İyileştirme ilkesini karşılayan dosyalar için dosya sistemini tarayın.
    Dosya sistemini tarama
  2. Dosyaları değişken boyutlu öbeklere bölün.
    Dosyaları öbeklere ayırma
  3. Benzersiz öbekleri tanımlama.
    Benzersiz öbekleri tanımlama
  4. Öbekleri öbek deposuna yerleştirin ve isteğe bağlı olarak sıkıştırın.
    Öbek Deposuna Taşı
  5. Artık iyileştirilmiş dosyaların özgün dosya akışını öbek deposuna bir yeniden ayrıştırma noktasıyla değiştirin.
    Dosya akışını yeniden ayrıştırma noktasıyla değiştirme

Optimize edilmiş dosyalar okunduğunda, dosya sistemi yeniden ayrıştırma noktası olan dosyaları Veri Tekilleştirme dosya sistemi filtresine (Dedup.sys) gönderir. Filtre, okuma işlemini öbek deposundaki bu dosya için akışı oluşturan uygun öbeklere yönlendirir. Yinelenenleri kaldırılmış dosyaların aralıklarında yapılan değişiklikler diske iyileştirilmemiş olarak yazılır ve bir sonraki çalıştırmada İyileştirme işi tarafından iyileştirilir.

Kullanım Türleri

Aşağıdaki Kullanım Türleri, yaygın iş yükleri için makul Yinelenen Verileri Kaldırma yapılandırması sağlar:

Kullanım Türü İdeal iş yükleri Farklı olan şeyler
Temerrüt Genel amaçlı dosya sunucusu:
  • Ekip paylaşımları
  • Çalışma Klasörleri
  • Klasör yönlendirme
  • Yazılım geliştirme paylaşımları
  • Arka plan iyileştirme
  • Varsayılan iyileştirme ilkesi:
    • En küçük dosya yaşı = 3 gün
    • Kullanımdaki dosyaları iyileştirme = Hayır
    • Kısmi dosyaları iyileştirme = Hayır
Hyper-V Sanallaştırılmış Masaüstü Altyapısı (VDI) sunucuları
  • Arka plan iyileştirme
  • Varsayılan iyileştirme ilkesi:
    • En küçük dosya yaşı = 3 gün
    • Kullanımdaki dosyaları iyileştirme = Evet
    • Kısmi dosyaları iyileştirme = Evet
  • Hyper-V uyumluluk için "görünmeyen" ayarlamalar
Yedek Microsoft Data Protection Manager (DPM) gibi sanallaştırılmış yedekleme uygulamaları
  • Öncelik iyileştirme
  • Varsayılan iyileştirme ilkesi:
    • En küçük dosya yaşı = 0 gün
    • Kullanımdaki dosyaları iyileştirme = Evet
    • Kısmi dosyaları iyileştirme = Hayır
  • DPM/DPM benzeri çözümlerle birlikte çalışma için "arka planda" ayarlamalar

Jobs

Veri Tekilleştirme, bir birimin depolama verimliliğini iyileştirmek ve korumak için bir işlem sonrası stratejisi kullanır.

İş adı İş açıklamaları Varsayılan zamanlama
Optimizasyon İyileştirme işi, birim ilkesi ayarlarına göre bir birimde verileri öbekleyerek, (isteğe bağlı olarak) bu öbekleri sıkıştırarak ve öbekleri öbek deposunda benzersiz olarak depolayarak yinelenenleri kaldırır. Yinelenen Verileri Kaldırma'nın kullandığı iyileştirme işlemi, Yinelenen Verileri Kaldırma nasıl çalışır? bölümünde ayrıntılı olarak açıklanmıştır. Saatte bir
Çöp Toplama Çöp Toplama işi, son zamanlarda değiştirilmiş veya silinmiş dosyalar tarafından artık başvurulmamış gereksiz öbekleri kaldırarak disk alanını geri alır. Her Cumartesi 02:35'te
Bütünlük Temizleme Bütünlük Temizleme işi, disk hataları veya bozuk kesimler nedeniyle öbek deposundaki bozulmayı tanımlar. Veri Yinelenmesini Kaldırma, mümkün olduğunda bozuk verileri yeniden oluşturmak için Depolama Alanı birimindeki yansıtma veya eşlik gibi birim özelliklerini otomatik olarak kullanabilir. Ayrıca, Veri Tekilleştirme, etkin nokta olarak adlandırılan bir alanda 100'den fazla kez başvurulduğunda popüler öbeklerin yedek kopyalarını tutar. Her Cumartesi 03:35'te
En iyi duruma getirme Yalnızca el ile çalıştırılması gereken özel bir iş olan İyileştirmeyi Kaldırma işi, yinelenenleri kaldırma tarafından yapılan iyileştirmeyi geri alır ve bu birim için Yinelenen Verileri Kaldırma'yı devre dışı bırakır. Yalnızca isteğe bağlı

Yinelenen Verileri Kaldırma terminolojisi

Term Definition
Öbek Öbek, yinelenen Verileri Kaldırma öbekleme algoritması tarafından seçilen ve diğer benzer dosyalarda oluşma olasılığı yüksek olan bir dosya bölümüdür.
Öbek deposu Öbek deposu, Yinelenen Verileri Kaldırma'nın öbekleri benzersiz olarak depolamak için kullandığı Sistem Birim Bilgileri klasöründeki düzenli bir kapsayıcı dosyası serisidir.
Yinelenenleri Kaldırma PowerShell, Windows Server API'leri ve bileşenleri ile Windows Server topluluğunda yaygın olarak kullanılan Yinelenen Verileri Kaldırma kısaltması.
Dosya meta verileri Her dosya, dosyanın ana içeriğiyle ilgili olmayan dosyayla ilgili ilginç özellikleri açıklayan meta veriler içerir. Örneğin, Oluşturulma Tarihi, Son Okuma Tarihi, Yazar vb.
Dosya akışı Dosya akışı, dosyanın ana içeriğidir. Bu, Veri Çoğaltmasını Giderme özelliğinin optimize ettiği dosyanın bir parçasıdır.
Dosya sistemi Dosya sistemi, işletim sisteminin dosyaları depolama medyasına depolamak için kullandığı yazılım ve disk içi veri yapısıdır. Yinelenen Verileri Kaldırma, NTFS biçimli birimlerde desteklenir.
Dosya sistemi filtresi Dosya sistemi filtresi, dosya sisteminin varsayılan davranışını değiştiren bir eklentidir. Veri Tekilleştirme, erişim semantiğini korumak için bir dosya sistemi filtresi (Dedup.sys) kullanarak, okuma isteğinde bulunan kullanıcıya veya uygulamaya tamamen şeffaf bir şekilde optimize edilmiş içeriğe yönlendirir.
Optimizasyon Bir dosya, Data Deduplication tarafından öbeklenmişse ve benzersiz öbekleri öbek deposunda saklanmışsa deduplikasyon yapılmış (veya tekrarları kaldırılmış) olarak kabul edilir.
İyileştirme ilkesi İyileştirme ilkesi, Yinelenen Verileri Kaldırma için dikkate alınması gereken dosyaları belirtir. Örneğin, dosyalar yeni, açık, birimdeki belirli bir yolda veya belirli bir dosya türündeyse ilke dışı olarak kabul edilebilir.
Yeniden ayrıştırma noktası Yeniden ayrıştırma noktası, dosya sistemine G/Ç'yi belirtilen dosya sistemi filtresine geçirmesini bildiren özel bir etikettir. Bir dosyanın dosya akışı iyileştirildiğinde, Yinelenen Verileri Kaldırma dosya akışını bir yeniden ayrıştırma noktasıyla değiştirir ve bu da Yinelenen Verileri Kaldırma'nın bu dosyanın erişim semantiğini korumasını sağlar.
Hacim Birim, bir veya daha fazla sunucu genelinde birden çok fiziksel depolama cihazına yayılabilen bir mantıksal depolama sürücüsü için bir Windows yapısıdır. Yinelenenleri kaldırma, birimlere göre etkinleştirilir.
Iş yük -ünü İş yükü, Windows Server üzerinde çalışan bir uygulamadır. Genel amaçlı dosya sunucusu, Hyper-V ve SQL Server örnek iş yükleridir.

Warning

Yetkili Microsoft Destek Personeli tarafından belirtilmediği sürece öbek depoyu el ile değiştirmeyi denemeyin. Bunun yapılması veri bozulmasına veya kaybolmasına neden olabilir.

Sık sorulan sorular

Yinelenen Verileri Kaldırma'nın diğer iyileştirme ürünlerinden farkı nedir? Yinelenen Verileri Kaldırma ile diğer yaygın depolama iyileştirme ürünleri arasında birkaç önemli fark vardır:

  • Yinelenen Verileri Kaldırma ile Tek ÖrnekLi Depolama arasındaki fark nedir? Tek Örnekli Depolama veya SIS, Yinelenen Verileri Kaldırma'nın önüne geçen ve ilk olarak Windows Storage Server 2008 R2'de kullanıma sunulan bir teknolojidir. Tek Nüsha Depolama, birimi optimize etmek için tamamen aynı olan dosyaları tanımladı ve bunları, SIS ortak deposunda depolanan tek bir dosyanın tek kopyasına mantıksal bağlantılar ile değiştirdi. Tek Örnekli Depo'dan farklı olarak, Yinelenen Verileri Kaldırma özdeş olmayan ancak birçok ortak deseni paylaşan dosyalardan ve birçok yinelenen desen içeren dosyalardan alan tasarrufu elde edebilir. Tek Örnekli Depo, Windows Server 2012 R2'de kullanım dışı bırakıldı ve Windows Server 2016'da Veri Tekilleştirme lehine kaldırıldı.

  • Yinelenen Verileri Kaldırma'nın NTFS sıkıştırmasından farkı nedir? NTFS sıkıştırma, NTFS'nin isteğe bağlı olarak birim düzeyinde etkinleştirebileceğiniz bir özelliğidir. NTFS sıkıştırmasıyla, her dosya yazma zamanında sıkıştırma yoluyla ayrı ayrı iyileştirilir. NTFS sıkıştırmasının aksine, Yinelenen Verileri Kaldırma bir birimdeki tüm dosyalar arasında aralık tasarrufu sağlayabilir. Dosyalar hem iç yinelemeye (NTFS sıkıştırması tarafından giderilir) hem de birimdeki diğer dosyalarla benzerliklere sahip olabileceğinden (NTFS sıkıştırması tarafından ele alınmadığından) bu, NTFS sıkıştırmasından daha iyidir. Ayrıca, Yinelenen Verileri Kaldırma'nın bir işlem sonrası modeli vardır. Bu, yeni veya değiştirilmiş dosyaların diske iyileştirilmemiş olarak yazılacağı ve daha sonra Yinelenen Verileri Kaldırma tarafından iyileştirileceği anlamına gelir.

  • Yinelenen Verileri Kaldırma'nın zip, rar, 7z, cab vb. gibi arşiv dosyası biçimlerinden farkı nedir? Zip, rar, 7z, cab vb. gibi arşiv dosya biçimleri, belirtilen dosya kümesi üzerinde sıkıştırma gerçekleştirir. Yinelenen Verileri Kaldırma gibi, dosyalardaki yinelenen desenler ve dosyalar arasında yinelenen desenler iyileştirilir. Ancak, arşive eklemek istediğiniz dosyaları seçmeniz gerekir. Erişim semantiği de farklıdır. Arşiv içindeki belirli bir dosyaya erişmek için arşivi açmanız, belirli bir dosyayı seçmeniz ve bu dosyanın sıkıştırmasını kullanımdan kaldırmanız gerekir. Yinelenen Verileri Kaldırma, kullanıcılara ve yöneticilere saydam bir şekilde çalışır ve el ile başlatma gerektirmez. Ayrıca, Yinelenen Verileri Kaldırma erişim semantiğini korur: İyileştirilmiş dosyalar iyileştirmeden sonra değişmeden görünür.

Seçili Kullanım Türüm için Yinelenen Verileri Kaldırma ayarlarını değiştirebilir miyim? Yes. Yinelenen Verileri Kaldırma , Önerilen iş yükleri için makul varsayılanlar sağlasa da, depolama alanınızdan en iyi şekilde yararlanmak için Yinelenen Verileri Kaldırma ayarlarını yine de değiştirmek isteyebilirsiniz. Ayrıca, diğer iş yüklerinin Yinelenen Verileri Kaldırma'nın müdahalesine maruz kalmaması için bazı ayarlamalar yapılması gerekebilir.

Yinelenen Verileri Kaldırma işini el ile çalıştırabilir miyim? Evet, tüm Yinelenen Verileri Kaldırma işleri el ile çalıştırılabilir. Zamanlanmış işler yetersiz sistem kaynakları nedeniyle veya bir hata nedeniyle çalıştırılmadıysa bu tercih edilebilir. Ayrıca, En İyi Duruma Getirmeme işi yalnızca manuel çalıştırılabilir.

Yinelenen Verileri Kaldırma işlerinin geçmiş sonuçlarını izleyebilir miyim? Evet, tüm Yinelenen Verileri Kaldırma işleri Windows Olay Günlüğü'nde girdiler oluşturur.

Sistemimdeki Yinelenen Verileri Kaldırma işlerinin varsayılan zamanlamalarını değiştirebilir miyim? Evet, tüm zamanlamalar yapılandırılabilir. Varsayılan Veri Yinelenmeyi Kaldırma zamanlamalarını değiştirmek, özellikle Veri Yinelenmeyi Kaldırma işlerinin bitmesi için yeterli zaman tanımak ve iş yüküyle kaynaklar için rekabet etmemesi sağlamak amacıyla önerilir.