Přehled odstranění duplicitních dat

Co je odstranění duplicitních dat?

Deduplikace, často označovaná zkráceně jako "dedupe", je funkce, která může pomoci snížit dopad redundantních dat na náklady na úložiště. Pokud je tato možnost povolená, odstranění duplicitních dat optimalizuje volné místo na svazku prozkoumáním dat na svazku vyhledáním duplicitních částí na svazku. Duplikované části datové sady svazku se ukládají jednou a jsou (volitelně) komprimovány pro další úsporu. Odstranění duplicitních dat optimalizuje redundance bez ohrožení přesnosti nebo integrity dat. Další informace o tom, jak odstranění duplicitních dat funguje, najdete v části Jak funguje Odstranění duplicitních dat? část stránky Principy odstranění duplicitních dat.

Important

KB4025334 obsahuje opravy odstranění duplicitních dat, včetně důležitých oprav spolehlivosti, a důrazně doporučujeme ji nainstalovat při použití Odstranění duplicitních dat s Windows Serverem 2016 a Windows Serverem 2019.

Proč je odstranění duplicitních dat užitečné?

Odstranění duplicitních dat pomáhá správcům úložiště snížit náklady spojené s duplicitními daty. Velké datové sady často obsahují velké množství duplicit, což zvyšuje náklady na ukládání dat. Například:

  • Sdílené složky uživatelů můžou mít mnoho kopií stejných nebo podobných souborů.
  • Hosté virtualizace můžou být téměř identičtí s virtuálním počítačem –to-VM.
  • Snímky záloh mohou mít drobné rozdíly ze dne na den.

Úspora místa, kterou můžete získat z Odstranění duplicitních dat, závisí na datové sadě nebo úloze na svazku. U datových sad s vysokou duplicitou se může zobrazit míra optimalizace až 95%nebo 20krát nižší využití úložiště. Následující tabulka uvádí typické úspory odstranění duplicitních dat pro různé typy obsahu:

Scenario Content Typické úspory místa
Dokumenty uživatelů Dokumenty Office, fotky, hudba, videa atd. 30-50%
Sdílené složky nasazení Binární soubory softwaru, soubory CAB, symboly atd. 70-80%
Virtualizační knihovny IsOs, soubory virtuálního pevného disku atd. 80-95%
Obecná sdílená složka Všechny výše uvedené 50-60%

Note

Pokud chcete jen uvolnit místo na svazku, zvažte použití Azure File Sync s povoleným cloudovým úrovňováním. To vám umožní ukládat nejčastěji používané soubory do mezipaměti místně a vrstvit nejméně často používané soubory do cloudu, což šetří prostor místního úložiště při zachování výkonu. Podrobnosti najdete v tématu Plánování nasazení Synchronizace souborů Azure.

Kdy je možné odstranění duplicitních dat použít?

Obrázek scénáře Description
Obrázek souborových serverů Souborové servery pro obecné účely: Souborové servery pro obecné účely jsou souborové servery pro obecné účely, které můžou obsahovat některý z následujících typů sdílených složek:
  • Týmové sdílené složky
  • Domovské složky uživatele
  • Pracovní složky
  • Podíly na vývoji softwaru
Souborové servery pro obecné účely jsou vhodným kandidátem pro odstranění duplicitních dat, protože více uživatelů má tendenci mít mnoho kopií nebo verzí stejného souboru. Vývoj softwaru těží z odstranění duplicitních dat, protože mnoho binárních souborů zůstává v podstatě beze změny mezi jednotlivými sestaveními.
Obrázek serverů VDI Nasazení infrastruktury virtuálních klientských počítačů (VDI): Servery VDI, například Služby vzdálené plochy, poskytují organizacím lehkou variantu pro zřizování desktopů pro uživatele. Existuje mnoho důvodů, proč se organizace na takové technologie spolehnout:
  • Nasazení aplikace: Aplikace můžete rychle nasadit v celém podniku. To je užitečné zejména v případě, že máte aplikace, které se často aktualizují, zřídka používané nebo obtížně spravovatelné.
  • Konsolidace aplikací: Při instalaci a spouštění aplikací ze sady centrálně spravovaných virtuálních počítačů eliminujete nutnost aktualizovat aplikace na klientských počítačích. Tato možnost také snižuje šířku pásma sítě, která se vyžaduje pro přístup k aplikacím.
  • Vzdálený přístup: Uživatelé mají přístup k podnikovým aplikacím ze zařízení, jako jsou domácí počítače, veřejné terminály, hardware s nízkou úrovní výkonu a jiné operační systémy než Windows.
  • Přístup poboček: Nasazení VDI můžou poskytovat lepší výkon aplikací pracovníkům poboček, kteří potřebují přístup k centralizovaným úložištům dat. Aplikace náročné na data někdy nemají protokoly klienta nebo serveru, které jsou optimalizované pro připojení s nízkou rychlostí.
Nasazení VDI jsou skvělým kandidátem pro deduplikaci dat, protože virtuální pevné disky, které pohánějí vzdálené plochy uživatelů, jsou prakticky stejné. Odstranění duplicitních dat navíc může pomoci s tzv. spouštěcí bouří VDI, což je snížení výkonu úložiště, když se mnoho uživatelů současně přihlásí ke svým plochám, aby mohli zahájit pracovní den.
Obrázek zálohovaných aplikací Cíle zálohování, jako jsou virtualizované zálohovací aplikace: Zálohovací aplikace, jako je Microsoft Data Protection Manager (DPM), jsou vynikajícími kandidáty pro odstranění duplicitních dat kvůli významné duplicitě mezi snímky záloh.
Ilustrace jiných úloh Jiné úlohy: Jiné úlohy můžou být také vynikajícími kandidáty pro odstranění duplicitních dat.