Udostępnij za pośrednictwem


Omówienie deduplikacji danych

Co to jest deduplikacja danych?

Deduplikacja danych, często nazywana "dedupe", jest funkcją, która może pomóc zmniejszyć wpływ nadmiarowych danych na koszty magazynowania. Po włączeniu funkcja deduplikacji danych optymalizuje wolne miejsce na woluminie, sprawdzając dane na woluminie, wyszukując zduplikowane fragmenty na woluminie. Zduplikowane części zestawu danych woluminu są przechowywane raz i (opcjonalnie) kompresowane w celu uzyskania dodatkowych oszczędności. Deduplikacja danych optymalizuje nadmiarowość bez naruszania wierności danych lub integralności. Więcej informacji na temat działania deduplikacji danych można znaleźć w artykule "Jak działa deduplikacja danych?". na stronie Understanding Data Deduplikation (Opis deduplikacji danych ).

Ważne

KB4025334 zawiera zestawienie poprawek deduplikacji danych, w tym ważnych poprawek niezawodności, i zdecydowanie zalecamy zainstalowanie ich podczas korzystania z deduplikacji danych z systemami Windows Server 2016 i Windows Server 2019.

Dlaczego deduplikacja danych jest przydatna?

Deduplikacja danych pomaga administratorom magazynu zmniejszyć koszty związane z zduplikowanymi danymi. Duże zestawy danych często mają wiele duplikacji, co zwiększa koszty przechowywania danych. Na przykład:

  • Udziały plików użytkownika mogą mieć wiele kopii tych samych lub podobnych plików.
  • Goście wirtualizacji mogą być prawie identyczni z maszyny wirtualnej —to-VM.
  • Migawki kopii zapasowych mogą mieć niewielkie różnice od dnia do dnia.

Oszczędności miejsca, które można uzyskać z deduplikacji danych, zależą od zestawu danych lub obciążenia woluminu. Zestawy danych, które mają wysoki poziom duplikacji, mogą osiągnąć wskaźniki optymalizacji do 95%lub nawet 20-krotne zmniejszenie wykorzystania przechowywania danych. W poniższej tabeli przedstawiono typowe oszczędności deduplikacji dla różnych typów zawartości:

Scenariusz Zawartość Typowe oszczędności miejsca
Dokumenty użytkowników Dokumenty pakietu Office, zdjęcia, muzyka, filmy itp. 30–50%
Przydziały wdrożenia Pliki binarne oprogramowania, pliki cab, symbole itp. 70-80%
Biblioteki wirtualizacji IsOs, pliki wirtualnego dysku twardego itp. 80-95%
Ogólne współdzielenie plików Wszystkie powyższe 50–60%

Uwaga

Jeśli chcesz zwolnić miejsce na woluminie, rozważ użycie usługi Azure File Sync z włączoną obsługą warstw w chmurze. Dzięki temu można buforować najczęściej używane pliki lokalnie i warstwowo najmniej często używane pliki do chmury, co pozwala zaoszczędzić miejsce do magazynowania lokalnego przy zachowaniu wydajności. Aby uzyskać szczegółowe informacje, zobacz Planowanie wdrożenia usługi Azure File Sync.

Kiedy można użyć deduplikacji danych?

Ilustracja scenariusza Opis
Ilustracja przedstawiająca serwery plików. Serwery plików ogólnego przeznaczenia: Serwery plików ogólnego przeznaczenia są serwerami plików ogólnego przeznaczenia, które mogą zawierać dowolne z następujących typów udziałów:
  • Udziały zespołu
  • Foldery główne użytkownika
  • Foldery robocze
  • Udziały programistyczne
Serwery plików ogólnego przeznaczenia są dobrym kandydatem do deduplikacji danych, ponieważ wielu użytkowników zwykle ma wiele kopii lub wersji tego samego pliku. Rozwój oprogramowania korzysta z deduplikacji danych, ponieważ wiele plików binarnych pozostaje zasadniczo niezmienionych przy kolejnych kompilacjach.
Ilustracja przedstawiająca serwery VDI. Wdrożenia infrastruktury pulpitu wirtualnego (VDI): serwery VDI, takie jak usługi pulpitu zdalnego, zapewniają uproszczone opcje dla organizacji do aprowizowania pulpitów dla użytkowników. Istnieje wiele powodów, dla których organizacja korzysta z takiej technologii:
  • Wdrażanie aplikacji: możesz szybko wdrażać aplikacje w całym przedsiębiorstwie. Jest to szczególnie przydatne, gdy masz aplikacje, które są często aktualizowane, rzadko używane lub trudne do zarządzania.
  • Konsolidacja aplikacji: podczas instalowania i uruchamiania aplikacji z zestawu centralnie zarządzanych maszyn wirtualnych eliminuje konieczność aktualizowania aplikacji na komputerach klienckich. Ta opcja zmniejsza również przepustowość sieci wymaganą do uzyskiwania dostępu do aplikacji.
  • Dostęp zdalny: użytkownicy mogą uzyskiwać dostęp do aplikacji dla przedsiębiorstw z urządzeń, takich jak komputery domowe, kioski, sprzęt o niskiej mocy i systemy operacyjne inne niż Windows.
  • Dostęp do biura oddziału: wdrożenia VDI mogą zapewnić lepszą wydajność aplikacji dla pracowników oddziałów, którzy potrzebują dostępu do scentralizowanych magazynów danych. Aplikacje intensywnie korzystające z danych czasami nie mają protokołów klienta/serwera zoptymalizowanych pod kątem połączeń o niskiej szybkości.
Wdrożenia VDI są doskonałymi kandydatami do deduplikacji danych, ponieważ wirtualne dyski twarde, które napędzają pulpity zdalne dla użytkowników, są zasadniczo identyczne. Ponadto deduplikacja danych może pomóc w tak zwanej burzy rozruchowej VDI, czyli spadku wydajności pamięci masowej, kiedy wielu użytkowników jednocześnie loguje się do komputerów stacjonarnych na początku dnia.
Ilustracja przedstawiająca aplikacje do tworzenia kopii zapasowych. Cele tworzenia kopii zapasowych, takie jak zwirtualizowane aplikacje do tworzenia kopii zapasowych: aplikacje kopii zapasowych, takie jak Program Microsoft Data Protection Manager (DPM), są doskonałymi kandydatami do deduplikacji danych z powodu znacznej duplikacji między migawkami kopii zapasowych.
Ilustracja przedstawiająca inne obciążenia. Inne obciążenia: Inne obciążenia mogą być również doskonałymi kandydatami do deduplikacji danych.