Udostępnij za pośrednictwem


Omówienie deduplikacji danych

Co to jest deduplikacja danych?

Deduplikacja danych, często nazywana "dedupe", jest funkcją, która może pomóc zmniejszyć wpływ nadmiarowych danych na koszty magazynowania. Po włączeniu funkcja deduplikacji danych optymalizuje wolne miejsce na woluminie, sprawdzając dane na woluminie, wyszukując zduplikowane fragmenty na woluminie. Zduplikowane części zestawu danych woluminu są przechowywane raz i (opcjonalnie) kompresowane w celu uzyskania dodatkowych oszczędności. Deduplikacja danych optymalizuje nadmiarowość bez naruszania wierności danych lub integralności. Więcej informacji na temat działania deduplikacji danych można znaleźć w artykule "Jak działa deduplikacja danych?". na stronie Understanding Data Deduplikation (Opis deduplikacji danych ).

Important

KB4025334 contains a roll up of fixes for Data Deduplication, including important reliability fixes, and we strongly recommend installing it when using Data Deduplication with Windows Server 2016 and Windows Server 2019.

Dlaczego deduplikacja danych jest przydatna?

Deduplikacja danych pomaga administratorom magazynu zmniejszyć koszty związane z zduplikowanymi danymi. Large datasets often have a lot of duplication, which increases the costs of storing the data. For example:

  • Udziały plików użytkownika mogą mieć wiele kopii tych samych lub podobnych plików.
  • Goście wirtualizacji mogą być prawie identyczni z maszyny wirtualnej —to-VM.
  • Migawki kopii zapasowych mogą mieć niewielkie różnice od dnia do dnia.

Oszczędności miejsca, które można uzyskać z deduplikacji danych, zależą od zestawu danych lub obciążenia woluminu. Zestawy danych, które mają wysoki poziom duplikacji, mogą osiągnąć wskaźniki optymalizacji do 95%lub nawet 20-krotne zmniejszenie wykorzystania przechowywania danych. W poniższej tabeli przedstawiono typowe oszczędności deduplikacji dla różnych typów zawartości:

Scenario Content Typowe oszczędności miejsca
User documents Dokumenty pakietu Office, zdjęcia, muzyka, filmy itp. 30-50%
Deployment shares Pliki binarne oprogramowania, pliki cab, symbole itp. 70-80%
Virtualization libraries IsOs, pliki wirtualnego dysku twardego itp. 80-95%
Ogólne współdzielenie plików Wszystkie powyższe 50-60%

Note

Jeśli chcesz zwolnić miejsce na woluminie, rozważ użycie usługi Azure File Sync z włączoną obsługą warstw w chmurze. Dzięki temu można buforować najczęściej używane pliki lokalnie i warstwowo najmniej często używane pliki do chmury, co pozwala zaoszczędzić miejsce do magazynowania lokalnego przy zachowaniu wydajności. Aby uzyskać szczegółowe informacje, zobacz Planowanie wdrożenia usługi Azure File Sync.

Kiedy można użyć deduplikacji danych?

Scenario illustration Description
Ilustracja przedstawiająca serwery plików. Serwery plików ogólnego przeznaczenia: Serwery plików ogólnego przeznaczenia są serwerami plików ogólnego przeznaczenia, które mogą zawierać dowolne z następujących typów udziałów:
  • Team shares
  • Foldery główne użytkownika
  • Work folders
  • Udziały programistyczne
Serwery plików ogólnego przeznaczenia są dobrym kandydatem do deduplikacji danych, ponieważ wielu użytkowników zwykle ma wiele kopii lub wersji tego samego pliku. Rozwój oprogramowania korzysta z deduplikacji danych, ponieważ wiele plików binarnych pozostaje zasadniczo niezmienionych przy kolejnych kompilacjach.
Ilustracja przedstawiająca serwery VDI. Wdrożenia infrastruktury pulpitu wirtualnego (VDI): serwery VDI, takie jak usługi pulpitu zdalnego, zapewniają uproszczone opcje dla organizacji do aprowizowania pulpitów dla użytkowników. Istnieje wiele powodów, dla których organizacja korzysta z takiej technologii:
  • Application deployment: You can quickly deploy applications across your enterprise. Jest to szczególnie przydatne, gdy masz aplikacje, które są często aktualizowane, rzadko używane lub trudne do zarządzania.
  • Application consolidation: When you install and run applications from a set of centrally managed virtual machines, you eliminate the need to update applications on client computers. Ta opcja zmniejsza również przepustowość sieci wymaganą do uzyskiwania dostępu do aplikacji.
  • Remote Access: Users can access enterprise applications from devices such as home computers, kiosks, low-powered hardware, and operating systems other than Windows.
  • Dostęp do biura oddziału: wdrożenia VDI mogą zapewnić lepszą wydajność aplikacji dla pracowników oddziałów, którzy potrzebują dostępu do scentralizowanych magazynów danych. Aplikacje intensywnie korzystające z danych czasami nie mają protokołów klienta/serwera zoptymalizowanych pod kątem połączeń o niskiej szybkości.
Wdrożenia VDI są doskonałymi kandydatami do deduplikacji danych, ponieważ wirtualne dyski twarde, które napędzają pulpity zdalne dla użytkowników, są zasadniczo identyczne. Ponadto deduplikacja danych może pomóc w tak zwanej burzy rozruchowej VDI, czyli spadku wydajności pamięci masowej, kiedy wielu użytkowników jednocześnie loguje się do komputerów stacjonarnych na początku dnia.
Ilustracja przedstawiająca aplikacje do tworzenia kopii zapasowych. Cele tworzenia kopii zapasowych, takie jak zwirtualizowane aplikacje do tworzenia kopii zapasowych: aplikacje kopii zapasowych, takie jak Program Microsoft Data Protection Manager (DPM), są doskonałymi kandydatami do deduplikacji danych z powodu znacznej duplikacji między migawkami kopii zapasowych.
Ilustracja przedstawiająca inne obciążenia. Other workloads: Other workloads may also be excellent candidates for Data Deduplication.