Datendeduplizierung (Übersicht)
Was ist Datendeduplizierung?
Datendeduplizierung ist ein Feature, mit dessen Hilfe Sie die Auswirkungen redundanter Daten auf Speicherkosten verringern können. Falls aktiviert, optimiert die Datendeduplizierung den freien Speicherplatz auf einem Volume, indem die Daten auf dem Volume durch Suchen nach duplizierten Teilen auf dem Volume untersucht werden. Duplizierte Teile des Datasets des Volumes werden einmal gespeichert und für weitere Einsparungen (optional) komprimiert. Die Datendeduplizierung optimiert Redundanzen, ohne dadurch die Originaltreue oder Integrität von Daten zu gefährden. Weitere Informationen über die Funktionsweise der Datendeduplizierung finden Sie im Abschnitt Wie funktioniert die Datendeduplizierung? auf der Seite Grundlegendes zur Datendeduplizierung.
Wichtig
KB4025334 enthält eine Zusammenfassung von Fehlerbehebungen für die Datendeduplizierung einschließlich wichtiger Zuverlässigkeitskorrekturen, und es wird dringend empfohlen, diese bei Verwendung der Datendeduplizierung mit Windows Server 2016 und Windows Server 2019 zu installieren.
Warum ist Datendeduplizierung nützlich?
Die Datendeduplizierung hilft Speicheradministratoren bei der Reduzierung der Kosten, die mit duplizierten Daten in Verbindung stehen. Große Datasets weisen häufig ein hohes Maß an Duplizierung auf, wodurch die Kosten für die Speicherung von Daten steigen. Beispiel:
- Auf Dateifreigaben von Benutzern befinden sich möglicherweise viele Kopien von gleichen oder ähnlichen Dateien.
- Virtualisierungsgäste können von VM zu VM fast identisch sein.
- Sicherungsmomentaufnahmen weisen möglicherweise geringe Unterschiede zum Vortag auf.
Die Einsparungen von Speicherplatz, die Sie mit Datendeduplizierung erzielen können, sind abhängig vom Dataset oder der Workload auf dem Volume. Bei Datasets mit hoher Duplizierung kann eine Optimierungsquote von bis zu 95 % bzw. eine um das 20-fache reduzierte Speicherbelegung erreicht werden. In der folgenden Tabelle sind die typischen Einsparungen aufgeführt, die für verschiedene Inhaltstypen durch Deduplizierung erzielt werden können:
Szenario | Inhalt | Typische Platzeinsparung |
---|---|---|
Benutzerdokumente | Office-Dokumente, Fotos, Musik, Videos usw. | 30 - 50 % |
Bereitstellungsfreigaben | Softwarebinärdateien, CAB-Dateien, Symboldateien usw. | 70 - 80 % |
Virtualisierungsbibliotheken | ISO-Dateien, virtuelle Festplattendateien usw. | 80 - 95 % |
Allgemeine Dateifreigabe | Alle oben genannten Möglichkeiten. | 50 - 60 % |
Hinweis
Wenn Sie nur Speicherplatz auf einem Volume freigeben möchten, sollten Sie die Verwendung der Azure-Dateisynchronisierung mit aktiviertem Cloudtiering in Erwägung ziehen. Auf diese Weise können Sie die Dateien, auf die am häufigsten zugegriffen wird, lokal zwischenspeichern und die Dateien, auf die am seltensten zugegriffen wird, in die Cloud verlagern, was lokalen Speicherplatz spart und gleichzeitig die Leistung aufrechterhält. Informationen finden Sie unter Planung für die Bereitstellung einer Azure-Dateisynchronisierung.
Wo kann Datendeduplizierung erfolgen?
Szenariodarstellung | BESCHREIBUNG |
---|---|
Universelle Dateiserver: Universelle Dateiserver sind Server, die beliebige der folgenden Typen von Freigaben enthalten können:
|
|
VDI-Bereitstellungen: VDI-Server (Virtual Desktop Infrastructure, virtuelle Desktopinfrastruktur), wie z. B. Remotedesktopdienste, bieten Organisationen eine schlanke Möglichkeit, Benutzer*innen Desktops zur Verfügung zu stellen. Es gibt viele Gründe für eine Organisation, diese Technologie zu nutzen:
|
|
Sicherungsziele, z. B. virtualisierte Sicherungsanwendungen: Sicherungsanwendungen, wie z. B. Microsoft Data Protection Manager (DPM), eignen sich aufgrund der erheblichen Duplizierung zwischen Sicherungsmomentaufnahmen besonders gut für Datendeduplizierung. | |
Andere Workloads: Andere Workloads eignen sich möglicherweise auch hervorragend für die Datendeduplizierung. |