Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Was ist Datendeduplizierung?
Datendeduplizierung, oft auch „deduplizieren“ genannt, ist eine Funktion, die helfen kann, die Auswirkungen redundanter Daten auf die Speicherkosten zu reduzieren. Wenn aktiviert, optimiert die Datendeduplizierung den freien Speicherplatz eines Volumes, indem sie die Daten untersucht und nach duplizierten Teilen sucht. Duplizierte Teile des Datasets des Volumes werden einmal gespeichert und für weitere Einsparungen (optional) komprimiert. Die Datendeduplizierung optimiert Redundanzen, ohne dadurch die Originaltreue oder Integrität von Daten zu gefährden. Weitere Informationen über die Funktionsweise der Datendeduplizierung finden Sie im Abschnitt Wie funktioniert die Datendeduplizierung? auf der Seite Grundlegendes zur Datendeduplizierung.
Wichtig
KB4025334 enthält eine Zusammenfassung von Fehlerbehebungen für die Datendeduplizierung einschließlich wichtiger Zuverlässigkeitskorrekturen, und es wird dringend empfohlen, diese bei Verwendung der Datendeduplizierung mit Windows Server 2016 und Windows Server 2019 zu installieren.
Warum ist Daten-Deduplizierung nützlich?
Die Datendeduplizierung hilft Speicheradministratoren bei der Reduzierung der Kosten, die mit duplizierten Daten in Verbindung stehen. Große Datasets weisen häufig ein hohes Maß an Duplizierung auf, wodurch die Kosten für die Speicherung von Daten steigen. Beispiel:
- Auf Dateifreigaben von Benutzern befinden sich möglicherweise viele Kopien von gleichen oder ähnlichen Dateien.
- Virtualisierungsgäste können von VM zu VM fast identisch sein.
- Backups können von Tag zu Tag geringfügige Unterschiede aufweisen.
Die Speicherplatzeinsparungen, die Sie durch Daten-Deduplizierung erreichen können, hängen vom Datensatz oder der Arbeitslast auf dem Volume ab. Bei Datasets mit hoher Duplizierung kann eine Optimierungsquote von bis zu 95 % bzw. eine um das 20-fache reduzierte Speicherbelegung erreicht werden. In der folgenden Tabelle sind die typischen Einsparungen aufgeführt, die für verschiedene Inhaltstypen durch Deduplizierung erzielt werden können:
Szenario | Inhalt | Typische Platzeinsparung |
---|---|---|
Benutzerdokumente | Office-Dokumente, Fotos, Musik, Videos usw. | 30 - 50 % |
Bereitstellungsfreigaben | Softwarebinärdateien, CAB-Dateien, Symboldateien usw. | 70 - 80 % |
Virtualisierungsbibliotheken | ISO-Dateien, virtuelle Festplattendateien usw. | 80 - 95 % |
Allgemeine Dateifreigabe | Alle oben genannten Möglichkeiten. | 50 - 60 % |
Hinweis
Wenn Sie nur Speicherplatz auf einem Volume freigeben möchten, sollten Sie die Verwendung der Azure-Dateisynchronisierung mit aktiviertem Cloudtiering in Erwägung ziehen. Auf diese Weise können Sie die Dateien, auf die am häufigsten zugegriffen wird, lokal zwischenspeichern und die Dateien, auf die am seltensten zugegriffen wird, in die Cloud verlagern, was lokalen Speicherplatz spart und gleichzeitig die Leistung aufrechterhält. Informationen finden Sie unter Planung für die Bereitstellung einer Azure-Dateisynchronisierung.
Wo kann Datendeduplizierung erfolgen?
Szenariodarstellung | BESCHREIBUNG |
---|---|
![]() |
Universelle Dateiserver: Universelle Dateiserver sind Server, die beliebige der folgenden Freigabetypen enthalten können:
|
![]() |
VDI-Bereitstellungen: VDI-Server (Virtual Desktop Infrastructure, virtuelle Desktopinfrastruktur), wie z. B. Remotedesktopdienste, bieten Organisationen eine schlanke Möglichkeit, Benutzer*innen Desktops zur Verfügung zu stellen. Es gibt viele Gründe für eine Organisation, diese Technologie zu nutzen:
|
![]() |
Sicherungsziele, z. B. virtualisierte Sicherungsanwendungen: Sicherungsanwendungen, wie z. B. Microsoft Data Protection Manager (DPM), eignen sich aufgrund der erheblichen Duplizierung zwischen Sicherungsmomentaufnahmen besonders gut für Datendeduplizierung. |
![]() |
Andere Workloads: Andere Workloads eignen sich möglicherweise auch hervorragend für die Datendeduplizierung. |