Freigeben über


Datendeduplizierung (Übersicht)

Was ist Datendeduplizierung?

Datendeduplizierung, oft auch „deduplizieren“ genannt, ist eine Funktion, die helfen kann, die Auswirkungen redundanter Daten auf die Speicherkosten zu reduzieren. Wenn aktiviert, optimiert die Datendeduplizierung den freien Speicherplatz eines Volumes, indem sie die Daten untersucht und nach duplizierten Teilen sucht. Duplizierte Teile des Datasets des Volumes werden einmal gespeichert und für weitere Einsparungen (optional) komprimiert. Die Datendeduplizierung optimiert Redundanzen, ohne dadurch die Originaltreue oder Integrität von Daten zu gefährden. Weitere Informationen über die Funktionsweise der Datendeduplizierung finden Sie im Abschnitt Wie funktioniert die Datendeduplizierung? auf der Seite Grundlegendes zur Datendeduplizierung.

Important

KB4025334 contains a roll up of fixes for Data Deduplication, including important reliability fixes, and we strongly recommend installing it when using Data Deduplication with Windows Server 2016 and Windows Server 2019.

Warum ist Daten-Deduplizierung nützlich?

Die Datendeduplizierung hilft Speicheradministratoren bei der Reduzierung der Kosten, die mit duplizierten Daten in Verbindung stehen. Large datasets often have a lot of duplication, which increases the costs of storing the data. For example:

  • Auf Dateifreigaben von Benutzern befinden sich möglicherweise viele Kopien von gleichen oder ähnlichen Dateien.
  • Virtualisierungsgäste können von VM zu VM fast identisch sein.
  • Backups können von Tag zu Tag geringfügige Unterschiede aufweisen.

Die Speicherplatzeinsparungen, die Sie durch Daten-Deduplizierung erreichen können, hängen vom Datensatz oder der Arbeitslast auf dem Volume ab. Bei Datasets mit hoher Duplizierung kann eine Optimierungsquote von bis zu 95 % bzw. eine um das 20-fache reduzierte Speicherbelegung erreicht werden. In der folgenden Tabelle sind die typischen Einsparungen aufgeführt, die für verschiedene Inhaltstypen durch Deduplizierung erzielt werden können:

Scenario Content Typische Platzeinsparung
User documents Office-Dokumente, Fotos, Musik, Videos usw. 30-50%
Deployment shares Softwarebinärdateien, CAB-Dateien, Symboldateien usw. 70-80%
Virtualization libraries ISO-Dateien, virtuelle Festplattendateien usw. 80-95%
Allgemeine Dateifreigabe Alle oben genannten Möglichkeiten. 50-60%

Note

Wenn Sie nur Speicherplatz auf einem Volume freigeben möchten, sollten Sie die Verwendung der Azure-Dateisynchronisierung mit aktiviertem Cloudtiering in Erwägung ziehen. Auf diese Weise können Sie die Dateien, auf die am häufigsten zugegriffen wird, lokal zwischenspeichern und die Dateien, auf die am seltensten zugegriffen wird, in die Cloud verlagern, was lokalen Speicherplatz spart und gleichzeitig die Leistung aufrechterhält. Informationen finden Sie unter Planung für die Bereitstellung einer Azure-Dateisynchronisierung.

Wo kann Datendeduplizierung erfolgen?

Scenario illustration Description
Abbildung der Dateiserver Universelle Dateiserver: Universelle Dateiserver sind Server, die beliebige der folgenden Freigabetypen enthalten können:
  • Team shares
  • Basisordner von Benutzern
  • Work folders
  • Aktien der Softwareentwicklung
Allgemeine Dateiserver eignen sich gut für die Datendeduplizierung, weil mehrere Benutzer tendenziell über zahlreiche Kopien oder Versionen derselben Datei verfügen. Freigaben für die Softwareentwicklung profitieren von der Datendeduplizierung, da viele Binärdateien von Build zu Build im Wesentlichen unverändert bleiben.
Abbildung der VDI-Server VDI-Bereitstellungen: VDI-Server (Virtual Desktop Infrastructure, virtuelle Desktopinfrastruktur), wie z. B. Remotedesktopdienste, bieten Organisationen eine schlanke Möglichkeit, Benutzer*innen Desktops zur Verfügung zu stellen. Es gibt viele Gründe für eine Organisation, diese Technologie zu nutzen:
  • Application deployment: You can quickly deploy applications across your enterprise. Dies ist besonders nützlich bei Anwendungen, die häufig aktualisiert werden, selten verwendet werden oder schwierig zu verwalten sind.
  • Application consolidation: When you install and run applications from a set of centrally managed virtual machines, you eliminate the need to update applications on client computers. Dadurch verringert sich zudem die Netzwerkbandbreite, die für den Zugriff auf Anwendungen erforderlich ist.
  • Remote Access: Users can access enterprise applications from devices such as home computers, kiosks, low-powered hardware, and operating systems other than Windows.
  • Zugriff in Filialen: VDI-Bereitstellungen bieten Mitarbeitern in Filialen, die Zugriff auf zentrale Datenspeicher benötigen, eine bessere Anwendungsleistung. Datenintensive Anwendungen haben mitunter keine Client/Server-Protokolle, die für langsame Verbindungen optimiert sind.
VDI-Bereitstellungen eignen sich gut für die Datendeduplizierung, da die virtuellen Festplatten auf den Remotedesktops der Benutzer im Wesentlichen identisch sind. Darüber hinaus kann die Datendeduplizierung einen Beitrag gegen die VDI-Startverzögerung leisten, was den Abfall der Speicherleistung bezeichnet, wenn sich viele Benutzer gleichzeitig am Morgen an ihren Desktop-PCs anmelden.
Illustration der Sicherungsanwendungen Sicherungsziele, z. B. virtualisierte Sicherungsanwendungen: Sicherungsanwendungen, wie z. B. Microsoft Data Protection Manager (DPM), eignen sich aufgrund der erheblichen Duplizierung zwischen Sicherungsmomentaufnahmen besonders gut für Datendeduplizierung.
Illustration anderer Arbeitslasten Other workloads: Other workloads may also be excellent candidates for Data Deduplication.