Notes
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Qu’est-ce que la déduplication des données ?
La déduplication des données, souvent appelée « dédupe » pour un court terme, est une fonctionnalité qui peut aider à réduire l’impact des données redondantes sur les coûts de stockage. Quand elle est activée, la déduplication des données optimise l’espace libre sur un volume en examinant les données qu’il contient et en recherchant les parties dupliquées sur le volume. Les parties dupliquées du jeu de données du volume sont stockées une seule fois et sont (éventuellement) compressées pour réaliser encore plus d’économies. La déduplication des données permet d’optimiser les redondances sans compromettre la fidélité ni l’intégrité des données. Vous trouverez un complément d’informations sur le fonctionnement de la déduplication des données dans la section « Fonctionnement de la déduplication des données » de la page Présentation de la déduplication des données.
Important
KB4025334 contains a roll up of fixes for Data Deduplication, including important reliability fixes, and we strongly recommend installing it when using Data Deduplication with Windows Server 2016 and Windows Server 2019.
Pourquoi la déduplication des données est-elle utile ?
La déduplication des données permet aux administrateurs du stockage de réduire les coûts associés aux données dupliquées. Large datasets often have a lot of duplication, which increases the costs of storing the data. For example:
- Les partages de fichiers utilisateur peuvent comporter de nombreuses copies de fichiers identiques ou très similaires.
- Les invités de virtualisation peuvent être presque identiques d’une machine virtuelle à l’autre.
- Les instantanés de sauvegarde peuvent afficher des différences mineures d’un jour à l’autre.
L’espace que vous pouvez gagner avec la déduplication des données dépend du jeu de données ou de la charge de travail au niveau du volume. Les jeux de données qui présentent une duplication élevée peuvent obtenir des taux d’optimisation allant jusqu’à 95 % ou une utilisation du stockage divisée par 20. Le tableau ci-dessous met en relief les économies réalisées par une déduplication standard sur différents types de contenu :
Scenario | Content | Gains d’espace types |
---|---|---|
User documents | Documents Office, photos, musique, vidéos, etc. | 30-50% |
Deployment shares | Fichiers binaires de logiciels, fichiers cab, symboles, etc. | 70-80% |
Virtualization libraries | Fichiers ISO, fichiers de disque dur virtuel, etc. | 80-95% |
Partage de fichiers général | Toutes les propositions ci-dessus | 50-60% |
Note
Si vous cherchez juste à libérer de l’espace sur un volume, envisagez d’utiliser Azure File Sync avec la hiérarchisation cloud activée. Il vous permet de mettre en cache vos fichiers les plus fréquemment sollicités localement et de hiérarchiser vos fichiers les moins fréquemment sollicités dans le cloud. Ainsi, vous économisez de l’espace de stockage local tout en maintenant les performances. Pour obtenir des détails, consultez Planification d’un déploiement Azure File Sync.
Quand la déduplication des données peut-elle être utilisée ?
Scenario illustration | Description |
---|---|
![]() |
Serveurs de fichiers à usage général : les serveurs de fichiers à usage général sont des serveurs de fichiers qui peuvent contenir l’un des types de partage suivants :
|
![]() |
Déploiements d’infrastructure de bureau virtuel (VDI) : les serveurs VDI, comme les Services Bureau à distance, offrent une option allégée aux organisations qui veulent approvisionner des postes de travail pour leurs utilisateurs. Il existe de nombreuses raisons pour une organisation de s'appuyer sur cette technologie :
|
![]() |
Cibles de sauvegarde, telles que les applications de sauvegarde virtualisées : les applications de sauvegarde, telles que Microsoft Data Protection Manager (DPM), constituent d’excellents candidats à la déduplication des données en raison de la duplication significative entre les instantanés de sauvegarde. |
![]() |
Other workloads: Other workloads may also be excellent candidates for Data Deduplication. |