Dédupliquer le stockage DPM

Important

Cette version de Data Protection Manager (DPM) a atteint la fin du support. Nous vous recommandons de mettre à niveau vers DPM 2022.

System Center Data Protection Manager (DPM) peut servir à la déduplication des données.

La déduplication des données (déduplication) recherche et supprime les données dupliquées dans un volume tout en veillant à ce que les données restent correctes et complètes. En savoir plus sur la planification de la déduplication.

  • Dedup réduit la consommation de stockage. Bien que la redondance d’un ensemble de données dépende de la charge de travail et du type de données, les données de sauvegarde présentent généralement de fortes économies lors de l’utilisation de la déduplication.

  • La redondance des données peut être encore réduite avec la déduplication quand des données sauvegardées de types et de charges de travail similaires sont traités ensemble.

  • Dedup est conçu pour être installé sur des volumes de données principaux sans matériel dédié supplémentaire afin qu’il n’affecte pas la charge de travail principale sur le serveur. Les paramètres par défaut ne sont pas intrusifs, car ils permettent aux données de vieillir pendant cinq jours avant de traiter un fichier particulier et ont une taille de fichier minimale par défaut de 32 Ko. L'implémentation est conçue pour utiliser peu de mémoire et de ressources du processeur.

  • La déduplication peut être implémentée sur les charges de travail suivantes :

    • Partages de fichiers généraux : publication et partage de contenu de groupe, dossiers de base utilisateur et fichiers hors connexion/de redirection de dossiers

    • les partages de déploiement logiciel : fichiers binaires, images et mises à jour de logiciel

    • Bibliothèques de disques durs virtuels : stockage de fichiers de disque dur virtuel (VHD) pour l’attribution de privilèges d’accès au hyperviseurs

    • Déploiements VDI (Windows Server 2012 R2 uniquement) : déploiements d’infrastructure VDI (Virtual Desktop Infrastructure) à l’aide de Hyper-V

    • Sauvegarde virtualisée : solutions de sauvegarde (telles que DPM s’exécutant sur une machine virtuelle Hyper-V) qui enregistrent des données de sauvegarde dans des fichiers VHD/VHDX sur un serveur de fichiers Windows

DPM et déduplication

L’utilisation de la déduplication avec DPM peut entraîner des économies considérables. La quantité d’espace économisée par la déduplication lors de l’optimisation des données de sauvegarde DPM varie selon le type des données sauvegardées. Par exemple, la sauvegarde d'un serveur de base de données chiffrée peut entraîner des économies minimales, car toutes les données en double sont masquées par le processus de chiffrement. Toutefois, la sauvegarde d’un déploiement VDI (Virtual Desktop Infrastructure) volumineux peut entraîner d’importantes économies dans la plage de 70 à 90% et plus, car il y a généralement une grande quantité de duplication de données entre les environnements de bureau virtuel. Dans la configuration décrite dans l’article, nous avons exécuté différentes charges de travail de test et enregistré des économies comprises entre 50 % et 90 %.

Pour utiliser dedup pour le stockage DPM, DPM doit s’exécuter sur une machine virtuelle Hyper-V et stocker des données de sauvegarde sur des disques durs virtuels dans des dossiers partagés avec le dédup des données activé.

Pour déployer DPM comme machine virtuelle sauvegardant des données sur un volume de déduplication, nous vous recommandons la topologie de déploiement suivante :

  • DPM s'exécutant sur une machine virtuelle dans un cluster hôte Hyper-V.

  • Stockage DPM à l'aide de fichiers VHD/VHDX stockés sur un partage SMB 3.0 sur un serveur de fichiers.

  • Dans notre exemple de test, nous avons configuré le serveur de fichiers en tant que serveur de fichiers avec scale-out (SOFS) déployé en utilisant des volumes de stockage configurés à partir de pools d’espaces de stockage créés à l’aide de lecteurs SAS connectés directement. Ce déploiement garantit des performances à grande échelle.

Notez les points suivants :

  • Ce déploiement est pris en charge pour DPM 2012 R2 et versions ultérieures et pour toutes les données de charge de travail qui peuvent être sauvegardées par DPM 2012 R2 et versions ultérieures.

  • Tous les nœuds de serveur de fichiers Windows sur lesquels des disques durs virtuels DPM résident et sur lesquels la déduplication est activée doivent exécuter Windows Server 2012 R2 avec le correctif cumulatif de novembre 2014 ou versions ultérieures.

  • Nous allons fournir des recommandations et instructions générales pour le déploiement du scénario. Chaque fois que des exemples spécifiques du matériel sont donnés, le matériel déployé dans le système de plateforme cloud (CPS) Microsoft sert de référence.

  • Cet exemple utilise les partages SMB 3.0 pour stocker les données de sauvegarde, pour que la configuration matérielle requise principale se concentre sur les nœuds du serveur de fichiers plutôt que sur les nœuds Hyper-V. La configuration matérielle suivante est utilisée dans le CPS à des fins de sauvegarde et de stockage de production. L’ensemble du matériel est utilisé à la fois pour la sauvegarde et le stockage de production, mais le nombre de lecteurs répertoriés dans les boîtiers de lecteur sont uniquement ceux utilisés pour la sauvegarde.

    • Cluster de serveurs de fichiers avec scale-out à quatre nœuds

    • Configuration par nœud

      • 2x Processeur Intel(R) Xeon(R) E5-2650 0 @ 2,00 GHz, 2001 MHz, 8 cœurs, 16 processeurs logiques

      • 128 Go, 1 333 MHz, mémoire RDIMM

      • Connexions de stockage : 2 ports de SAP, 1 port de 10 GbE iWarp/RDMA

    • Quatre boîtiers de lecteurs JBOD

      • 18 disques dans chaque JBOD - 16 disques durs de 4 To + 2 disques ssd de 800 Go

      • Double chemin pour chaque lecteur, stratégie d’équilibrage de charge MPIO (Multipath I/O) définie sur Basculement uniquement

      • SSD configurés pour le cache en écriture différée (WBC) et le reste pour les lecteurs de journal dédiés

Configurer les volumes de déduplication

Intéressons-nous à la taille que les volumes doivent avoir pour prendre en charge les fichiers VHDX dédupliqués contenant des données DPM. Dans CPS, nous avons créé des volumes de 7,2 To chacun. La taille de volume optimale dépend principalement de l'importance et de la fréquence des changements de données sur le volume, et des taux de débit d'accès aux données du sous-système de stockage sur disque. Il est important de noter que si le traitement de la déduplication ne peut pas suivre le rythme des modifications quotidiennes des données (l’attrition), le taux d’économies diminue jusqu’à ce que le traitement puisse se terminer. Pour plus d’informations, consultez Dimensionnement des volumes pour la déduplication des données. Les instructions générales suivantes sont recommandées pour les volumes de déduplication :

  • Utilisez des espaces de stockage de parité avec reconnaissance du boîtier pour la résilience et une utilisation du disque accrue.

  • Formatez NTFS avec des unités d’allocation de 64 Ko et des segments d’enregistrement de fichiers volumineux pour mieux fonctionner avec l’utilisation dedup des fichiers éparses.

  • Dans la configuration matérielle au-dessus de la taille de volume recommandée des volumes de 7,2 To, les volumes sont configurés comme suit :

    • Double parité prenant en compte le boîtier 7,2 To + 1 Go de cache en écriture différée

      • ResiliencySettingName == Parity

      • PhysicalDiskRedundancy == 2

      • NumberOfColumns == 7

      • Interleave == 256 Ko (Les performances de parité double à 64 Ko entrelacés sont beaucoup plus faibles qu’à 256 Ko entrelacés par défaut)

      • IsEnclosureAware == $true

      • AllocationUnitSize=64 Ko

      • Large FRS

      Configurez un nouveau disque virtuel dans le pool de stockage spécifié comme suit :

      New-VirtualDisk -Size 7.2TB -PhysicalDiskRedundancy 2 -ResiliencySettingName Parity -StoragePoolFriendlyName BackupPool -FriendlyName BackupStorage -NumberOfColumns 7 -IsEnclosureAware $true
      
    • Chacun des volumes doit ensuite être ensuite formaté comme suit :

      Format-Volume -Partition <volume> -FileSystem NTFS -AllocationUnitSize 64 KB -UseLargeFRS -Force
      

      Dans le déploiement CPS, ceux-ci configurés en tant que volumes partagés de cluster.

    • Dans ces volumes, DPM stocke une série de fichiers VHDX pour contenir les données de sauvegarde. Activez la déduplication sur le volume après l’avoir mis en forme comme suit :

      Enable-DedupVolume -Volume <volume> -UsageType HyperV
      Set-DedupVolume -Volume <volume> -MinimumFileAgeDays 0 -OptimizePartialFiles:$false
      

      Cette commande modifie également les paramètres de dédup au niveau du volume suivants :

      • Affectez la valeur HyperV à UsageType : la déduplication traite les fichiers ouverts, qui sont nécessaires, car les fichiers VHDX que DPM utilise pour le stockage de sauvegarde restent ouverts quand DPM s’exécute sur sa machine virtuelle.

      • Désactiver PartialFileOptimization : cela permet à dedup d’optimiser toutes les sections d’un fichier ouvert plutôt que d’analyser les sections modifiées avec un âge minimal.

      • Définissez le paramètre MinFileAgeDays sur 0 : quand l’option PartialFileOptimization est désactivée, MinFileAgeDays change de comportement de sorte que la déduplication considère uniquement les fichiers non modifiés pendant ce nombre de jours. Dans la mesure où nous voulons que la déduplication commence à traiter les données de sauvegarde dans tous les fichiers VHDX de DPM sans délai, nous devons définir le paramètre MinFileAgeDays sur 0.

Pour plus d’informations sur la configuration de la déduplication, consultez Installer et configurer la duplication des données.

Configurer le stockage DPM

Pour éviter les problèmes de fragmentation et maintenir l'efficacité, le stockage DPM est alloué à l'aide de fichiers VHDX résidant sur les volumes dédupliqués. Dix fichiers VHDX dynamiques de 1 To chacun sont créés sur chaque volume et attachés à DPM. En outre, 3 To de surprovisionnement du stockage sont effectués pour tirer parti des économies de stockage générées par dedup. Comme dedup génère des économies de stockage supplémentaires, de nouveaux fichiers VHDX peuvent être créés sur ces volumes pour consommer l’espace enregistré. Nous avons testé le serveur DPM avec 30 fichiers VHDX associés maximum.

  1. Exécutez la commande suivante pour créer des disques durs virtuels qui seront ajoutés ultérieurement au serveur DPM :

    New-SCVirtualDiskDrive -Dynamic -SCSI -Bus $Bus -LUN $Lun -JobGroup $JobGroupId -VirtualHardDiskSizeMB 1048576 -Path $Using:Path -FileName <VHDName>
    
  2. Ajoutez ensuite les disques durs virtuels créés au serveur DPM comme suit :

    Import-Module "DataProtectionManager"
    Set-StorageSetting -NewDiskPolicy OnlineAll
    $dpmdisks = @()
    $dpmdisks = Get-DPMDisk -DPMServerName $env:computername | ? {$_.CanAddToStoragePool -
    eq $true -and $_.IsInStoragePool -eq $false -and $_.HasData -eq $false}
    Add-DPMDisk $dpmdisks
    

    Cette étape configure un pool de stockage en tant que disque ou disques sur lesquels DPM stocke des réplicas et des points de récupération pour les données protégées. Ce pool fait partie de la configuration de DPM et est séparé du pool d'espaces de stockage utilisé pour créer les volumes de données décrits dans la section précédente. Pour plus d’informations sur les pools de stockage DPM, consultez Configurer le stockage sur disque et les pools de stockage.

Configurer le cluster de serveurs de fichiers Windows

La déduplication requiert un ensemble spécial d'options de configuration pour prendre en charge le stockage DPM virtualisé en raison de l'échelle des données et de la taille des fichiers individuels. Ces options sont globales pour le cluster ou le nœud de cluster. La déduplication doit être activée et les paramètres de cluster doivent être configurés individuellement sur chaque nœud du cluster.

  1. Activez la déduplication sur le stockage de serveur de fichiers Windows : le rôle Déduplication doit être installé sur tous les nœuds du cluster de serveurs de fichiers Windows. Pour ce faire, exécutez la commande PowerShell suivante sur chaque nœud du cluster :

    Install-WindowsFeature -Name FileAndStorage-Services,FS-Data-Deduplication -ComputerName <node name>
    
  2. Régler le traitement de la déduplication pour les fichiers de données de sauvegarde : exécutez la commande PowerShell suivante pour définir pour démarrer l’optimisation sans délai et non pour optimiser les écritures de fichiers partielles. Par défaut, les travaux de garbage collection (GC) sont planifiés chaque semaine, et toutes les quatre semaines, le travail GC s’exécute en mode « DEEP GC » pour une recherche plus exhaustive et plus longue des données à supprimer. Pour la charge de travail DPM, ce mode « deep GC » n’entraîne aucun gain appréciable et réduit la durée pendant laquelle le dédup peut optimiser les données. Nous désactivons donc ce mode profond.

    Set-ItemProperty -Path HKLM:\Cluster\Dedup -Name DeepGCInterval -Value 0xFFFFFFFF
    
  3. Ajustez les performances pour les opérations à grande échelle : exécutez le script PowerShell suivant pour :

    • désactiver le traitement et les E/S supplémentaires lors de l'exécution d'un nettoyage profond de la mémoire ;

    • réserver de la mémoire supplémentaire pour un traitement de hachage ;

    • activer l'optimisation de priorité pour permettre une défragmentation immédiate des fichiers volumineux.

    Set-ItemProperty -Path HKLM:\Cluster\Dedup -Name HashIndexFullKeyReservationPercent -Value 70
    Set-ItemProperty -Path HKLM:\Cluster\Dedup -Name EnablePriorityOptimization -Value 1
    

    Ces paramètres modifient les éléments suivants :

    • HashIndexFullKeyReservationPercent : cette valeur contrôle la quantité de mémoire du travail d’optimisation utilisée pour les hachages de bloc existants par rapport aux nouveaux hachages de bloc. À grande échelle, 70 % produit un meilleur débit d'optimisation que la valeur par défaut de 50 %.

    • EnablePriorityOptimization : avec des fichiers approchant de 1 To, la fragmentation d’un fichier unique peut accumuler suffisamment de fragments pour atteindre la limite par fichier. Le traitement d'optimisation consolide ces fragments et empêche que cette limite soit atteinte. Si cette clé de Registre est définie, la déduplication ajoute un processus pour traiter les fichiers dédupliqués très fragmentés avec une priorité haute.

Configurer DPM et la planification de la déduplication

Les opérations de sauvegarde et de déduplication sont intenses en E/S. Si elles devaient s'exécuter simultanément, une charge supplémentaire pour basculer entre les opérations pourrait s'avérer coûteuse et entraîner une diminution du nombre de données sauvegardées ou dédupliquées quotidiennement. Nous vous recommandons de configurer des fenêtres de déduplication et de sauvegarde dédiées et distinctes. Cela permet de garantir que le trafic d'E/S pour chacune de ces opérations soit distribué efficacement durant l'opération système quotidienne. Les recommandations pour la planification sont les suivantes :

  • Fractionner les jours en fenêtres de sauvegarde et de déduplication ne se chevauchant pas.

  • Configurer des planifications de sauvegarde personnalisées.

  • Configurer des planifications de déduplication personnalisées.

  • Planifier l'optimisation dans la fenêtre de déduplication quotidienne.

  • Configurer les planifications de déduplication à effectuer le week-end séparément, en consacrant ce temps aux travaux de nettoyage et de nettoyage de la mémoire.

Vous pouvez configurer des planifications de DPM avec la commande PowerShell suivante :

Set-DPMConsistencyCheckWindow -ProtectionGroup $mpg -StartTime $startTime -
DurationInHours $duration
Set-DPMBackupWindow -ProtectionGroup $mpg -StartTime $startTime -DurationInHours
$duration

Dans cette configuration, DPM est configuré pour sauvegarder les machines virtuelles entre 22 h 00 et 6 h 00. La déduplication est planifiée pendant les 16 heures restantes de la journée. La durée de déduplication réelle que vous configurez dépend de la taille du volume. Pour plus d’informations, consultez Dimensionnement des volumes pour la déduplication des données. Une fenêtre de déduplication de 16 heures commençant à 6 h après la fin de la fenêtre de sauvegarde serait configurée ainsi à partir de n’importe quel nœud de cluster :

#disable default schedule
Set-DedupSchedule * -Enabled:$false
#Remainder of the day after an 8 hour backup window starting at 10pm $dedupDuration = 16
$dedupStart = "6:00am"
#On weekends GC and scrubbing start one hour earlier than optimization job.
# Once GC/scrubbing jobs complete, the remaining time is used for weekend
# optimization.
$shortenedDuration = $dedupDuration - 1
$dedupShortenedStart = "7:00am"
#if the previous command disabled priority optimization schedule
#reenable it
if ((Get-DedupSchedule -name PriorityOptimization -ErrorAction SilentlyContinue) -ne $null)
{
Set-DedupSchedule -Name PriorityOptimization -Enabled:$true
}
#set weekday and weekend optimization schedules
New-DedupSchedule -Name DailyOptimization -Type Optimization -DurationHours $dedupDuration -Memory 50 -Priority Normal -InputOutputThrottleLevel None -Start $dedupStart -Days Monday,Tuesday,Wednesday,Thursday,Friday
New-DedupSchedule -Name WeekendOptimization -Type Optimization -DurationHours $shortenedDuration -Memory 50 -Priority Normal -InputOutputThrottleLevel None -Start $dedupShortenedStart -Days Saturday,Sunday
#re-enable and modify scrubbing and garbage collection schedules
Set-DedupSchedule -Name WeeklyScrubbing -Enabled:$true -Memory 50 -DurationHours $dedupDuration -Priority Normal -InputOutputThrottleLevel None -Start $dedupStart -StopWhenSystemBusy:$false -Days Sunday
Set-DedupSchedule -Name WeeklyGarbageCollection -Enabled:$true -Memory 50 -DurationHours $dedupDuration -Priority Normal -InputOutputThrottleLevel None -Start $dedupStart -StopWhenSystemBusy:$false -Days Saturday
#disable background optimization
if ((Get-DedupSchedule -name BackgroundOptimization -ErrorAction SilentlyContinue) -ne $null)
{
Set-DedupSchedule -Name BackgroundOptimization -Enabled:$false
}

Chaque fois que la fenêtre de sauvegarde est modifiée, il est essentiel que la fenêtre de déduplication soit modifiée avec elle afin qu’elles ne se chevauchent pas. La fenêtre de déduplication et de sauvegarde n’a pas besoin de remplir la totalité des 24 heures de la journée ; Toutefois, il est vivement recommandé qu’ils le fassent pour tenir compte des variations de temps de traitement en raison des changements quotidiens attendus dans les charges de travail et l’attrition des données.

Implications relatives aux performances de sauvegarde

Une fois qu’un ensemble de fichiers a été dédupliqué, il peut y avoir un faible coût de performances lors de l’accès aux fichiers. Cela est dû au traitement supplémentaire requis pour accéder au format de fichier utilisé par les fichiers dédupliqués. Dans ce cas, les fichiers sont un ensemble de fichiers VHDX utilisés en continu par DPM pendant la fenêtre de sauvegarde. L’effet de la déduplication de ces fichiers signifie que les opérations de sauvegarde et de récupération peuvent être légèrement plus lentes que sans déduplication. Comme tout produit de sauvegarde, DPM est une charge de travail lourde en écriture, les opérations de lecture étant très importantes pendant les phases de restauration. Les recommandations liées aux implications en matière de performances de sauvegarde de la déduplication sont les suivantes :

  • Opérations de lecture et de restauration : les effets sur les opérations de lecture sont généralement négligeables et ne nécessitent pas de considérations spéciales dans la mesure où la fonctionnalité de déduplication met en cache les segments dédupliqués.

  • Opérations d’écriture/sauvegarde : planifiez une augmentation du temps de sauvegarde de 5 à 10 % lors de la définition de la fenêtre de sauvegarde. (Il s'agit d'une augmentation par rapport au temps de sauvegarde attendu lors de l'écriture sur des volumes non dédupliqués.)

Analyse

La déduplication de données et DPM peuvent être surveillés pour s'assurer de ce qui suit :

  • Un espace disque suffisant est configuré pour stocker les données de sauvegarde.

  • Les travaux de sauvegarde de DPM s'achèvent normalement.

  • La déduplication est activée sur les volumes de sauvegarde.

  • Les planifications de déduplication sont correctement définies.

  • Le traitement de déduplication s'achève normalement chaque jour.

  • Le taux d'économies résultant de la déduplication correspond aux hypothèses formulées pour la configuration du système.

La réussite de la déduplication dépend des capacités matérielles du système dans son ensemble (vitesse de traitement du processeur, bande passante d'E/S, capacité de stockage), de la configuration système correcte, de la charge système moyenne et du volume quotidien de données modifiées.

Vous pouvez surveiller DPM à l'aide de la console centrale DPM. Voir Installation de la console centrale.

Vous pouvez surveiller la déduplication pour case activée le status de déduplication, le taux d’enregistrement et la planification des status à l’aide des commandes PowerShell suivantes :

Obtenez l'état :

PS C:\> Get-DedupStatus
FreeSpace SavedSpace OptimizedFiles InPolicyFiles Volume
-------------- ---------- -------------- ------------- ------
280.26 GB 529.94 GB 36124 36125 X:
151.26 GB 84.19 GB 43017 43017 Z:

Obtenez les économies :

PS C:\> Get-DedupVolume
Enabled SavedSpace SavingsRate Volume
------- ---------- ----------- ------
True 529.94 GB 74 % X:

Obtenez l'état de la planification à l'aide de l'applet de commande Get-DedupSchedule.

Surveiller les événements

L'analyse du journal des événements peut aider à comprendre l'état et les événements de la déduplication.

  • Pour afficher les événements de déduplication, dans l' Explorateur de fichiers, accédez à Journaux des applications et des services>Microsoft>Windows>Déduplication.

  • Si la valeur LastOptimizationResult = 0x00000000 s'affiche dans les résultats de l'applet de commande Windows PowerShell Get-DedupStatus |fl, cela signifie que le jeu de fichiers entier a été traité par la tâche d'optimisation. Si tel n'est pas le cas, cela signifie que le système n'a pas pu terminer le traitement de déduplication et que vous devez peut-être vérifier les paramètres de configuration tels que la taille du volume.

Pour des exemples d'applet de commande plus détaillés, voir Analyse et rapports pour la déduplication des données.

Surveiller le stockage de sauvegarde

Dans notre exemple de configuration, les volumes de 7,2 To sont remplis avec 10 To de données « logiques » (la taille des données quand elles ne sont pas dédupliquées) stockées dans des fichiers VHDX dynamiques de 10 x 1 To. Comme ces fichiers accumulent des données de sauvegarde supplémentaires, ils remplissent lentement le volume. Si le pourcentage d’économies résultant de la déduplication est suffisamment élevé, les 10 fichiers pourront atteindre leur taille logique maximale et toujours tenir dans le volume de 7,2 To (il pourrait même y avoir de l’espace supplémentaire pour allouer des fichiers VHDX supplémentaires pour les serveurs DPM à utiliser). Toutefois, si les économies de taille résultant de la déduplication ne sont pas suffisantes, l’espace sur le volume peut s’être insuffisant avant que les fichiers VHDX atteignent leur taille logique complète et le volume sera saturé. Pour éviter que les volumes ne deviennent saturés, nous vous recommandons d’effectuer les opérations suivantes :

  • Soyez conservateur en ce qui concerne les exigences de taille de volume et prévoyez un certain sur-approvisionnement de stockage. Il est recommandé d’autoriser une mémoire tampon d’au moins 10 % lors de la planification de l’utilisation du stockage de sauvegarde afin de prendre en compte les variations attendues dans les économies de déduplication et l’attrition des données.

  • Analysez les volumes utilisés pour le stockage de sauvegarde afin de vous assurer que les taux d'utilisation de l'espace et d'économies résultant de la déduplication sont aux niveaux attendus.

Si le volume devient saturé, les symptômes suivants se traduisent :

  • La machine virtuelle DPM est mise en état critique de pause et aucun autre travail de sauvegarde ne peut plus être émis par cette machine virtuelle.

  • Tous les travaux de sauvegarde qui utilisent les fichiers VHDX figurant sur le volume entier échouent.

Pour récupérer à partir de cette condition et restaurer le fonctionnement normal du système, un stockage supplémentaire peut être provisionné et une migration de stockage de la machine virtuelle DPM ou de son VHDX peut être effectuée pour libérer de l’espace :

  1. Arrêtez le serveur DPM propriétaire des fichiers VHDX sur le partage de sauvegarde complet.

  2. Créez un volume et un partage de sauvegarde supplémentaire à l'aide de la configuration et des paramètres utilisés pour les partages existants, y compris les paramètres définis pour la déduplication et NTFS.

  3. Migrez le stockage pour la machine virtuelle du serveur DPM et migrez au moins un fichier VHDX du partage de sauvegarde complet vers le nouveau partage de sauvegarde créé à l’étape 2.

  4. Exécutez un nettoyage de la mémoire (GC) de déduplication des données sur le partage de sauvegarde source saturé. Le nettoyage de la mémoire doit réussir et permettre de récupérer de l'espace libre.

  5. Redémarrez la machine virtuelle du serveur DPM.

  6. Un travail de cohérence DPM case activée sera déclenché pendant la fenêtre de sauvegarde suivante pour toutes les sources de données ayant échoué précédemment.

  7. Tous les travaux de sauvegarde doivent à présent réussir.

Résumé

La combinaison de la déduplication et de DPM permet de réaliser des substantielles. Cela permet d'obtenir des taux de rétention plus élevés, des sauvegardes plus fréquentes et un meilleur coût total de possession (TCO) pour le déploiement de DPM. Les instructions et recommandations figurant dans ce document devraient vous apporter les outils et connaissances nécessaires pour configurer la déduplication pour le stockage DPM et découvrir les avantages qui en résultent pour vous-même dans votre propre déploiement.

Questions courantes

Q: Les fichiers VHDX DPM doivent avoir une taille de 1 To. Cela signifie-t-il que DPM ne peut pas sauvegarder une machine virtuelle, sharePoint, une base de données SQL ou un volume de fichiers d’une taille > de 1 To ?

R : Non. DPM regroupe plusieurs volumes en un seul pour stocker les sauvegardes. Ainsi, la taille de fichier de 1 To n’a aucune incidence sur les tailles de source de données que DPM peut sauvegarder.

Q : Il semble que les fichiers VHDX de stockage DPM doivent être déployés uniquement sur des partages de fichiers SMB distants. Que se passe-t-il si je stocke les fichiers VHDX de sauvegarde sur les volumes pour lesquels la déduplication est activée sur le système sur lequel la machine virtuelle DPM s'exécute ?

Un: Comme indiqué ci-dessus, DPM, Hyper-V et dedup sont des opérations gourmandes en stockage et en calcul. La combinaison de ces trois éléments dans un système unique peut entraîner des opérations intensives d’E/S et de processus qui peuvent affamer Hyper-V et ses machines virtuelles. Si vous décidez d’expérimenter la configuration de DPM sur une machine virtuelle avec les volumes de stockage de sauvegarde sur la même machine, vous devez surveiller attentivement les performances pour vous assurer qu’il y a suffisamment de bande passante d’E/S et de capacité de calcul pour gérer les trois opérations sur le même ordinateur.

Q : Vous recommandez des fenêtres de déduplication et de sauvegarde dédiées, distinctes. Pourquoi ne puis-je pas effectuer une déduplication pendant que DPM sauvegarde ? J’ai besoin de sauvegarder ma base de données SQL toutes les 15 minutes.

Un: Dedup et DPM sont des opérations nécessitant beaucoup de stockage et le fait d’avoir les deux en cours d’exécution en même temps peut être inefficace et entraîner une insuffisance d’E/S. Par conséquent, pour protéger les charges de travail plus d’une fois par jour (par exemple, SQL Server toutes les 15 minutes) et activer le dédup en même temps, assurez-vous qu’il y a suffisamment de bande passante d’E/S et de capacité de l’ordinateur pour éviter la pénurie de ressources.

Q : Selon la configuration décrite, DPM doit être exécuté sur une machine virtuelle. Pourquoi ne puis-je pas activer la déduplication sur le volume du réplica et les volumes de clichés instantanés directement plutôt que sur des fichiers VHDX ?

R : La déduplication opère par volume sur des fichiers individuels. Étant donné que dedup est optimisé au niveau du fichier, il n’est pas conçu pour prendre en charge la technologie VolSnap que DPM utilise pour stocker ses données de sauvegarde. En exécutant DPM sur une machine virtuelle, Hyper-V mappe les opérations de volume DPM au niveau de fichier VHDX, ce qui permet à la déduplication d'optimiser les données de sauvegarde et de générer des économies de stockage supérieures.

Q: L’exemple de configuration ci-dessus n’a créé que des volumes de 7,2 To. Puis-je créer des volumes plus grands ou plus petits ?

R : La déduplication exécute un thread par volume. À mesure que la taille du volume augmente, la déduplication nécessite plus de temps pour accomplir l'optimisation. D’autre part, avec de petits volumes, il y a moins de données dans lesquelles trouver des segments en double, ce qui peut réduire les économies. Par conséquent, il est conseillé d’affiner la taille du volume en fonction de l’attrition totale et des capacités matérielles système pour des économies optimales. Pour plus d'informations sur la détermination des tailles de volume utilisées avec la déduplication, voir Dimensionnement des volumes pour la déduplication dans Windows Server. Pour plus d’informations sur la détermination des tailles de volume utilisées avec la déduplication, consultez Dimensionnement des volumes pour la déduplication des données.