Vue d’ensemble de la hiérarchisation cloud

La hiérarchisation Cloud, fonctionnalité facultative d’Azure File Sync, diminue la quantité de stockage local requise tout en conservant les performances d’un serveur de fichiers local.

Lorsqu’elle est activée, cette fonctionnalité stocke uniquement les fichiers fréquemment consultés (à chaud) sur votre serveur local. Les fichiers rarement consultés (à froid) sont fractionnés en espace de noms (structure de fichiers et de dossiers) et en contenu de fichier. L’espace de noms est stocké localement et le contenu du fichier est stocké dans un partage de fichiers Azure dans le Cloud.

Quand un utilisateur ouvre un fichier hiérarchisé, Azure File Sync rappelle les données du fichier depuis le partage de fichiers dans Azure.

Fonctionnement de la hiérarchisation Cloud

Stratégies de hiérarchisation Cloud

Lorsque vous activez la hiérarchisation Cloud, vous pouvez définir deux stratégies pour informer Azure File Sync quand vous souhaitez hiérarchiser les fichiers à froid : la stratégie d’espace libre du volume et la stratégie de date.

Stratégie d’espace libre du volume

La stratégie d’espace libre du volume indique à Azure File Sync de hiérarchiser les fichiers froids dans le Cloud lorsqu’une certaine quantité d’espace est libre sur votre disque local.

Par exemple, si la capacité de votre disque local est de 200 Gio et que vous souhaitez disposer d’au moins 40 Go toujours libres, vous devez définir la stratégie d’espace libre du volume sur 20 %. L’espace libre du volume s’applique au niveau du volume plutôt qu’au niveau des répertoires individuels ou des points de terminaison de serveur.

Stratégie de date

Avec la stratégie de date, les fichiers froids sont hiérarchisés dans le Cloud s’ils n’ont pas été consultés (c’est-à-dire lus ou modifiés) pendant x jours. Par exemple, si vous remarquez que les fichiers qui ont passé plus de 15 jours sans être consultés sont archivés, vous devez définir la stratégie de date sur 15 jours.

Pour obtenir plus d’exemples sur la façon dont les stratégies de date et d’espace libre du volume fonctionnent ensemble, consultez Choisir les stratégies de hiérarchisation Cloud Azure File Sync.

Déduplication des données Windows Server

La déduplication des données est prise en charge sur les volumes pour lesquels la hiérarchisation Cloud est activée à partir de Windows Server 2016. Pour obtenir des détails, consultez Planification d’un déploiement Azure File Sync.

Carte thermique de hiérarchisation Cloud

Azure File Sync surveille l’accès aux fichiers (opérations de lecture et d’écriture) au fil du temps et, en fonction de la fréquence d’accès, attribue un score thermique à chaque fichier. Il utilise ces scores pour générer un « carte thermique » de votre espace de noms sur chaque point de terminaison de serveur. Cette carte thermique est une liste de tous les fichiers de synchronisation dans un emplacement où la hiérarchisation Cloud est activée, classée par score de chaleur. Les fichiers fréquemment consultés qui ont été récemment ouverts sont considérés comme chauds, tandis que les fichiers qui ont été horodatés et n’ont pas été utilisés pendant un certain temps sont considérés comme froids.

Pour déterminer la position relative d’un fichier individuel sur cette carte thermique, le système utilise la valeur maximale de l’un de ses timestamp, dans cet ordre : MAX (heure du dernier accès, heure de la dernière modification, heure de création).

En règle générale, l’heure du dernier accès est suivie et disponible. Toutefois, lorsqu’un nouveau point de terminaison de serveur est créé, avec la hiérarchisation cloud activée, le temps passé est insuffisant pour observer l’accès des fichiers. En l’absence d’heure de dernier accès valable, l’heure de la dernière modification est utilisée pour évaluer la position relative sur la carte thermique.

La stratégie de date fonctionne de la même façon. Sans heure de dernier accès, la stratégie de date tiendra compte de l’heure de la dernière modification. Si celle-ci est indisponible, la date de création d’un fichier est la valeur prise en compte. Au fil du temps, le système observera plus de requêtes d’accès aux fichiers et finira par utiliser l’heure de dernier accès suivie automatiquement.

Notes

La hiérarchisation cloud ne dépend pas de la fonctionnalité NTFS pour le suivi de l’heure du dernier accès. La fonctionnalité NTFS est désactivée par défaut et, en raison de considérations liées aux performances, nous ne vous recommandons pas d’activer manuellement cette fonctionnalité. La hiérarchisation Cloud suit séparément l’heure du dernier accès.

Rappel proactif

Quand un fichier est créé ou modifié, vous pouvez rappeler proactivement un fichier aux serveurs que vous indiquez. Le rappel proactif a pour effet de rendre le fichier (nouveau ou modifié) disponible en vue de son utilisation sur chaque serveur que vous avez indiqué.

Par exemple, une société internationale a des filiales aux États-Unis et en Inde. Le matin (heure des États-Unis), les travailleurs de l’information créent un nouveau dossier et de nouveaux fichiers pour un tout nouveau projet et travaillent dessus toute la journée. Azure File Sync synchronisera le dossier et les fichiers sur le partage de fichiers Azure (point de terminaison cloud). Les travailleurs de l’information en Inde continuent de travailler sur le projet dans leur fuseau horaire. Lorsqu’ils arrivent le matin, le serveur local avec Azure File Sync en Inde doit disposer de ces nouveaux fichiers localement, afin que l’équipe en Inde puisse travailler efficacement à partir d’un cache local. L’activation de ce mode indique au serveur de rappeler de manière proactive les fichiers dès qu’ils sont modifiés ou créés dans le partage de fichiers Azure, ce qui améliore les temps d’accès aux fichiers.

Si les fichiers rappelés sur le serveur ne sont pas nécessaires localement, le rappel inutile peut augmenter le trafic de sortie et les coûts. Activez le rappel proactif quand vous savez que le préremplissage d’un cache de serveur avec des changements récents depuis le Cloud aura des effets positifs sur les utilisateurs ou les applications en utilisant les fichiers sur ce serveur.

L’activation du rappel proactif peut également entraîner une augmentation de l’utilisation de la bande passante sur le serveur et peut entraîner la hiérarchisation d’autres contenus relativement nouveaux sur le serveur local en raison de l’augmentation des fichiers rappelés. Hiérarchiser trop tôt peut cependant entraîner davantage de rappels si les fichiers en cours de hiérarchisation sont considérés comme étant chauds par les serveurs.

Pour plus d’informations sur le rappel proactif, consultez Déployer Azure File Sync.

Comportement d’un fichier mis en cache localement vs. hiérarchisé

La hiérarchisation Cloud est la séparation entre l’espace de noms (l’arborescence de fichiers et de dossiers, ainsi que les propriétés de fichier) et le contenu du fichier.

Fichier hiérarchisé

Pour les fichiers hiérarchisés, la taille sur le disque est égale à zéro, car le contenu du fichier lui-même n’est pas stocké localement. Quand un fichier est hiérarchisé, le filtre du système de fichiers Azure File Sync (StorageSync.sys) remplace le fichier local par un pointeur appelé point d’analyse. Le point d’analyse représente une URL vers le fichier dans le partage de fichiers Azure Files. Un fichier hiérarchisé a l’attribut offline et l’attribut FILE_ATTRIBUTE_RECALL_ON_DATA_ACCESS défini dans le système de fichiers NTFS de façon à ce que des applications tierces puissent identifier en toute sécurité des fichiers hiérarchisés.

A screenshot of a file's properties when it is tiered - namespace only.

Fichier mis en cache localement

D’un autre côté, pour un fichier stocké sur un serveur de fichiers local, la taille sur le disque est environ égale à la taille logique du fichier, car le fichier entier (attributs de fichier + contenu du fichier) est stocké localement.

A screenshot of a file's properties when it is not tiered - namespace + file content.

Un fichier peut également être partiellement hiérarchisé ou partiellement rappelé. Dans un fichier partiellement hiérarchisé, seule une partie du fichier est stockée sur le disque. Vous avez peut-être partiellement rappelé des fichiers sur votre volume si les fichiers sont partiellement lus par les applications qui prennent en charge l’accès en continu aux fichiers. Voici quelques exemples : les lecteurs multimédias et les utilitaires zip. Azure File Sync est efficace et rappelle uniquement les informations demandées à partir du partage de fichiers Azure connecté.

Notes

La Taille représente la taille complète du fichier. La Taille sur le disque représente la taille du flux de fichier stocké sur le disque.

Mode Espace disque insuffisant

Les disques qui présentent des points de terminaison de serveur peuvent ne plus avoir assez d’espace pour diverses raisons, même lorsque la hiérarchisation cloud est activée. Les raisons sont les suivantes :

  • Données copiées manuellement sur le disque en dehors du chemin du point de terminaison de serveur
  • Synchronisation lente ou retardée empêchant la hiérarchisation des fichiers
  • Nombre excessif de rappels de fichiers hiérarchisés

Quand l’espace disque vient à manquer, Azure File Sync risque de ne pas fonctionner correctement voire de devenir inutilisable. Bien qu’il ne soit pas possible pour Azure File Sync d’empêcher complètement ces cas de figure, le mode espace disque insuffisant (disponible dans l’agent Azure File Sync depuis la version 15.1) vise à empêcher un point de terminaison de serveur d’en arriver là et aide également le serveur à se sortir plus rapidement de cette situation.

Pour les points de terminaison de serveur avec la hiérarchisation cloud activée, si l’espace libre sur le volume atteint le seuil calculé, le volume est en mode d’espace disque insuffisant.

En mode d’espace disque insuffisant, l’agent Azure File Sync effectue deux opérations différemment :

  • Hiérarchisation proactive : dans ce mode, l’agent File Sync hiérarchise les fichiers de manière proactive dans le cloud. L’agent de synchronisation vérifie que les fichiers sont hiérarchisés toutes les minutes au lieu de la fréquence normale, toutes les heures. La hiérarchisation de la stratégie d’espace libre du volume ne se produit généralement pas pendant la synchronisation de chargement initiale tant que le chargement complet n’est pas terminé, mais en mode d’espace disque insuffisant, la hiérarchisation est activée pendant la synchronisation de chargement initiale et les fichiers sont pris en compte pour la hiérarchisation une fois que le fichier individuel a été chargé sur le partage de fichiers Azure.

  • Rappels non persistants : lorsqu’un utilisateur ouvre un fichier hiérarchisé, les fichiers rappelés directement à partir du partage de fichiers Azure ne sont pas conservés sur le disque. Les rappels initiés par Invoke-StorageSyncFileRecall l’applet de commande sont une exception à cette règle et sont conservés sur le disque.

Lorsque l’espace libre du volume atteint une valeur supérieure au seuil, Azure File Sync rétablit automatiquement l’état normal. Notez que le mode d’espace disque insuffisant s’applique uniquement aux serveurs avec la hiérarchisation cloud activée et respecte toujours la stratégie d’espace libre du volume.

Si un volume a deux points de terminaison de serveur, un avec hiérarchisation activée et un sans hiérarchisation, le mode espace disque insuffisant s’applique uniquement au point de terminaison du serveur où la hiérarchisation est activée.

Comment est calculé le seuil du mode d’espace disque insuffisant ?

Calculer le seuil en prenant le minimum des trois nombres suivants :

  • 10 % de la taille du volume en Gio
  • Stratégie d’espace libre du volume en Gio
  • 20 Gio

Le tableau suivant contient quelques exemples de la façon dont le seuil est calculé et le moment auquel le volume est en mode d’espace disque insuffisant.

Taille du volume 10 % de la taille du volume Stratégie d’espace libre du volume Seuil = Min (10 % de la taille du volume, stratégie d’espace libre du volume, 20 Go) Espace libre de volume actuel Mode Espace disque insuffisant ? Motif
100 Gio 10 Gio 7 % (7 Gio) 7 Gio = Min (10 Gio, 7 Gio, 20 Gio) 9 % (9 Gio) Non Espace libre du volume actuel (9 Gio) > Seuil (7 Gio)
100 Gio 10 Gio 7 % (7 Gio) 7 Gio = Min (10 Gio, 7 Gio, 20 Gio) 5 % (5 Gio) Oui Espace libre du volume actuel (5 Gio) < Seuil (7 Gio)
300 Gio 30 Gio 8 % (24 Gio) 20 Gio = Min (30 Gio, 24 Gio, 20 Gio) 7 % (21 Gio) Non Espace libre du volume actuel (21 Gio) > Seuil (20 Gio)
300 Gio 30 Gio 8 % (24 Gio) 20 Gio = Min (30 Gio, 24 Gio, 20 Gio) 6 % (18 Gio) Oui Espace libre du volume actuel (18 Gio) < Seuil (20 Gio)

Comment fonctionne le mode espace disque faible avec la stratégie d’espace libre du volume ?

Le mode d’espace disque faible respecte toujours la stratégie d’espace libre du volume. Le calcul du seuil est conçu pour s’assurer que la stratégie d’espace libre du volume définie par l’utilisateur est respectée.

Quelle est la cause la plus courante du passage en mode espace disque insuffisant pour le point de terminaison de serveur ?

Le basculement en mode espace disque insuffisant est principalement imputable à la copie ou au déplacement de grandes quantités de données sur le disque où se trouve un point de terminaison de serveur pour lequel la hiérarchisation est activée.

Comment sortir du mode d’espace disque insuffisant ?

Voici deux façons de quitter le mode d’espace disque insuffisant sur le point de terminaison de serveur :

  1. Le mode d’espace disque insuffisant bascule automatiquement dans un comportement normal en ne faisant pas persister les rappels et en hiérarchisant les fichiers plus fréquemment, sans nécessiter la moindre intervention.
  2. Vous pouvez accélérer manuellement le processus en augmentant la taille du volume ou en libérant de l’espace en dehors du point de terminaison de serveur.

Comment vérifier si un serveur est en mode Espace disque insuffisant ?

  • Si un point de terminaison de serveur est en mode disque insuffisant, il s’affiche dans le portail Microsoft Azure dans la section Intégrité de la hiérarchisation cloud de l’onglet Erreurs et résolution des problèmes du point de terminaison du serveur.
  • L’ID d’événement 19000 est journalisé dans le journal des événements de télémétrie toutes les minutes pour chaque point de terminaison de serveur. Utilisez cet événement pour déterminer si le point de terminaison du serveur est en mode disque insuffisant (IsLowDiskMode = true). Le journal des événements de télémétrie se trouve dans l'observateur d'événements, sous Applications and Services\Microsoft\FileSync\Agent.

Étapes suivantes