Comprendre les modèles d’utilisation du cache
Les modèles d’utilisation du cache vous permettent de personnaliser la façon dont Azure HPC Cache stocke les fichiers pour accélérer votre workflow.
Concepts de base de la mise en cache de fichiers
La mise en cache des fichiers correspond à la façon dont Azure HPC Cache accélère les demandes des clients. Il utilise les pratiques de base suivantes :
Mise en cache en lecture : Azure HPC Cache conserve une copie des fichiers que les clients demandent au système de stockage. La prochaine fois qu'un client demandera le même fichier, HPC Cache pourra fournir la version présente dans son cache au lieu de devoir aller le chercher à nouveau dans le système de stockage back-end. Les demandes d’écriture sont transmises au système de stockage back-end.
Mise en cache en écriture : En option, Azure HPC Cache peut stocker une copie de tous les fichiers modifiés envoyés par les ordinateurs clients. Si plusieurs clients apportent des modifications au même fichier sur une courte période, le cache peut rassembler toutes les modifications dans le cache au lieu de devoir écrire chaque modification individuellement dans le système de stockage back-end. Après un laps de temps spécifié sans modification, le cache déplace le fichier vers le système de stockage à long terme.
Minuteur de vérification : le minuteur de vérification détermine la fréquence à laquelle le cache compare sa copie locale d’un fichier à la version distante sur le système de stockage back-end. Si la copie du back-end est plus récente que la copie mise en cache, le cache récupère la copie distante et la stocke pour les demandes ultérieures.
Le paramètre du minuteur de vérification indique quand le cache compare automatiquement ses fichiers aux fichiers sources dans le stockage distant. Toutefois, vous pouvez forcer Azure HPC Cache à comparer les fichiers en effectuant une opération d’annuaire incluant une demande readdirplus. Readdirplus est une API NFS standard (également appelée lecture étendue) qui retourne des métadonnées d’annuaire, ce qui amène le cache à comparer et à mettre à jour les fichiers.
Minuteur d’écriture différée : pour un cache avec la mise en cache en lecture-écriture, le minuteur d’écriture différée est la durée maximale en secondes pendant laquelle le cache attend avant de copier un fichier modifié sur le système de stockage back-end.
Les modèles d’utilisation intégrés à Azure HPC Cache présentent différentes valeurs pour ces paramètres afin que vous puissiez choisir la combinaison la mieux adaptée à votre situation.
Choisir le modèle d’utilisation approprié pour votre workflow
Vous devez choisir un modèle d’utilisation pour chaque cible de stockage de protocole NFS que vous utilisez. Les cibles de stockage Blob Azure disposent d’un modèle d’utilisation intégré qui ne peut pas être personnalisé.
Les modèles d’utilisation du cache HPC vous permettent de choisir la manière d’équilibrer la vitesse de réponse avec le risque d’obtenir des données obsolètes. Si vous souhaitez optimiser la vitesse de lecture des fichiers, vous pourriez ne pas vous préoccuper du fait que les fichiers dans le cache sont vérifiés par rapport aux fichiers sur le serveur principal. En revanche, si vous souhaitez vous assurer que vos fichiers sont toujours à jour avec le stockage distant, choisissez un modèle et définissez le minuteur de vérification sur un nombre peu élevé pour vérifier fréquemment.
Voici les options de modèle d’utilisation :
Mise en cache en lecture seule : utilisez cette option si vous souhaitez accélérer l’accès en lecture aux fichiers. Choisissez cette option lorsque votre flux de travail implique des opérations d’écriture minimales, comme de 0 % à 5 %.
Cette option met en cache les lectures du client, mais pas les écritures. Les écritures passent dans le stockage back-end.
Les fichiers stockés dans le cache ne sont pas comparés automatiquement aux fichiers sur le volume de stockage NFS. (Lisez la description du minuteur de vérification ci-dessus pour savoir comment les comparer manuellement.)
Lorsque vous choisissez l’option Mise en cache en lecture seule, vous pouvez modifier le minuteur de vérification. La valeur par défaut est de 30 secondes. La valeur doit être un entier (aucune décimale) compris entre 1 et 31 536 000 secondes (1 an) inclus.
Mise en cache en lecture-écriture : cette option met en cache les opérations de lecture et d’écriture. Lors que cette option est utilisée, la plupart des clients sont censés accéder aux fichiers via Azure HPC Cache, au lieu de monter directement le stockage back-end. Les fichiers mis en cache auront des modifications récentes qui n’ont pas encore été copiées dans le back end.
Dans ce modèle d’utilisation, les fichiers figurant dans le cache ne sont vérifiés par rapport aux fichiers se trouvant dans le stockage principal que toutes les huit heures par défaut. La version mise en cache du fichier est supposée être plus récente. Un fichier modifié dans le cache est écrit dans le système de stockage back-end après être resté dans le cache pendant une heure par défaut.
Lorsque vous choisissez l’option Mise en cache en lecture-écriture, vous pouvez modifier le minuteur de vérification et le minuteur d’écriture différée. La valeur par défaut du minuteur de vérification est de 28 800 secondes (8 heures). La valeur doit être un entier (aucune décimale) compris entre 1 et 31 536 000 inclus. La valeur par défaut du minuteur d’écriture différée est de 3600 secondes (1 heure). La valeur doit être un entier (aucune décimale) compris entre 1 et 31 536 000 secondes (1 an) inclus.
Ce tableau récapitule les différences entre les modèles d’utilisation :
Modèle d’utilisation | Mode de mise en cache | Minuteur de vérification | Minuteur d’écriture différée |
---|---|---|---|
Mise en cache en lecture seule | Lire | 30 secondes | Aucun |
Mise en cache en lecture-écriture | Lecture/écriture | 8 heures | 1 heure |
Avertissement
Le changement de modèle d’utilisation entraîne une interruption de service. Les clients HPC Cache ne recevront pas de réponses pendant la transition du modèle d’utilisation. Si vous devez modifier les modèles d’utilisation, il est recommandé d’apporter ces modifications pendant une fenêtre de maintenance planifiée pour empêcher l’interruption du client.
Si vous avez des questions sur le modèle d’utilisation le mieux adapté à votre workflow Azure HPC Cache, contactez votre représentant Azure ou ouvrez une demande de support pour obtenir de l’aide.
Conseil
Un utilitaire est disponible pour réécrire des fichiers individuels spécifiques dans une cible de stockage sans écrire l’intégralité du contenu du cache. En savoir plus sur le script flush_file.py dans Personnaliser l’écriture différée des fichiers dans Azure HPC Cache.
Étapes suivantes
- Ajouter des cibles de stockage à Azure HPC Cache