Erreurs et actions dans Azure Chaos Studio

Dans Azure Chaos Studio, chaque activité qui se produit dans le cadre d’une expérience est appelée action. Le type d’action le plus courant est une erreur. Cet article décrit les actions et les erreurs ainsi que les propriétés correspondantes.

Actions d’expérimentation

Une action est toute activité orchestrée dans le cadre d’une expérience de chaos. Les actions sont organisées en étapes et en branches, ce qui permet aux actions de s’exécuter séquentiellement ou en parallèle. À chaque action sont associées les propriétés suivantes :

  • Nom : action spécifique exécutée. Un nom prend généralement la forme d’un URN pour l’action, par exemple urn.
  • Type : la manière dont l’action s’exécute. Les actions peuvent être continues ou discrètes. Une action continue s’exécute sans interruption sur une période donnée. Par exemple, l’application de la pression du processeur pendant 10 minutes est appliquée. Une action discrète ne se produit qu’une seule fois. Par exemple, le redémarrage d’une instance de Azure Cache pour Redis.

Types d’actions

Il existe deux sortes d’actions dans Chaos Studio :

  • Erreurs : cette action provoque une interruption dans une ou plusieurs ressources.
  • Retards de temps : cette action « attend » sans affecter les ressources. Il est utile de suspendre entre les erreurs pour attendre qu’un système soit affecté par l’erreur précédente.

Pannes

Les erreurs représentent l’action la plus courante dans Chaos Studio. Les erreurs provoquent une interruption dans un système, ce qui vous permet de vérifier que le système gère efficacement cette interruption sans affecter la disponibilité.

Les erreurs peuvent :

  • Soyez destructeur. Par exemple, une erreur peut tuer un processus.
  • Appliquez la pression. Par exemple, une erreur peut ajouter une pression de mémoire virtuelle.
  • Ajouter une latence.
  • Provoquer une modification de configuration.

En plus d’un nom et d’un type, les erreurs peuvent également avoir une durée, si elles sont continues et des paramètres. Les paramètres décrivent comment l’erreur doit être appliquée et sont spécifiques au nom de l’erreur. Par exemple, la région de lecture qui sera promue en région d’écriture durant la panne de la région d’écriture est un paramètre pour l’erreur de basculement de Azure Cosmos DB. Certains paramètres sont requis, tandis que d’autres sont facultatifs.

Les erreurs sont basées sur des agents ou de type service-direct selon le type de cible. Une erreur basée sur un agent nécessite l’installation de l’agent Chaos Studio sur une machine virtuelle ou un groupe de machines virtuelles identiques. L’agent est disponible pour Windows et Linux, mais toutes les erreurs ne sont pas disponibles sur les deux systèmes d’exploitation. Pour plus d’informations sur les erreurs prises en charge sur chaque système d’exploitation, consultez la bibliothèque d’erreurs et d’actions Chaos Studio. Les erreurs directes de service ne nécessitent aucun agent. Ils s’exécutent directement sur une ressource Azure.

Les erreurs incluent également le nom du sélecteur qui décrit les ressources sur lesquelles l’erreur s’exécute. Pour en savoir plus sur les sélecteurs, consultez les expériences Chaos. Une erreur ne peut affecter une ressource que si la ressource a été intégrée en tant que cible et si la fonctionnalité d’erreur correspondante est activée sur la ressource.

Étapes suivantes

Maintenant que vous comprenez les actions et les erreurs que vous êtes prêt à :