Errores y acciones en Azure Chaos Studio

En Azure Chaos Studio, todas las actividades que se producen como parte de un experimento se denominan acción. El tipo de acción más común es un error. En este artículo se describen las acciones y los errores, así como las propiedades de cada uno.

Acciones de un experimento

Una acción es cualquier actividad orquestada como parte de un experimento de caos. Las acciones se organizan en pasos y ramas, lo que permite que las acciones se ejecuten secuencialmente o en paralelo. Cada acción tiene las propiedades siguientes:

  • Nombre: La acción específica que tiene lugar. Normalmente, un nombre toma la forma de un URN para la acción, por ejemplo, urn.
  • Tipo: La forma en que se ejecuta la acción. Las acciones pueden ser continuas o discretas. Una acción continua se ejecuta sin escalas durante un período de tiempo. Un ejemplo es aplicar presión de CPU durante 10 minutos. Una acción discreta solo se produce una vez. Un ejemplo es reiniciar una instancia de Azure Cache for Redis.

Tipos de acciones

En Chaos Studio hay dos variedades de acciones:

  • Errores: esta acción provoca una interrupción en uno o varios recursos.
  • Retrasos en el tiempo: esta acción "espera" sin afectar a ningún recurso. Resulta útil pausar entre errores para esperar a que un sistema se vea afectado por el error anterior.

Defectos

Los errores son la acción más común en Chaos Studio. Los errores provocan una interrupción en un sistema, lo que le permite comprobar que el sistema controla eficazmente esa interrupción sin afectar a la disponibilidad.

Los errores pueden:

  • Ser destructiva. Por ejemplo, un error puede matar un proceso.
  • Aplicar presión. Por ejemplo, un error puede agregar presión de memoria virtual.
  • Agregar latencia.
  • Causa un cambio de configuración.

Además de un nombre y un tipo, los errores también pueden tener una duración, si es continua y parámetros. Los parámetros describen cómo se debe aplicar el error y son específicos del nombre del error. Por ejemplo, un parámetro para el error de conmutación por error de Azure Cosmos DB es la región de lectura que se promoverá a la región de escritura durante el error de la región de escritura. Algunos parámetros son obligatorios, mientras que otros son opcionales.

Los errores se basan en agentes o son directos del servicio en función del tipo de destino. Un error basado en agente requiere que el agente de Chaos Studio esté instalado en una máquina virtual o en un conjunto de escalado de máquinas virtuales. El agente está disponible tanto para Windows como para Linux, pero no todos los errores están disponibles en ambos sistemas operativos. Para obtener información sobre qué errores se admiten en cada sistema operativo, consulte Biblioteca de acciones y errores de Chaos Studio. Los errores directos del servicio no requieren ningún agente. Se ejecutan directamente en un recurso de Azure.

Los errores también incluyen el nombre del selector que describe los recursos en los que se ejecuta el error. Para más información sobre los selectores, consulte Experimentos de Caos. Un error solo puede afectar a un recurso si el recurso se ha incorporado como destino y tiene habilitada la funcionalidad de error correspondiente en el recurso.

Pasos siguientes

Ahora que comprende las acciones y los errores que está listo para: