Compartir vía


Errores y acciones en Azure Chaos Studio

En Azure Chaos Studio, toda actividad que tiene lugar como parte de un experimento se denomina acción. El tipo de acción más común es un error. En este artículo se describen las acciones y los errores, así como las propiedades de cada uno.

Acciones de un experimento

Una acción es cualquier actividad que se orquesta como parte de un experimento de caos. Las acciones se organizan en pasos y ramas, lo que permite ejecutarlas de forma secuencial o en paralelo. Cada acción tiene las propiedades siguientes:

  • Nombre: La acción específica que tiene lugar. Normalmente, un nombre toma la forma de URN para la acción, por ejemplo, urn.
  • Tipo: La forma en que se ejecuta la acción. Las acciones pueden ser continuas o discretas. Una acción continua se ejecuta sin interrupciones durante un período de tiempo. Un ejemplo de ello es aplicar presión de CPU durante 10 minutos. Una acción discreta solo se produce una vez. Un ejemplo de ello es reiniciar una instancia de Azure Cache for Redis.

Tipos de acciones

En Chaos Studio hay dos variedades de acciones:

  • Errores: esta acción provoca una interrupción en uno o varios recursos.
  • Retrasos de tiempo: esta acción "espera" sin afectar a ningún recurso. Es útil para realizar pausas entre errores en un sistema afectado por el error anterior.

Defectos

Los errores son la acción más común en Chaos Studio. Los errores provocan una interrupción en un sistema, lo que le permite comprobar que el sistema controla esa interrupción de forma eficaz sin que la disponibilidad se vea afectada.

Los errores pueden:

  • Ser destructivos. Por ejemplo, un error puede terminar un proceso.
  • Aplicar presión. Por ejemplo, un error puede agregar presión de memoria virtual.
  • Agregar latencia.
  • Provocar un cambio de configuración.

Además de un nombre y un tipo, los errores también pueden tener una duración, si son continuos, y parámetros. Los parámetros describen cómo se debe aplicar el error y son específicos del nombre del error. Por ejemplo, un parámetro para el error de conmutación por error de Azure Cosmos DB es la región de lectura que se promoverá a la región de escritura durante el error de la región de escritura. Algunos parámetros son obligatorios, mientras que otros son opcionales.

Los errores se basan en agentes o son directos del servicio en función del tipo de destino. Un error basado en agente requiere que el agente de Chaos Studio esté instalado en una máquina virtual o en un conjunto de escalado de máquinas virtuales. El agente está disponible tanto para Windows como para Linux, pero no todos los errores están disponibles en ambos sistemas operativos. Para obtener información sobre los errores que se admiten en cada sistema operativo, consulte la Biblioteca de acciones y errores de Chaos Studio. Los errores directos del servicio no requieren ningún agente. Se ejecutan directamente en un recurso de Azure.

Los errores también incluyen el nombre del selector que describe los recursos en los que se ejecuta el error. Para obtener más información sobre los selectores, consulte Experimentos de Chaos. Un error solo puede afectar a un recurso si este se ha incorporado como destino y tiene habilitada la funcionalidad de error correspondiente en el recurso.

Pasos siguientes

Ahora que comprende las acciones y los errores, puede: