Falhas e ações no Azure Chaos Studio

No Azure Chaos Studio, cada atividade que acontece como parte de um experimento é chamada de ação. O tipo mais comum de ação é uma falha. Este artigo descreve as ações e as falhas, além das propriedades de cada uma delas.

Ações de experimento

Uma ação é qualquer atividade orquestrada como parte de um experimento de caos. As ações são organizadas em etapas e ramificações, permitindo que as ações sejam executadas sequencialmente ou em paralelo. Cada ação tem as seguintes propriedades:

  • Nome: a ação específica que ocorre. Um nome geralmente assume a forma de uma URN para a ação, por exemplo, urn.
  • Tipo: a maneira como a ação é executada. As ações podem ser contínuas ou discretas. Uma ação contínua é executada sem parar durante um período de tempo. Um exemplo é aplicar pressão de CPU por 10 minutos. Uma ação discreta ocorre apenas uma vez. Um exemplo é reinicializar uma instância do Cache do Azure para Redis.

Tipos de ações

Há duas variedades de ações no Chaos Studio:

  • Falhas: essa ação causa uma interrupção em um ou mais recursos.
  • Atrasos de tempo: Esta ação "espera" sem afetar nenhum recurso. É útil fazer uma pausa entre falhas para aguardar que um sistema seja afetado pela falha anterior.

Falhas

As falhas são a ação mais comum no Chaos Studio. As falhas causam uma interrupção em um sistema, permitindo que você verifique se o sistema lida efetivamente com essa interrupção sem afetar a disponibilidade.

As falhas podem:

  • Seja destrutivo. Por exemplo, uma falha pode matar um processo.
  • Aplique pressão. Por exemplo, uma falha pode adicionar pressão de memória virtual.
  • Adicionar latência.
  • Causar uma alteração de configuração.

Além de um nome e tipo, as falhas também podem ter uma duração, se contínua, e parâmetros. Os parâmetros descrevem como a falha deve ser aplicada e são específicos para o nome da falha. Por exemplo, um parâmetro para a falha de failover do Azure Cosmos DB é a região de leitura que será promovida para a região de gravação durante a falha na região de gravação. Alguns parâmetros são obrigatórios, enquanto outros são opcionais.

As falhas são baseadas em agente ou diretas de serviço, dependendo do tipo de destino. Uma falha baseada em agente requer que o agente do Chaos Studio seja instalado em uma máquina virtual ou em um conjunto de dimensionamento de máquinas virtuais. O agente está disponível para Windows e Linux, mas nem todas as falhas estão disponíveis nos dois sistemas operacionais. Para obter informações sobre quais falhas são suportadas em cada sistema operacional, consulte Biblioteca de ações e falhas do Chaos Studio. Falhas diretas de serviço não exigem nenhum agente. Eles são executados diretamente em um recurso do Azure.

As falhas também incluem o nome do seletor que descreve os recursos contra os quais a falha é executada. Para saber mais sobre seletores, consulte Experimentos do caos. Uma falha só pode afetar um recurso se o recurso tiver sido integrado como destino e tiver o recurso de falha correspondente habilitado no recurso.

Próximas etapas

Agora que você entende ações e falhas, está pronto para: