Falhas e ações no Azure Chaos Studio

No Azure Chaos Studio, cada atividade que acontece como parte de um experimento é chamada de ação. O tipo mais comum de ação é uma falha. Este artigo descreve ações e falhas e as propriedades de cada uma.

Ações experimentais

Uma ação é qualquer atividade orquestrada como parte de um experimento de caos. As ações são organizadas em etapas e ramificações, permitindo que as ações sejam executadas sequencialmente ou em paralelo. Cada ação tem as seguintes propriedades:

  • Nome: A ação específica que ocorre. Um nome geralmente assume a forma de uma URN para a ação, por exemplo, urn.
  • Tipo: A maneira como a ação é executada. As ações podem ser contínuas ou discretas. Uma ação contínua é executada ininterruptamente durante um período de tempo. Um exemplo é a aplicação de pressão da CPU por 10 minutos. Uma ação discreta ocorre apenas uma vez. Um exemplo é a reinicialização de uma instância do Cache do Azure para Redis.

Tipos de ações

Existem duas variedades de ações no Chaos Studio:

  • Falhas: Esta ação causa uma interrupção em um ou mais recursos.
  • Atrasos de tempo: Esta ação "espera" sem afetar quaisquer recursos. É útil para pausar entre falhas para esperar que um sistema seja afetado pela falha anterior.

Falhas

As falhas são a ação mais comum no Chaos Studio. As falhas causam uma interrupção em um sistema, permitindo que você verifique se o sistema lida efetivamente com essa interrupção sem afetar a disponibilidade.

As falhas podem:

  • Seja destrutivo. Por exemplo, uma falha pode matar um processo.
  • Aplique pressão. Por exemplo, uma falha pode adicionar pressão de memória virtual.
  • Adicionar latência.
  • Cause uma alteração de configuração.

Além de um nome e tipo, as falhas também podem ter uma duração, se contínua, e parâmetros. Os parâmetros descrevem como a falha deve ser aplicada e são específicos para o nome da falha. Por exemplo, um parâmetro para a falha de failover do Azure Cosmos DB é a região de leitura que será promovida para a região de gravação durante a falha da região de gravação. Alguns parâmetros são necessários, enquanto outros são opcionais.

As falhas são baseadas em agente ou diretas ao serviço, dependendo do tipo de destino. Uma falha baseada em agente requer que o agente do Chaos Studio seja instalado em uma máquina virtual ou em um conjunto de dimensionamento de máquina virtual. O agente está disponível para Windows e Linux, mas nem todas as falhas estão disponíveis em ambos os sistemas operacionais. Para obter informações sobre quais falhas são suportadas em cada sistema operacional, consulte Biblioteca de falhas e ações do Chaos Studio. As falhas diretas de serviço não exigem nenhum agente. Eles são executados diretamente em um recurso do Azure.

As falhas também incluem o nome do seletor que descreve os recursos contra os quais a falha é executada. Para saber mais sobre seletores, consulte Experimentos do caos. Uma falha só pode afetar um recurso se o recurso tiver sido integrado como destino e tiver a capacidade de falha correspondente habilitada no recurso.

Próximos passos

Agora que você entende as ações e falhas, está pronto para: