Fel och åtgärder i Azure Chaos Studio

I Azure Chaos Studio kallas varje aktivitet som sker som en del av ett experiment en åtgärd. Den vanligaste typen av åtgärd är ett fel. Den här artikeln beskriver åtgärder och fel och egenskaperna för var och en.

Experimentåtgärder

En åtgärd är alla aktiviteter som samordnas som en del av ett kaosexperiment. Åtgärder organiseras i steg och grenar, vilket gör att åtgärder kan köras sekventiellt eller parallellt. Varje åtgärd har följande egenskaper:

  • Namn: Den specifika åtgärd som äger rum. Ett namn har vanligtvis formen av ett URN för åtgärden, till exempel urn.
  • Typ: Hur åtgärden körs. Åtgärder kan vara antingen kontinuerliga eller diskreta. En kontinuerlig åtgärd körs nonstop över en tidsperiod. Ett exempel är att tillämpa cpu-tryck i 10 minuter. En diskret åtgärd inträffar bara en gång. Ett exempel är att starta om en Azure Cache for Redis-instans.

Typer av åtgärder

Det finns två typer av åtgärder i Chaos Studio:

  • Fel: Den här åtgärden orsakar avbrott i en eller flera resurser.
  • Tidsfördröjningar: Den här åtgärden "väntar" utan att påverka några resurser. Det är användbart för att pausa mellan fel för att vänta tills ett system påverkas av det tidigare felet.

Fel

Fel är den vanligaste åtgärden i Chaos Studio. Fel orsakar ett avbrott i ett system, vilket gör att du kan kontrollera att systemet effektivt hanterar den störningen utan att påverka tillgängligheten.

Fel kan:

  • Var destruktiv. Ett fel kan till exempel döda en process.
  • Tryck. Ett fel kan till exempel öka trycket på virtuellt minne.
  • Lägg till svarstid.
  • Orsaka en konfigurationsändring.

Förutom ett namn och en typ kan fel också ha en varaktighet, om de är kontinuerliga, och parametrar. Parametrar beskriver hur felet ska tillämpas och är specifika för felnamnet. En parameter för redundansfelet i Azure Cosmos DB är till exempel den läsregion som kommer att befordras till skrivregionen under fel i skrivregionen. Vissa parametrar krävs medan andra är valfria.

Fel är antingen agentbaserade eller tjänstdirigering beroende på måltyp. Ett agentbaserat fel kräver att Chaos Studio-agenten installeras på en virtuell dator eller vm-skalningsuppsättning. Agenten är tillgänglig för både Windows och Linux, men alla fel är inte tillgängliga på båda operativsystemen. Information om vilka fel som stöds på varje operativsystem finns i Fel- och åtgärdsbiblioteket i Chaos Studio. Tjänstdirigeringsfel kräver ingen agent. De körs direkt mot en Azure-resurs.

Fel inkluderar även namnet på väljaren som beskriver de resurser som felet körs mot. Mer information om väljare finns i Kaosexperiment. Ett fel kan bara påverka en resurs om resursen har registrerats som ett mål och har motsvarande felfunktion aktiverad på resursen.

Nästa steg

Nu när du förstår åtgärder och fel är du redo att: