Azure Chaos Studio의 오류 및 작업

Azure Chaos Studio에서 실험의 일부로 발생하는 모든 활동을 작업이라고 합니다. 가장 일반적인 작업 유형은 오류입니다. 이 문서에서는 작업 및 오류 및 각 의 속성에 대해 설명합니다.

실험 작업

작업은 비정상 상황 실험의 일부로 오케스트레이션되는 모든 활동입니다. 작업은 단계 및 분기로 구성되어 순차적으로 또는 병렬로 실행할 수 있습니다. 모든 작업에는 다음과 같은 속성이 있습니다.

  • 이름: 발생하는 특정한 작업입니다. 이름은 일반적으로 작업에 대한 URN 형식을 사용합니다(예: urn).
  • 형식: 작업이 실행되는 방식입니다. 작업은 연속 또는 불연속일 수 있습니다. 연속 작업은 일정 기간 동안 논스톱으로 실행됩니다. 예를 들어 10분 동안 CPU 압력을 적용하는 경우가 있습니다. 불연속 작업은 한 번만 발생합니다. 예를 들면 Azure Cache for Redis 인스턴스를 재부팅하는 것입니다.

동작 유형

Chaos Studio에는 두 가지 종류의 작업이 있습니다.

  • 오류: 이 작업을 수행하면 하나 이상의 리소스가 중단됩니다.
  • 시간 지연: 이 작업은 리소스에 영향을 주지 않고 "대기"합니다. 시스템이 이전 오류의 영향을 받을 때까지 기다리기 위해 오류 간에 일시 중지하는 데 유용합니다.

오류

오류는 Chaos Studio에서 가장 일반적인 작업입니다. 오류로 인해 시스템 중단이 발생하며, 그러면 시스템이 가용성에 영향을 주지 않고 해당 중단을 효과적으로 처리하는지 확인할 수 있습니다.

오류는 다음을 수행할 수 있습니다.

  • 파괴적이어야 합니다. 예를 들어 오류가 프로세스를 종료할 수 있습니다.
  • 압력을 가합니다. 예를 들어 오류는 가상 메모리 압력을 추가할 수 있습니다.
  • 대기 시간을 추가합니다.
  • 구성을 변경합니다.

이름 및 형식 외에도, 오류에는 지속 시간(연속적인 경우) 및 매개 변수가 있을 수 있습니다. 매개 변수는 오류를 적용해야 하는 방법을 설명하며 오류 이름에만 적용됩니다. 예를 들어 Azure Cosmos DB 장애 조치(failover) 오류에 대한 매개 변수는 쓰기 지역 실패 시 쓰기 지역으로 승격되는 읽기 지역입니다. 일부 매개 변수는 필수이고 나머지 매개 변수는 선택 사항입니다.

오류는 대상 유형에 따라 에이전트 기반 또는 서비스 직접입니다. 에이전트 기반 오류를 사용하려면 Chaos Studio 에이전트를 가상 머신 또는 가상 머신 확장 집합에 설치해야 합니다. 에이전트는 Windows와 Linux 모두에서 사용할 수 있지만 모든 오류를 두 운영 체제에서 모두 사용할 수 있는 것은 아닙니다. 각 운영 체제에서 지원되는 오류에 대한 자세한 내용은 Chaos Studio 오류 및 작업 라이브러리를 참조하세요. 서비스 직접 오류에는 에이전트가 필요하지 않습니다. Azure 리소스에 대해 직접 실행됩니다.

오류에는 오류가 실행될 리소스를 설명하는 선택기 이름도 포함됩니다. 선택기에 대한 자세한 내용은 Chaos 실험을 참조하세요. 리소스가 대상으로 온보딩되고 해당 오류 기능이 리소스에서 사용하도록 설정된 경우에만 오류가 리소스에 영향을 미칠 수 있습니다.

다음 단계

이제 작업 및 오류를 이해했으므로 다음을 수행할 준비가 되었습니다.