안정성을 위한 디자인 검토 검사 목록

이 검사 목록은 아키텍처 디자인에서 안정성, 복원력 및 실패 복구 전략을 평가하는 데 사용할 권장 사항 집합을 제공합니다. 안정성을 보장하려면 워크로드에 가장 적합한 인프라 및 애플리케이션 디자인을 식별합니다. 가용성 및 복구 가능성 대상 메트릭에 매핑되는 비즈니스 요구 사항에 따라 이러한 결정을 내립니다.

신뢰할 수 있는 디자인을 구현하려면 디자인에서 의사 결정 지점을 철저히 고려하고 이러한 결정이 워크로드에 미치는 영향을 알고 있어야 합니다. 이 검사 목록 및 함께 제공되는 가이드는 이러한 결정을 내리는 데 도움이 되는 리소스를 제공합니다. 워크로드 설계, 개발 및 작업 수명 주기 전반에 걸쳐 워크로드 안정성을 중앙에서 고려합니다.

검사 목록

복원력 있고 관리 가능하며 반복 가능한 워크로드를 설계할 수 있도록 안정성에 중점을 두고 디자인에 접근합니다. 안정성 사례를 포함하지 않고 절충을 고려하면 디자인이 잠재적으로 위험에 처할 수 있습니다. 시스템의 성공에 대한 확신을 심어주기 위해 검사 목록에 포함된 모든 사항을 신중하게 고려합니다.

  코드 권장
RE:01 비즈니스 목표에 맞게 워크로드를 설계하고 불필요한 복잡성 또는 오버헤드를 방지합니다. 실용적이고 균형 잡힌 접근 방식을 사용하여 원하는 결과를 제공하는 디자인 결정을 내릴 수 있습니다. 비효율성과 잠재적인 문제를 줄이기 위해 필수품에 디자인을 포함합니다.
RE:02 사용자 및 시스템 흐름을 식별하고 평가합니다. 비즈니스 요구 사항에 따라 중요도 규모를 사용하여 흐름의 우선 순위를 지정합니다.
RE:03 FMA(오류 모드 분석)를 사용하여 솔루션 구성 요소에서 잠재적인 오류를 식별하고 우선 순위를 지정합니다. FMA를 수행하여 각 실패 모드의 위험 및 효과를 평가할 수 있습니다. 워크로드가 응답하고 복구하는 방법을 결정합니다.
RE:04 구성 요소, 흐름 및 전체 솔루션에 대한 안정성 및 복구 대상을 정의합니다. 목표를 시각화하여 이상적인 상태를 달성하기 위해 협상하고, 합의를 도출하고, 기대치를 설정하고, 작업을 추진 합니다. 정의된 대상을 사용하여 상태 모델을 빌드합니다. 상태 모델은 정상 상태, 성능 저하 및 비정상 상태를 정의합니다.
RE:05
RE:05
RE:05
특히 중요한 흐름의 경우 다양한 수준에서 중복성을 추가합니다. 식별된 안정성 목표에 따라 컴퓨팅, 데이터, 네트워크 및 기타 인프라 계층에 중복성을 적용합니다.
RE:06
RE:06
애플리케이션, 데이터 및 인프라 수준에서 시기 적절하게 안정적인 크기 조정 전략을 구현합니다.
RE:07
RE:07
RE:07
자체 보존 및 자가 복구 조치를 구현하여 워크로드의 복원력과 복구 가능성을 강화합니다. 인프라 기반 안정성 패턴 및 소프트웨어 기반 디자인 패턴을 사용하여 구성 요소 오류 및 일시적인 오류를 처리하여 솔루션에 기능을 빌드합니다. 시스템에 기능을 빌드하여 솔루션 구성 요소 오류를 감지하고 워크로드가 전체 또는 감소된 기능에서 계속 작동하는 동안 자동으로 수정 작업을 시작합니다.
RE:08 테스트 및 프로덕션 환경에서 카오스 엔지니어링 원칙을 적용하여 복원력 및 가용성 시나리오를 테스트합니다. 테스트를 사용하여 활성 오작동 및 시뮬레이션된 부하 테스트를 수행하여 정상적인 성능 저하 구현 및 크기 조정 전략이 효과적인지 확인합니다.
RE:09 복구 대상에 부합하는 BCDR(구조적, 테스트 및 문서화된 비즈니스 연속성 및 재해 복구) 계획을 구현합니다. 계획은 모든 구성 요소와 시스템 전체를 포함해야 합니다.
RE:10 솔루션의 상태 신호를 측정하고 모델링합니다. 워크로드 전체와 개별 구성 요소 및 키 흐름에서 가동 시간 및 기타 안정성 데이터를 지속적으로 캡처합니다.

다음 단계

안정성 절충을 검토하여 다른 개념을 살펴보는 것이 좋습니다.