고가용성 다중 지역 디자인에 대한 권장 사항

이 Azure Well-Architected Framework 안정성 검사 목록 권장 사항에 적용됩니다.

RE:05 특히 중요한 흐름의 경우 다양한 수준에서 중복성을 추가합니다. 식별된 안정성 목표에 따라 컴퓨팅, 데이터, 네트워크 및 기타 인프라 계층에 중복성을 적용합니다.

관련 가이드:가용성 영역 및 지역을 사용한중복성 |

이 가이드에서는 고가용성 다중 지역 클라우드 환경을 설계하기 위한 권장 사항을 설명합니다. 고가용성은 안정성을 위한 설계의 기본 신조입니다. 고가용성 아키텍처를 사용하면 가동 중지 시간을 최대한 방지하고 가동 중지 시간이 발생할 경우 효율적으로 복구할 수 있습니다.

활성-활성활성-수동 은 환경을 배포하는 플랫폼에 따라 다양한 방식으로 적용할 수 있는 일반적인 아키텍처 유형입니다. 이 가이드에서는 다중 지역 클라우드 환경 디자인에 중점을 둡니다. Azure에서는 가용성 영역을 사용하여 단일 지역 내에서 활성-활성 또는 활성-수동 아키텍처를 디자인할 수도 있습니다. 가용성 영역을 사용하여 고가용성 아키텍처를 설계하는 방법에 대한 자세한 지침은 Azure Well-Architected Framework 가이드를 참조하세요.

주요 디자인 전략

활성-활성 및 활성-수동은 고가용성 클라우드 환경을 설계하기 위한 두 가지 기본 방법입니다. 활성-활성 환경은 워크로드를 배포하는 모든 지역에서 프로덕션 부하를 처리하도록 설계되었습니다. 활성-수동 환경은 주 지역에서만 프로덕션 부하를 처리하지만 필요한 경우 보조(수동) 지역으로 장애 조치(failover)하도록 설계되었습니다. 워크로드에 가장 적합한 Azure 지역을 선택하는 것은 고가용성 다중 지역 환경을 설계하는 데 핵심적인 부분입니다. Azure 지역 선택에 대한 지침은 Azure 지역 선택 가이드를 참조하세요.

이 섹션에서는 각 패턴을 평가하고 비즈니스 요구 사항에 맞게 아키텍처를 구체화할 때 고려해야 하는 디자인 옵션에 대해 설명합니다.

반복 가능하고 확장 가능한 방식으로 워크로드를 설계하는 방법에 대한 지침은 배포 스탬프 패턴을 참조하세요. 이 디자인 패턴은 효율적인 관리를 위해 고가용성 디자인을 최적화하는 데 도움이 될 수 있습니다.

다음 섹션에서는 두 패턴의 디자인 옵션에 대해 설명합니다.

활성-활성

  • 용량에서 활성 활성: 둘 이상의 Azure 지역에 미러된 배포 스탬프가 있으며, 각각은 서비스하는 지역 또는 지역에 대한 프로덕션 워크로드를 처리하도록 구성되고 지역 가동 중단 시 다른 지역의 부하를 처리하도록 확장할 수 있습니다.

    • 네트워킹: 대기 시간 또는 가중 글로벌 라우팅을 사용하여 지역 간에 트래픽을 분산합니다.

    • 데이터 복제 및 일관성: 다중 지역 읽기 및 쓰기 기능을 위해 Azure Cosmos DB 와 같은 전역적으로 분산된 데이터 저장소를 사용합니다. 관계형 데이터베이스의 경우 읽기 전용 연결 문자열 이 있는 읽기 가능한 복제본 을 사용합니다.

    • 이 디자인의 이점: 과도하게 프로비전된 디자인보다 운영 비용이 낮습니다.

    • 이 디자인의 단점: 다른 지역에서 가동 중단이 발생하는 경우 전체 부하의 요구에 맞게 스케일 업할 때 사용자 환경의 저하가 발생할 수 있습니다.

  • 활성-활성 오버프로비전: 둘 이상의 Azure 지역에 미러된 배포 스탬프가 있으며, 각각은 서비스하는 지역 또는 지역에 대한 프로덕션 워크로드를 처리하고 지역 가동 중단 시 다른 지역의 부하를 처리하기 위해 과도하게 프로비전되었습니다.

    • 네트워킹: 대기 시간 또는 가중 글로벌 라우팅을 사용하여 지역 간에 트래픽을 분산합니다.

    • 데이터 복제 및 일관성: 다중 지역 읽기 및 쓰기 기능을 위해 Azure Cosmos DB 와 같은 전역적으로 분산된 데이터 저장소를 사용합니다. 관계형 데이터베이스의 경우 읽기 전용 연결 문자열 이 있는 읽기 가능한 복제본 을 사용합니다.

    • 이 디자인의 이점: 가능한 가장 복원력 있는 디자인입니다.

    • 이 디자인의 단점: 확장성 있는 디자인보다 운영 비용이 더 높습니다.

  • 두 디자인의 일반적인 이점: 높은 복원력과 전체 워크로드 중단의 위험이 낮습니다.

  • 두 디자인의 일반적인 단점: 애플리케이션 상태 및 데이터의 동기화 관리 필요성을 포함하여 다양한 요인으로 인한 운영 비용 및 관리 부담이 높습니다.

활성-수동

  • 웜 스페어: 하나의 주 지역과 하나 이상의 보조 지역. 보조 지역은 가능한 최소 컴퓨팅 및 데이터 크기 조정으로 배포되고 로드 없이 실행됩니다. 이 지역은 따뜻한 예비 지역으로 알려져 있습니다. 장애 조치 시 컴퓨팅 및 데이터 리소스는 주 지역의 부하를 처리하도록 크기가 조정됩니다.

    • 네트워킹: 우선 순위 글로벌 라우팅을 사용합니다.

    • 데이터 복제 및 일관성: 수동 지역에 데이터베이스를 복제하고 Azure Cosmos DBAzure SQL Database와 같은 PaaS(Platform as a Service) 솔루션의 자동 장애 조치(failover) 기능을 사용합니다.

    • 이 디자인의 이점: 활성-수동 디자인 중 가장 짧은 복구 시간입니다.

    • 이 디자인의 단점: 활성-수동 디자인 중에서 가장 높은 운영 비용입니다.

  • 콜드 스페어: 하나의 주 지역 및 하나 이상의 보조 지역입니다. 보조 지역은 전체 부하를 처리하도록 크기가 조정되지만 모든 컴퓨팅 리소스가 중지됩니다. 이 지역은 콜드 스페어 지역이라고 합니다. 장애 조치(failover) 전에 리소스를 시작해야 합니다.

    • 네트워킹: 우선 순위 글로벌 라우팅을 사용합니다.

    • 데이터 복제 및 일관성: 수동 지역에 데이터베이스를 복제하고 Azure Cosmos DBAzure SQL Database와 같은 PaaS 솔루션의 자동 장애 조치(failover) 기능을 사용합니다.

    • 이 디자인의 이점: 웜 스페어 디자인보다 운영 비용이 낮습니다.

    • 이 디자인의 단점: 웜 스페어 디자인보다 복구 시간이 길다.

  • 재해에 대해 다시 배포: 하나의 주 지역 및 하나 이상의 보조 지역. 필요한 네트워킹만 보조 지역에 배포됩니다. 운영자는 워크로드를 장애 조치하려면 보조 지역에서 프로비저닝 스크립트를 실행해야 합니다. 이 디자인을 재해에 대한 재배포라고 합니다.

    • 네트워킹: 우선 순위 글로벌 라우팅을 사용합니다.

    • 데이터 복제 및 일관성: 새 데이터베이스 인스턴스를 배포하고 백업에서 데이터를 리하이딩합니다.

    • 이 디자인의 이점: 운영 비용이 가장 낮습니다.

    • 이 디자인의 단점: 가장 긴 복구 시간입니다.

  • 활성-수동 설계의 일반적인 이점: 활성-활성 디자인보다 운영 비용이 낮고 일상적인 관리 부담이 줄어듭니다. 애플리케이션 상태를 동기화할 필요가 없습니다.

  • 활성-수동 디자인의 일반적인 단점: 더 길고 복잡한 복구 프로세스입니다. 성공적인 장애 조치(failover)를 위해 수동 개입이 필요할 가능성이 높습니다.

참고

고가용성 디자인에 관계없이 Azure DevOps 인프라, 점프 상자, 모니터링 및 워크로드를 관리하는 데 필요한 기타 중요한 서비스와 같은 서비스를 지원하기 위한 중복성을 구성해야 합니다.

Azure 촉진

  • Azure Front Door 는 Azure Traffic Manager의 글로벌 라우팅 기능을 콘텐츠 배달 시스템 및 웹 애플리케이션 방화벽과 결합하여 고가용성 워크로드를 관리하는 데 도움이 됩니다.

  • Azure Cosmos DB 는 전 세계적으로 분산된 NoSQL 데이터베이스 플랫폼으로, 활성-활성 환경을 실행하고 지역 가동 중단이 발생할 때 가동 중지 시간을 최소화할 수 있습니다.

안정성 검사 목록

전체 권장 사항 집합을 참조하세요.