다음을 통해 공유


클라우드 규모 분석을 위한 비즈니스 연속성 및 재해 복구

클라우드 서비스를 위한 아키텍처를 설계할 때 가용성 요구 사항과 잠재적인 서비스 중단에 대응하는 방법을 고려합니다. 문제는 특정 인스턴스 또는 지역 전체에 국한될 수 있습니다. 둘 다에 대한 계획을 갖는 것이 중요합니다. 복구 시간 목표와 복구 지점 목표에 따라 고가용성 및 재해 복구를 위해 공격적인 전략을 선택할 수 있습니다.

고가용성 및 재해 복구는 경우에 따라 결합될 수 있습니다. 두 영역은 특히 데이터와 관련하여 약간 다른 전략을 가지고 있습니다. 자세한 내용은 Microsoft Azure Well-Architected Framework안정성 원칙을 참조하세요.

실패를 방지하려고 하는 대신 실패가 발생할 수 있고 실제로 발생할 수 있음을 미리 인지합니다. 수명 주기에서 단일 오류 구성 요소의 영향을 최소화합니다. 비용 허용 오차, 복구 지점 목표 및 복구 시간 목표에 따라 구현할 솔루션 유형이 결정됩니다.

백업 전략

다양한 대체 전략은 지역에 걸쳐 분산된 컴퓨팅을 구현하는 데 사용할 수 있습니다. 전략은 애플리케이션의 비즈니스 요구 사항과 상황에 맞게 조정되어야 합니다. 높은 수준에서 방법은 다음 범주에 속합니다.

  • 백업 및 복원: 재해 이전의 마지막 백업 복사본에서 데이터베이스 애플리케이션을 복원합니다. 이 방법은 일반적으로 데이터 손상 또는 실수로 삭제된 후에 사용됩니다.

  • 재해 발생 시 재배포: 재해 발생 시 처음부터 애플리케이션을 재배포합니다. 이 방법은 복구 시간이 보장되지 않아도 되는 중요하지 않은 애플리케이션에 적합합니다.

  • 웜 스페어(활성/수동): 대체 지역에 보조 호스티드 서비스를 만듭니다. 최소 용량을 보장하기 위해 역할을 배포합니다. 역할은 프로덕션 트래픽을 수신하지 않습니다. 이 방법은 지역 간에 트래픽을 분산하도록 설계되지 않은 애플리케이션에 유용합니다.

  • 핫 스페어(활성/활성): 여러 지역에서 프로덕션 로드를 수신하도록 애플리케이션을 설계합니다. 재해 복구 목적에 필요한 것보다 더 많은 용량을 위해 각 지역의 클라우드 서비스를 구성할 수 있습니다. 대신 재해 및 장애 조치(failover) 시 필요에 따라 클라우드 서비스를 스케일 아웃할 수 있습니다.

    이 방법은 애플리케이션 설계에 대한 투자가 필요하지만 이점이 있습니다. 낮고 보장된 복구 시간을 제공합니다. 모든 복구 위치와 효율적인 용량 사용에 대한 지속적인 테스트가 있습니다. 데이터베이스 애플리케이션의 경우 이 방법에는 단일 연결점과 동기화하는 두 데이터베이스에 대한 부하 분산 장치가 포함됩니다.

Azure 서비스에 대한 재해 복구 및 고가용성

다음 섹션에서는 다양한 Azure 서비스에 대해 설명합니다.

Azure Cosmos DB

Azure Cosmos DB의 고가용성에 대한 개요는 Azure Cosmos DB가 고가용성을 제공하는 방법을 참조하세요.

Azure 데이터 팩터리

데이터 통합 및 데이터 제품에는 Azure Data Factory에 연결된 Azure DevOps 리포지토리가 있을 수 있습니다. 가동 중지 시간을 최소화하면서 파이프라인을 다른 Data Factory에 배포할 수 있습니다. GitHub 및 Azure DevOps 리포지토리와 별도로 코드 버전 제어 소프트웨어를 사용하려면 Azure Data Factory SDK를 사용하여 파이프라인 및 기타 Azure Data Factory 개체를 작성합니다.

Azure 데이터 레이크

Azure Data Lake Storage Gen2는 이미 지역화된 하드웨어 오류를 막기 위해 3배 복제를 지원합니다. ZRS(영역 중복 스토리지) 또는 GZRS(지역 영역 중복 스토리지)와 같은 다른 복제 옵션은 고가용성을 개선시킵니다. GRS(지역 중복 스토리지) 및 RA-GRS(읽기 액세스 지역 중복 스토리지)는 재해 복구를 개선합니다. 고가용성을 위해 서비스 중단이 있는 경우 워크로드는 가능한 한 빨리 최신 데이터에 액세스해야 합니다. 워크로드는 복제된 인스턴스를 로컬로 전환하거나 새 지역으로 전환할 수 있습니다.

RA-GRS 또는 GRS로 구성된 스토리지 계정은 재해 복구 계획의 일부일 수 있지만 RPO(복구 지점 목표) 및 RTO(복구 시간 목표)를 분석하고 데이터를 두 개의 다른 Azure 지역에 복사하는 이중 로드 시나리오와 같은 다른 옵션을 검토하는 실사가 필요합니다.

각 데이터 랜딩 존에는 데이터 제품에 대한 복구 지점 목표가 있어야 합니다. 각 데이터 랜딩 존에는 사용 사례에 대해 정의된 복제 전략이 있어야 합니다.

참고

고객 관리 계정 장애 조치(failover)는 계층 구조 네임스페이스가 있는 계정(Azure Data Lake Storage Gen2)에서 아직 지원되지 않습니다.

주 지역에 영향을 미치는 재해가 발생하는 경우 Microsoft는 계층 구조 네임스페이스가 있는 계정에 대한 장애 조치(failover)를 관리합니다.

자세한 내용은 재해 복구 및 저장소 계정 장애 조치(failover)를 참조하세요.

Azure Databricks

Azure Databricks 클러스터의 재해 복구 아키텍처에 대한 개요는 Azure Databricks 클러스터의 지역 재해 복구를 참조하세요.

Azure Machine Learning

Azure Machine Learning의 고가용성에 대한 개요는 비즈니스 연속성 및 재해 복구를 위한 장애 조치(failover)를 참조하세요.

Azure Key Vault

Azure Key Vault는 가용성을 유지하고 데이터 손실을 방지할 수 있도록 하는 기능을 제공합니다. 중요한 비즈니스 타당성이 있는 경우에만 비밀을 백업합니다. 키 자격 증명 모음에서 비밀을 백업하면 비밀이 만료되거나 순환될 때 여러 로그, 권한 및 백업 집합을 유지 관리하는 것과 같은 운영상의 문제가 발생할 수 있습니다. 자세한 내용은 Azure Key Vault 백업을 참조하세요.

Key Vault는 재해 시나리오에서 가용성을 유지합니다. 사용자의 개입 없이 쌍을 이루는 영역에 대한 요청을 장애 조치(failover)합니다. 자세한 내용은 Azure Key Vault 가용성 및 중복성을 참조하세요. 또는 적절한 권한이 있는 보조 자격 증명 모음에 비밀 및 기타 Key Vault 아티팩트를 저장하는 것을 고려할 수 있습니다. 이 패턴은 자격 증명 모음이 애플리케이션과 동일한 지역에 있어야 하는 애플리케이션에 적합할 수 있습니다.

Azure SQL Database

Azure SQL Database를 사용한 비즈니스 연속성에 대한 개요는 Azure SQL Database를 사용한 비즈니스 연속성 개요를 참조하세요.

Azure Synapse Analytics

Azure Synapse Analytics의 비즈니스 연속성에 대한 개요는 Azure Synapse Analytics의 고가용성을 참조하세요.

다음 단계