개요
이 시리즈는 조직이 Azure 엔터프라이즈 데이터 플랫폼에 대한 DR(재해 복구) 전략을 설계하는 방법에 대한 예시 예제를 제공합니다.
- 이 문서 시리즈는 Microsoft의 클라우드 채택 프레임워크 Azure 잘 설계된 프레임워크 및 비즈니스 연속성 관리에서 제공하는 지침을 보완합니다.
Azure는 재해 발생 시 서비스 연속성을 제공할 수 있는 광범위한 복원력 옵션을 제공합니다. 그러나 서비스 수준이 높을수록 복잡성과 비용 프리미엄이 발생할 수 있습니다. 비용 및 복원력과 복잡성의 장단점에는 DR과 관련된 대부분의 고객의 주요 의사 결정 요인이 있습니다.
Azure 플랫폼에서 가끔 지점 오류가 발생하지만 Microsoft의 Azure 데이터 센터 및 Azure 서비스에는 여러 계층의 중복성이 기본 제공되어 있습니다. 모든 오류는 일반적으로 범위에서 제한되며 일반적으로 몇 시간 내에 수정됩니다. 지금까지 ID 관리와 같은 주요 서비스가 전체 Azure 지역이 오프라인 상태가 아닌 서비스 문제를 경험할 가능성이 훨씬 더 높습니다.
또한 사이버 공격, 특히 랜섬웨어는 이제 모든 최신 데이터 에코시스템에 실질적인 위협이 되며 데이터 플랫폼 중단을 초래할 수 있음을 인식해야 합니다. 이 시리즈의 범위를 벗어나는 반면, 고객은 데이터 플랫폼의 보안 및 복원력 디자인의 일부로 이러한 공격에 대한 제어를 구현하는 것이 좋습니다.
- 랜섬웨어 보호에 대한 Microsoft 지침은 Azure 클라우드 기본 사항에서 사용할 수 있습니다.
Scope
이 문서 시리즈의 범위에는 다음이 포함됩니다.
- 고객의 예시 가상 사용자에 대한 물리적 재해로부터 Azure 데이터 플랫폼의 서비스 복구 이 설명 고객은 다음과 같습니다.
- ITIL(정보 기술 인프라 라이브러리) 기반 서비스 관리 방법론에 따라 정의된 운영 지원 기능이 있는 중간 규모의 조직입니다.
- 클라우드 네이티브가 아니라 핵심 엔터프라이즈, 액세스 및 인증 관리 및 인시던트 관리와 같은 공유 서비스가 온-프레미스에 남아 있습니다.
- 자동화를 통해 사용하도록 설정된 Azure로 클라우드 마이그레이션을 진행합니다.
- Azure 데이터 플랫폼은 고객의 Azure 테넌시 내에서 다음과 같은 디자인을 구현했습니다.
- 엔터프라이즈 랜딩 존 – 네트워킹, 모니터링, 보안 등을 비롯한 플랫폼 기반 제공
- Azure 분석 플랫폼 - 서비스에서 제공하는 다양한 솔루션 및 데이터 제품을 지원하는 데이터 구성 요소를 제공합니다.
- 이 문서에 설명된 프로세스는 전문 Azure SME(주체 전문가)가 아닌 Azure 기술 리소스에 의해 실행됩니다. 따라서 리소스에는 다음과 같은 수준의 지식/기술이 있어야 합니다.
- Azure 기본 사항 – Azure, 핵심 서비스 및 데이터 구성 요소에 대한 실무 지식
- Azure DevOps에 대한 실무 지식 소스 제어를 탐색하고 파이프라인 배포를 실행할 수 있습니다.
- 이 문서에서 설명하는 이 프로세스는 주 지역에서 보조 지역으로 서비스 장애 조치(failover) 작업을 다룹니다.
범위를 벗어남
다음 항목은 이 문서 시리즈의 범위를 벗어난 것으로 간주됩니다.
- 보조 지역에서 주 지역으로의 대체 프로세스입니다.
- 비 Azure 애플리케이션, 구성 요소 또는 시스템 – 온-프레미스, 다른 클라우드 공급업체, 타사 웹 서비스 등을 포함하지만 이에 국한되지 않습니다.
- 이러한 서비스에 대한 종속성에 관계없이 온-프레미스 네트워크, 게이트웨이, 엔터프라이즈 공유 서비스 등의 업스트림 서비스를 복구합니다.
- 이러한 서비스에 대한 종속성에 관계없이 온-프레미스 운영 시스템, 타사 보고 시스템, 데이터 모델링 또는 데이터 과학 애플리케이션 등의 다운스트림 서비스를 복구합니다.
- 랜섬웨어 복구 또는 유사한 데이터 보안 인시던트 복구 를 포함한 데이터 손실 시나리오
- 데이터 백업 전략 및 데이터 복원 계획
- DR 이벤트의 근본 원인 설정
- Azure 서비스/구성 요소 인시던트에서 Microsoft는 상태 - 기록 웹 페이지 내에 "근본 원인 분석"을 게시합니다.
주요 가정
이 DR 작동 예제의 주요 가정은 다음과 같습니다.
- 조직은 Azure 데이터 플랫폼의 운영 지원을 위해 ITIL 기반 서비스 관리 방법을 따릅니다.
- 조직에는 IT 자산에 대한 서비스 복원 프레임워크의 일부로 기존 재해 복구 프로세스가 있습니다.
- IaC(Infrastructure as Code) 는 Azure DevOps 또는 이와 유사한 자동화 서비스에서 사용하도록 설정된 Azure 데이터 플랫폼을 배포하는 데 사용되었습니다.
- Azure 데이터 플랫폼에서 호스팅하는 각 솔루션은 RPO(복구 지점 목표), RTO(복구 시간 목표) 및 MTTR(평균 복구 시간) 메트릭에 대한 명확한 서비스 요구 사항을 제공하여 비즈니스 영향 평가 또는 이와 유사한 작업을 완료했습니다.
다음 단계
이제 시나리오에 대해 개략적으로 배웠으므로 사용 사례에 맞게 설계된 아키텍처에 대해 알아볼 수 있습니다.