Microsoft Fabric의 안정성
이 문서에서는 Microsoft Fabric의 안정성 지원을 설명하고 가용성 영역을 통한 지역 복원력과 지역 간 복구 및 비즈니스 연속성을 모두 설명합니다. Azure의 안정성에 대한 포괄적인 개요는 Azure 안정성을 참조하세요.
가용성 영역 지원
Azure 가용성 영역은 각 Azure 지역 내에서 물리적으로 분리된 세 개 이상의 데이터 센터 그룹입니다. 각 영역 내의 데이터 센터에는 독립적인 전원, 냉각, 네트워킹 인프라가 장착되어 있습니다. 가용성 영역은 로컬 영역이 실패한 경우에 한 영역이 영향을 받는 경우 나머지 두 영역에서 지역 서비스, 용량 및 고가용성을 지원하도록 설계되었습니다.
오류는 소프트웨어 및 하드웨어 오류에서 지진, 홍수 및 화재와 같은 이벤트에 이르기까지 다양합니다. Azure 서비스의 중복성과 논리적 격리로 인해 오류 허용성에 도달합니다. Azure의 가용성 영역에 대한 자세한 내용은 지역 및 가용성 영역을 참조하세요.
Azure 가용성 영역 지원 서비스는 적절한 수준의 복원력과 유연성을 제공하도록 설계되었습니다. 두 가지 방법으로 구성할 수 있습니다. 영역 간 자동 복제를 사용하는 영역 중복 또는 특정 영역에 고정된 인스턴스를 사용하는 영역일 수 있습니다. 이러한 방식을 결합할 수도 있습니다. 영역 및 영역 중복 아키텍처에 대한 자세한 내용은 가용성 영역 및 지역 사용에 대한 권장 사항을 참조하세요.
Fabric은 사용자가 설정하거나 구성할 필요 없이 리소스가 영역 간에 자동으로 복제되는 영역 중복 가용성 영역을 지원하기 위해 상업적으로 합리적인 노력을 기울이고 있습니다.
필수 조건
- 현재 Fabric은 제한된 수의 지역에서 부분 가용성 영역 지원을 제공합니다. 이 부분 가용성 영역 지원은 환경(및/또는 환경 내 특정 기능)을 다룹니다.
- 이벤트 스트림과 같은 환경은 가용성 영역을 지원하지 않습니다.
- OneLake를 사용하는 경우 데이터 엔지니어링에서 가용성 영역을 지원합니다. ADLS Gen2와 같은 다른 데이터 원본을 사용하는 경우 ZRS(영역 중복 스토리지)가 사용하도록 설정되어 있는지 확인해야 합니다.
- 영역 가용성은 패브릭 환경 및/또는 미리 보기에 있는 기능/기능에 사용할 수 있거나 제공되지 않을 수 있습니다.
- Power BI의 온-프레미스 게이트웨이 및 대규모 의미 체계 모델은 가용성 영역을 지원하지 않습니다.
- Data Factory(파이프라인)는 서유럽의 가용성 영역을 지원하지만 영역 중단 시 신규 또는 진행 중인 파이프라인 실행이 실패할 수 있습니다.
지원되는 지역
Fabric은 다음과 같이 다양한 지역에서 가용성 영역 지원을 제공하기 위해 상업적으로 합리적인 노력을 기울이고 있습니다.
아메리카 | Power BI | 데이터 마트 | Data Warehouse | 실시간 분석 | Data Factory 파이프라인 | 데이터 엔지니어링 |
---|---|---|---|---|---|---|
브라질 남부 | ||||||
캐나다 중부 | ||||||
미국 중부 | ||||||
미국 동부 | ||||||
미국 동부 2 | ||||||
미국 중남부 | ||||||
미국 서부 2 | ||||||
미국 서부 3 | ||||||
유럽 | ||||||
프랑스 중부 | ||||||
독일 중서부 | ||||||
이탈리아 북부 | ||||||
북유럽 | ||||||
노르웨이 동부 | ||||||
폴란드 중부 | ||||||
영국 남부 | ||||||
서유럽 | ||||||
중동 | ||||||
카타르 중부 | ||||||
이스라엘 중부 | ||||||
아프리카 | ||||||
남아프리카 북부 | ||||||
아시아 태평양 | ||||||
오스트레일리아 동부 | ||||||
일본 동부 | ||||||
동남 아시아 |
영역 다운 환경
영역 전체 가동 중단 동안에는 영역 복구 중에 아무 작업도 필요하지 않습니다. 지원되는 지역에 나열된 지역에서는 Fabric 기능이 정상 영역을 활용하기 위해 자동으로 자체 복구되고 재조정됩니다. 마스터 노드가 실패한 영역에 있는 경우 Spark 작업을 실행하지 못할 수 있습니다. 이 경우 작업을 다시 제출해야 합니다.
Important
Microsoft에서는 균일하고 일관된 가용성 영역 지원을 제공하기 위해 노력하고 있지만, 가용성 영역 장애가 발생할 경우 고객 수요의 변동 폭이 큰 Azure 지역에 있는 Fabric 용량의 대기 시간은 일반적인 대기 시간보다 더 길 수 있습니다.
지역 간 재해 복구 및 비즈니스 연속성
DR(재해 복구)은 가동 중지 시간 및 데이터 손실을 초래하는 자연 재해 또는 실패한 배포와 같은 영향이 큰 이벤트로부터 복구하는 것입니다. 원인에 관계없이 최상의 재해 해결책은 잘 정의되고 테스트된 DR 계획과 DR을 적극적으로 지원하는 애플리케이션 디자인입니다. 재해 복구 계획을 만들기 전에 재해 복구 전략을 디자인하기 위한 권장 사항을 참조하세요.
DR과 관련하여 Microsoft는 공유 책임 모델을 사용합니다. 공유 책임 모델에서 Microsoft는 기준 인프라 및 플랫폼 서비스를 사용할 수 있도록 보장합니다. 동시에 많은 Azure 서비스는 데이터를 자동으로 복제하거나 실패한 지역에서 대체하여 사용하도록 설정된 다른 지역으로 교차 복제하지 않습니다. 이러한 서비스의 경우 자신의 워크로드에 적합한 재해 복구 계획을 설정할 책임이 있습니다. Azure PaaS(Platform as a Service) 제품에서 실행되는 대부분의 서비스는 DR을 지원하는 기능과 지침을 제공하며, 서비스별 기능을 사용하여 빠른 복구를 지원하여 DR 계획을 개발하는 데 도움이 될 수 있습니다.
이 섹션에서는 계획에 없는 지역 재해가 발생할 때 조직에서 데이터를 안전하고 액세스 가능한 상태로 지킬 수 있도록 설계된 Fabric의 재해 복구 계획에 대해 설명합니다. 이 계획에서 다루는 토픽은 다음과 같습니다.
지역 간 복제: Fabric은 OneLake에 저장된 데이터의 지역 간 복제를 제공합니다. 요구 사항에 따라 이 기능을 옵트인하거나 옵트아웃할 수 있습니다.
재해 후 데이터 액세스: 지역 재해 시나리오에서 Fabric은 데이터 액세스를 보장하며, 약간의 제한이 있습니다. 장애 조치(failover) 후 새 항목을 만들거나 수정할 수 없으며, 기존 데이터를 액세스 가능하고 온전한 상태로 유지하는 것이 주요 목표입니다.
복구 지침: Fabric은 복구 프로세스를 안내하는 체계적 지침을 제공합니다. 체계적 지침을 따르면 더 쉽게 정상 상태로 되돌릴 수 있습니다.
이제 Fabric의 일부인 Power BI는 견고한 재해 복구 시스템을 갖추고 있으며 다음과 같은 기능을 제공합니다.
BCDR 기본 제공: Power BI는 자동으로 기본 제공에 재해 복구 기능을 포함합니다. 따라서 이 기능을 별도로 옵트인하거나 활성화할 필요가 없습니다.
지역 간 복제: Power BI는 Azure 스토리지 지역 중복 복제 및 Azure SQL 지역 중복 복제를 사용하여 다른 지역에 백업 인스턴스를 두고 사용할 수 있도록 보장합니다. 즉, 데이터가 여러 지역에 중복으로 존재하므로 가용성이 향상되고 지역 중단과 관련된 위험이 감소합니다.
재해 후 지속적인 서비스 및 액세스: 중단 이벤트 중에도 읽기 전용 모드로 Power BI 항목에 계속 액세스할 수 있습니다. 이러한 항목에는 의미 체계 모델, 보고서 및 대시보드가 포함되어 있으므로, 기업은 큰 차질 없이 분석 및 의사 결정 프로세스를 계속할 수 있습니다.
자세한 내용은 Power BI 고가용성, 장애 조치(failover) 및 재해 복구 FAQ를 참조하세요.
Important
홈 지역에 Azure 쌍 지역이 없고 재해의 영향을 받는 고객의 경우 용량 이내의 데이터가 복제되더라도 Fabric 용량을 활용하는 기능이 손상될 수 있습니다. 이 제한은 용량 운영에 필수적인 홈 지역의 인프라와 관련이 있습니다.
홈 지역 및 용량 기능
효과적인 재해 복구 계획이 되려면 홈 지역과 용량 위치 간의 관계를 이해하는 것이 중요합니다. 홈 지역과 용량 위치를 이해하면 용량 지역뿐 아니라 해당하는 복제 및 복구 프로세스를 전략적으로 선택할 수 있습니다.
조직의 테넌시 및 데이터 스토리지의 홈 지역은 가입하는 첫 번째 사용자의 청구 주소 위치로 설정됩니다. 테넌시 설정에 대한 자세한 내용은 Power BI 구현 계획: 테넌트 설정을 참조하세요. 새 용량을 만들 때 데이터 스토리지는 기본적으로 홈 지역으로 설정됩니다. 데이터 스토리지 지역을 다른 지역으로 변경하려면 Fabric의 프리미엄 기능인 다중 지역을 사용하도록 설정해야 합니다.
Important
용량에 다른 지역을 사용하도록 선택한다고 해서 모든 데이터가 해당 지역으로 완전히 재배치되는 것은 아닙니다. 일부 데이터 요소는 여전히 홈 지역에 저장됩니다. 홈 지역에 남아 있는 데이터와 다중 지역 사용 지역에 저장되는 데이터를 보려면 Fabric 프리미엄을 위한 다중 지역 지원 구성을 참조하세요.
쌍을 이루는 지역이 없는 홈 지역의 경우 핵심 서비스 기능이 홈 지역에 테더링되므로 홈 지역에서 재해가 발생하면 다중 지역 사용 지역의 용량이 운영 문제에 직면할 수 있습니다.
EU 내에서 다중 지역 사용 지역을 선택하면 데이터가 EU 데이터 경계 내에 저장됩니다.
홈 지역을 식별하는 방법은 Fabric 홈 지역 찾기를 참조하세요.
재해 복구 용량 설정
Fabric의 용량 설정 페이지에는 재해 복구 스위치가 있습니다. 이 스위치는 Azure 지역 쌍이 Fabric의 서비스 현재 상태와 일치할 때 사용할 수 있습니다. 다음은 스위치에 대한 세부 정보입니다.
역할 액세스: 용량 관리자 이상의 역할이 있는 사용자만 이 스위치를 사용할 수 있습니다.
세분성: 스위치의 세분성은 용량 수준입니다. 프리미엄 및 Fabric 용량 모두에 사용할 수 있습니다.
데이터 범위: 재해 복구 토글은 특히 Lakehouse 및 Warehouse 데이터를 포함하는 OneLake 데이터를 처리합니다. 이 스위치는 OneLake 외부에 저장된 데이터에 영향을 주지 않습니다.
Power BI의 BCDR 연속성: OneLake 데이터에 재해 복구를 사용하거나 사용하지 않도록 켜거나 끌 수 있지만, 스위치가 켜져 있든 꺼져 있든 관계없이 Power BI의 BCDR은 항상 지원됩니다.
빈도: 재해 복구 용량 설정을 변경한 후 다시 변경하려면 30일을 기다려야 합니다. 대기 기간을 두는 이유는 안정성 유지와 끊임없는 토글 방지입니다.
참고 항목
재해 복구 용량 설정을 켠 후 데이터 복제가 시작되는 데 최대 1주일이 걸릴 수 있습니다.
데이터 복제
재해 복구 용량 설정을 켜면 지역 간 복제가 OneLake 데이터에 대한 재해 복구 기능으로 사용하도록 설정됩니다. Fabric 플랫폼은 지역 중복 쌍을 프로비전할 수 있도록 Azure 지역과 일치합니다. 그러나 일부 지역에는 Azure 쌍 지역이 없거나 쌍 지역에서 Fabric을 지원하지 않습니다. 이러한 지역에는 데이터 복제를 사용할 수 없습니다. 자세한 내용은 가용성 영역이 있고 지역 쌍이 없는 지역 및 Fabric 지역 가용성을 참조하세요.
참고 항목
Fabric은 재해 복구를 지원하기 위해 OneLake에서 데이터 복제 솔루션을 제공하지만, 중요한 제한이 있습니다. 예를 들어 KQL 데이터베이스 및 쿼리 집합의 데이터는 OneLake 외부에 저장되므로 별도의 재해 복구 방법이 필요합니다. 각 Fabric 항목의 재해 복구 방법에 대한 자세한 내용은 이 문서의 나머지 부분을 참조하세요.
결제
Fabric의 재해 복구 기능을 사용하면 데이터의 지역 복제를 통해 보안 및 안정성을 향상할 수 있습니다. 이 기능은 각각 BCDR 스토리지 및 BCDR 작업으로 비용이 청구되는 더 많은 스토리지와 트랜잭션을 사용합니다. Microsoft Fabric 용량 메트릭 앱에서 이러한 비용을 모니터링하고 관리할 수 있습니다. 이러한 비용은 이 앱에 별도의 항목으로 표시됩니다.
계획 및 예산을 수립하는 데 도움이 되는 모든 관련 재해 복구 비용의 전체 분석 정보는 OneLake 컴퓨팅 및 스토리지 사용량을 참조하세요.
재해 복구 설정
Fabric은 데이터 복원력을 지원하는 재해 복구 기능을 제공하지만, 중단된 서비스를 복원하려면 반드시 특정 수동 단계를 따라야 합니다. 이 섹션에서는 서비스 중단에 대비하려면 수행해야 하는 작업에 대해 자세히 설명합니다.
1단계: 준비
재해 복구 용량 설정 활성화: 보호 및 성능 요구 사항을 충족하도록 재해 복구 용량 설정을 정기적으로 검토하고 설정합니다.
데이터 백업 만들기: OneLake 외부에 저장된 중요한 데이터를 재해 복구 계획에 맞는 방식으로 다른 지역에 복사합니다.
2단계: 재해 장애 조치(failover)
중대 재해가 발생하여 주 지역을 복구할 수 없게 되면 Microsoft Fabric은 지역 장애 조치(failover)를 시작합니다. 장애 조치(failover)가 완료되고 Microsoft Fabric 지원 페이지에 알림이 게시될 때까지 Fabric 포털에 액세스할 수 없습니다.
장애 조치(failover)를 완료하는 데 걸리는 시간은 가변적이지만 일반적으로 1시간 미만이 소요됩니다. 장애 조치(failover)가 완료되면 다음과 같은 상황을 예상할 수 있습니다.
Fabric 포털: 포털에 액세스할 수 있으며, 기존 작업 영역 및 항목 탐색과 같은 읽기 작업이 계속 작동합니다. 작업 영역 만들기 또는 수정과 같은 모든 쓰기 작업이 일시 중지됩니다.
Power BI: 대시보드 및 보고서 표시와 같은 읽기 작업을 수행할 수 있습니다. 새로 고침, 보고서 게시 작업, 대시보드 및 보고서 수정, 메타데이터 변경이 필요한 기타 작업은 지원되지 않습니다.
Lakehouse/Warehouse: 이러한 항목을 열 수는 없지만, OneLake API 또는 도구를 통해 파일에 액세스할 수 있습니다.
Spark 작업 정의: Spark 작업 정의를 열 수는 없지만, OneLake API 또는 도구를 통해 코드 파일에 액세스할 수 있습니다. 모든 메타데이터 또는 구성은 장애 조치(failover) 후에 저장됩니다.
Notebook: Notebook을 열 수 없으며, 재해가 발생한 후에는 코드 콘텐츠가 저장되지 않습니다.
ML 모델/실험: ML 모델 또는 실험을 열 수 없습니다. 실행 메트릭 및 구성과 같은 코드 콘텐츠와 메타데이터는 재해 발생 후에 저장되지 않습니다.
Dataflow Gen2/파이프라인/Eventstream: 이러한 항목을 열 수는 없지만, 지원되는 재해 복구 대상(레이크하우스 또는 웨어하우스)을 사용하여 데이터를 보호할 수 있습니다.
KQL 데이터베이스/쿼리 세트: 장애 조치(failover) 후 KQL 데이터베이스 및 쿼리 집합에 액세스할 수 없습니다. KQL 데이터베이스 및 쿼리 집합의 데이터를 보호하려면 더 많은 필수 구성 요소 단계가 필요합니다.
재해 시나리오에서는 Fabric 포털 및 Power BI가 읽기 전용 모드이고 다른 패브릭 항목을 사용할 수 없으므로, API 또는 타사 도구를 사용하여 OneLake에 저장된 데이터에 액세스할 수 있습니다. 포털과 Power BI 둘 다 해당 데이터를 읽고 쓰는 작업을 계속 수행할 수 있습니다. 이 기능은 중요한 데이터를 액세스 가능하고 수정 가능한 상태로 유지하며, 비즈니스 운영이 중단될 가능성을 낮춥니다.
OneLake 데이터는 여러 채널을 통해 계속 액세스할 수 있습니다.
OneLake ADLS Gen2 API: Microsoft OneLake에 연결을 참조하세요.
OneLake 데이터에 연결할 수 있는 도구의 예:
Azure Storage Explorer: OneLake를 Azure Storage Explorer와 통합
OneLake File Explorer: OneLake File Explorer를 사용하여 Fabric 데이터에 액세스를 참조하세요.
3단계: 복구 계획
Fabric은 재해 발생 후에도 데이터에 계속 액세스할 수 있도록 보장하지만, 해당 서비스를 인시던트 이전 상태로 완전히 복원할 수도 있습니다. 이 섹션에서는 복구 프로세스를 진행하는 데 도움이 되는 단계별 가이드를 제공합니다.
복구 단계
재해 발생 후 원하는 지역에서 새 Fabric 용량을 만듭니다. 이러한 이벤트 중에 수요가 많은 경우 컴퓨팅 서비스의 가용성 가능성을 높이기 위해 주 지역 외부의 지역을 선택하는 것이 좋습니다. 용량을 만드는 방법에 대한 자세한 내용은 Microsoft Fabric 구독 구매를 참조하세요.
새로 만든 용량에서 작업 영역을 만듭니다. 필요한 경우 이전 작업 영역과 동일한 이름을 사용합니다.
복구하려는 항목과 같은 이름으로 항목을 만듭니다. 이 단계는 사용자 지정 스크립트를 사용하여 레이크하우스 및 웨어하우스를 복구하는 경우에 중요합니다.
항목을 복원합니다. 항목마다 환경별 재해 복구 지침의 관련 섹션에 따라 항목을 복원합니다.