다음을 통해 공유


Azure Blob Storage의 안정성

Azure Blob Storage 는 Microsoft의 클라우드에 대한 개체 스토리지 솔루션입니다. 텍스트, 이진 데이터, 문서, 미디어 파일, 애플리케이션 백업 등 방대한 양의 구조화되지 않은 데이터를 저장하도록 설계되었습니다. Blob Storage는 기본적인 Azure Storage 서비스로서 계획된 이벤트와 계획되지 않은 이벤트 모두에서 데이터가 사용 가능하고 내구성 있게 유지되도록 여러 가지 안정성 기능을 제공합니다.

Azure를 사용하는 경우 안정성은 공유 책임입니다. Microsoft는 복원력 및 복구를 지원하는 다양한 기능을 제공합니다. 이러한 기능이 사용하는 모든 서비스 내에서 작동하는 방식을 이해하고 비즈니스 목표 및 가동 시간 목표를 충족하는 데 필요한 기능을 선택할 책임이 있습니다.

이 문서에서는 일시적인 오류, 가용성 영역 중단 및 지역 중단을 포함하여 다양한 잠재적인 중단 및 문제에 대해 Blob Storage를 복원할 수 있도록 하는 방법을 설명합니다. 또한 백업을 사용하여 다른 유형의 문제에서 복구하는 방법을 설명하고 Blob Storage SLA(서비스 수준 계약)에 대한 몇 가지 주요 정보를 강조 표시합니다.

비고

Blob Storage는 Azure Storage 플랫폼의 일부입니다. Blob Storage의 일부 기능은 여러 Azure Storage 서비스에서 공통적으로 사용됩니다. 이 문서에서는 이러한 기능을 지칭하기 위해 Azure Storage를 사용합니다.

프로덕션 배포 권장 사항

솔루션의 안정성 요구 사항을 지원하기 위해 Blob Storage를 배포하는 방법과 안정성이 아키텍처의 다른 측면에 어떤 영향을 미치는지 알아보려면 Azure Well-Architected Framework의 Blob Storage에 대한 아키텍처 모범 사례를 참조하세요.

안정성 아키텍처 개요

Azure Storage는 다양한 형식의 오류로부터 데이터를 보호하는 데 도움이 되는 여러 가지 중복도 옵션을 제공합니다. 각 옵션은 특정 수준의 데이터 중복도를 제공하므로 애플리케이션 요구 사항에 가장 적합한 수준을 선택할 수 있습니다.

LRS(로컬 중복 스토리지)는 스토리지 계정 내 데이터를 선택한 주 지역에 있는 하나 이상의 Azure 가용성 영역에 복제합니다. 원하는 가용성 영역을 선택할 수 있는 옵션은 없지만 Azure에서는 부하 분산을 개선하기 위해 LRS 계정을 여러 영역으로 이동하거나 확장할 수 있습니다. 데이터가 여러 영역에 분산될 것이라는 보장은 없습니다. 가용성 영역에 대한 자세한 내용은 가용성 영역이란?을 참조하세요.

LRS를 사용하여 가용성 영역에 데이터가 복제되는 방식을 보여 주는 다이어그램.

ZRS(영역 중복 스토리지), GRS(지역 중복 스토리지), GZRS(지역 영역 중복 스토리지)는 추가적인 보호 기능을 제공합니다. 이 문서에서는 이러한 옵션에 대해 자세히 설명합니다.

일시적인 오류에 대한 복원력

일시적인 오류는 구성 요소에서 짧고 간헐적인 오류입니다. 클라우드와 같은 분산 환경에서 자주 발생하며 작업의 일반적인 부분입니다. 일시적인 오류는 짧은 시간 후에 스스로 수정됩니다. 일반적으로 영향을 받은 요청을 다시 시도하여 애플리케이션이 임시 오류를 처리할 수 있는 것이 중요합니다.

모든 클라우드 호스팅 애플리케이션은 클라우드 호스팅 API, 데이터베이스 및 기타 구성 요소와 통신할 때 Azure 임시 오류 처리 지침을 따라야 합니다. 자세한 내용은 임시 오류 처리를 위한 권장 사항을 참조하세요.

Blob Storage를 사용할 때 임시 오류를 효과적으로 관리하려면 다음 권장 사항을 구현합니다.

  • 지수 백오프 및 지터를 사용한 기본 제공 다시 시도 정책이 포함된 Azure Storage 클라이언트 라이브러리를 사용합니다. .NET, Java, Python 및 JavaScript SDK는 임시 오류에 대한 다시 시도를 자동으로 처리합니다. 다시 시도 구성 옵션에 대한 자세한 내용은 .NET을 사용하여 재시도 정책 구현을 참조하세요.

  • Blob 크기와 네트워크 조건에 따라 Blob 작업에 대한 적절한 시간 제한 값을 구성합니다. 더 큰 Blob에는 더 긴 시간 제한이 필요하지만, 더 작은 작업에는 더 짧은 값을 사용하여 오류를 빠르게 검색할 수 있습니다.

가용성 영역 오류에 대한 복원력

가용성 영역은 Azure 지역 내에서 물리적으로 별도의 데이터 센터 그룹입니다. 한 영역이 실패하면 서비스가 나머지 영역 중 하나로 전환될 수 있습니다.

Blob Storage는 지역 내 여러 가용성 영역에 데이터를 자동으로 분산하는 ZRS 구성을 통해 강력한 가용성 영역 지원을 제공합니다. LRS(로컬 중복 스토리지)와 달리 ZRS는 Azure가 여러 가용성 영역에 걸쳐 Blob 데이터를 동기식으로 복제하도록 보장합니다. ZRS는 한 영역에 장애가 발생하더라도 데이터에 계속 액세스할 수 있도록 보장합니다.

영역 중복은 스토리지 계정 수준에서 사용하도록 설정되며 해당 계정 내의 모든 Blob 컨테이너에 적용됩니다. 개별 컨테이너에 대해 서로 다른 중복도 수준을 설정할 수 없습니다. 중복도 구성은 전체 스토리지 계정에 적용됩니다. 가용성 영역에 중단이 발생하면 Azure Storage는 사용자나 사용자의 애플리케이션이 개입하지 않아도 자동으로 요청을 정상적인 영역으로 라우팅합니다.

주 지역에서 ZRS(영역 중복 스토리지)를 사용하여 데이터가 복제되는 방식을 보여 주는 다이어그램.

요구 사항

  • 스토리지 계정 유형: 영역 중복성은 표준 범용 v2 및 프리미엄 블록 Blob Storage 계정 유형 모두에 사용할 수 있습니다. 블록 Blob, 추가 Blob, 페이지 Blob은 모두 영역 중복 구성을 지원하지만, 사용하는 스토리지 계정 형식에 따라 사용 가능한 기능이 결정됩니다. 자세한 내용은 지원되는 스토리지 계정 유형을 참조하세요.

비용

ZRS(영역 중복 스토리지)를 사용하도록 설정하면 추가적인 복제 및 스토리지 오버헤드로 인해 LRS(로컬 중복 스토리지)와 다른 요금이 부과됩니다.

자세한 내용은 Blob Storage 가격 책정을 참조하세요.

가용성 영역 지원 구성

  • 영역 중복이 있는 Blob Storage 계정을 만듭니다. ZRS로 새 스토리지 계정을 만들려면 스토리지 계정 만들기를 참조하고 계정 만드는 동안 중복 옵션으로 ZRS, GZRS(지역 영역 중복 스토리지) 또는 RA-GZRS(읽기 액세스 지역 중복 스토리지)를 선택합니다.
  • 복제 형식을 변경합니다. 기존 스토리지 계정을 ZRS(영역 중복 스토리지)로 변경하는 방법과 구성 옵션 및 요구 사항에 대해 알아보려면 스토리지 계정 복제 방식 변경을 참조하세요.

  • 영역 중복을 사용하지 않도록 설정합니다. 동일한 중복도 구성 변경 프로세스를 사용하여 ZRS 계정을 LRS(로컬 중복 스토리지)와 같은 비구역 구성으로 다시 변환합니다.

모든 영역이 정상인 경우의 동작

이 섹션에서는 Blob Storage 계정이 영역 중복도를 위해 구성되고 모든 가용성 영역이 작동하는 경우 예상되는 상황을 설명합니다.

  • 영역 간 트래픽 라우팅: ZRS(영역 중복 스토리지)를 갖춘 Azure Storage는 여러 가용성 영역의 스토리지 클러스터에 요청을 자동으로 분산합니다. 트래픽 배포는 애플리케이션에 투명하며 클라이언트 쪽 구성이 필요하지 않습니다.

  • 영역 간 데이터 복제: ZRS에 대한 모든 쓰기 작업은 해당 지역 내의 모든 가용성 영역에 동기식으로 복제됩니다. 데이터를 업로드하거나 수정하는 경우 모든 가용성 영역에서 데이터가 성공적으로 복제될 때까지 작업이 완료된 것으로 간주되지 않습니다. 이 동기 복제는 영역 오류 발생 시 강력한 일관성과 데이터 손실이 없도록 합니다.

영역 오류 중 동작

이 섹션에서는 Blob Storage 계정이 ZRS에 대해 구성되었고 가용성 영역이 중단된 경우 예상되는 상황을 설명합니다.

  • 검색 및 응답: Microsoft는 자동으로 영역 오류를 검색하고 복구 프로세스를 시작합니다. ZRS(영역 중복 스토리지) 계정의 경우 고객 조치가 필요하지 않습니다.

    영역을 사용할 수 없게 되면 Azure는 DNS(Domain Name System) 재포인팅과 같은 네트워킹 업데이트를 수행합니다.

  • 알림: 영역이 다운된 경우 Microsoft는 자동으로 알리지 않습니다. 그러나 Azure Resource Health 를 사용하여 개별 리소스의 상태를 모니터링하고 Resource Health 경고를 설정하여 문제를 알릴 수 있습니다. 또한 Azure Service Health를 사용하여 영역 오류를 포함하여 서비스의 전반적인 상태를 파악할 수 있으며, 문제를 알리도록 Service Health 경고를 설정할 수 있습니다.
  • 활성 요청: 진행 중인 요청은 복구 프로세스 중에 삭제될 수 있으므로 다시 시도해야 합니다. 애플리케이션은 이러한 임시 중단을 처리하기 위해 재시도 논리를 구현 해야 합니다.

  • 예상 데이터 손실: 쓰기 작업이 완료되기 전에 여러 영역에서 데이터가 동기적으로 복제되므로 영역 오류 중에 데이터가 손실되지 않습니다.

  • 예상 가동 중지 시간: 자동 복구 중에 트래픽이 정상 영역으로 리디렉션되면서 일반적으로 몇 초 정도의 짧은 가동 중지 시간이 발생할 수 있습니다. ZRS용 애플리케이션을 설계할 때는 지수 백오프를 사용한 다시 시도 정책 구현을 포함하여 임시 오류 처리에 대한 사례를 따릅니다.

  • 트래픽 경로 전환: 가용성 영역이 오프라인 상태가 되면 Azure는 DNS(Domain Name System) 재포인팅과 같은 네트워킹 변경을 시작합니다. 이러한 업데이트를 통해 트래픽이 나머지 정상적인 가용성 영역으로 경로가 전환됩니다. 이 서비스는 남아있는 영역을 활용하여 모든 기능을 유지하며 고객의 개입이 필요하지 않습니다.

영역 복구

실패한 가용성 영역이 복구되면 Azure Storage는 모든 가용성 영역에서 정상 작업을 자동으로 복원합니다. 이 서비스는 중단 기간 동안 발생한 모든 작업을 동기화하여 데이터 일관성을 자동으로 보장합니다.

영역 오류 테스트

ZRS(영역 중복 스토리지)를 사용하면 Azure Storage에서 복제, 트래픽 라우팅, 영역 다운 응답을 자동으로 관리합니다. 이 기능은 완전히 관리되므로 가용성 영역 오류 프로세스를 시작하거나 유효성을 검사할 필요가 없습니다.

지역 전체 오류에 대한 복원력

Azure Blob Storage, Azure Files, Azure Table Storage, Azure Queue Storage를 포함한 Azure Storage는 다양한 요구 사항에 맞춰 광범위한 지역 중복 및 장애 조치(failover) 기능을 제공합니다.

중요합니다

GRS(지역 중복 스토리지)는 Azure 쌍 지역 내에서만 작동합니다. 스토리지 계정의 지역이 페어링되지 않은 경우 복원력을 위해 사용자 지정 다중 지역 솔루션을 사용하는 것이 좋습니다.

쌍을 이루는 지역에 대한 지리적 중복 스토리지

Azure Storage는 쌍으로 구성된 지역에서 여러 형식의 GRS를 제공합니다. 어떤 형식의 GRS를 사용하든 보조 지역의 데이터는 항상 LRS(로컬 중복 스토리지)를 사용하여 복제됩니다. 이러한 방식은 보조 지역 내의 하드웨어 오류로부터 보호 기능을 제공합니다.

지리적 중복 스토리지

  • RA-GRS(읽기 액세스 지역 중복 스토리지) 및 RA-GZRS(읽기 액세스 지역 영역 중복 스토리지)는 GRS(지역 중복 스토리지) 및 GZRS(지역 영역 중복 스토리지)를 확장하여 보조 엔드포인트에 대한 읽기 액세스이라는 이점을 제공합니다. 이러한 옵션은 고가용성 비즈니스에 중요한 애플리케이션을 위해 설계된 애플리케이션에 이상적입니다. 주 엔드포인트에서 중단이 발생하는 드문 경우 보조 지역에 대한 읽기 액세스를 위해 구성된 애플리케이션은 계속 작동할 수 있습니다.

장애 조치(failover) 형식

Azure Storage는 다양한 시나리오에 대해 세 가지 형식의 장애 조치(failover)를 지원합니다.

  • 고객 관리 계획되지 않은 장애 조치(failover): 주 지역에서 지역 전체 스토리지 장애가 발생하는 경우 복구를 시작하는 것은 고객의 책임입니다.

  • 고객 관리형 계획된 장애 조치(failover): 솔루션의 다른 부분에 주 지역에서 오류가 발생한 경우 복구를 시작할 책임이 있으며 전체 솔루션을 보조 지역으로 전환해야 합니다. 스토리지가 주 지역에서 계속 작동하지만 규정 준수 및 감사 요구 사항을 보장하기 위해 설계된 재해 복구 훈련과 같이 전체 솔루션을 보조 지역으로 장애 조치해야 하는 경우 계획된 장애 조치(failover)를 사용합니다.

  • Microsoft 관리 장애 조치(failover): 예외적인 상황에서 Microsoft는 지역의 모든 GRS(지역 중복 스토리지) 계정에 대한 장애 조치(failover)를 시작할 수 있습니다. 그러나 Microsoft에서 관리하는 장애 조치(failover)는 최후의 수단이며 장기간 중단된 후에만 수행될 것으로 예상됩니다. Microsoft 관리 장애 조치(failover)에 의존해서는 안 됩니다.

GRS 계정은 이러한 장애 조치(failover) 형식을 사용할 수 있습니다. 미리 장애 조치 유형을 사용하기 위해 스토리지 계정을 구성할 필요가 없습니다.

요구 사항

  • 스토리지 계정 유형: 지리적 중복 스토리지 (GRS) 및 고객이 시작한 장애 조치 및 장애 복구는 범용 v2 Azure Storage 계정을 지원하는 모든 Azure 페어리전에서 사용할 수 있습니다.

고려 사항

다중 지역 Blob Storage를 구현할 때 다음과 같은 주요 요소를 고려합니다.

  • 비동기 복제 지연: 보조 지역에 대한 데이터 복제는 비동기적입니다. 즉, 데이터가 주 지역에 기록되는 시점과 보조 지역에서 데이터를 사용할 수 있게 되는 시점 사이에 대기 시간이 발생합니다. 이러한 지연으로 인해 최근 데이터가 복제되기 전에 주 지역에 장애가 발생하면 잠재적으로 데이터 손실이 발생할 수 있습니다. 데이터 손실은 RPO(복구 지점 목표)로 측정됩니다. 복제 지연은 15분 이내로 예상할 수 있지만, 이는 예상 비용일 뿐 보장되지는 않습니다.

    스토리지 계정에 계획되지 않은 장애 조치(failover)가 발생한 경우 얼마나 많은 데이터가 손실될 수 있는지 파악하려면 마지막 동기화 시간 속성을 확인합니다.

  • 보조 지역 액세스: GRS(지역 중복 스토리지) 및 GZRS(지역 영역 중복 스토리지) 구성을 사용하면 장애 조치(failover)가 발생할 때까지 보조 지역에 읽기 작업을 수행할 수 없습니다.

    RA-GRS(읽기 액세스 지역 중복 스토리지) 및 RA-GZRS(읽기 액세스 지역 영역 중복 스토리지) 구성은 일반 작업 중에 보조 지역에 대한 읽기 액세스을 제공하지만 비동기 복제 지연으로 인해 약간 오래된 데이터를 반환할 수 있습니다.

  • 기능 제한 사항: 일부 Azure Storage 기능은 GRS(지역 중복 스토리지) 또는 고객 관리 장애 조치(failover)를 사용할 때 지원되지 않거나 제한 사항이 있습니다. 지역 중복을 구현하기 전에 기능 호환성을 검토합니다.

비용

다중 지역 Azure Storage 계정 구성에서는 보조 지역에서 지역 간 복제 및 저장에 대한 추가 비용이 발생합니다. Azure 지역 간 데이터 전송은 표준 지역 간 대역폭 요금에 따라 청구됩니다.

자세한 내용은 Blob Storage 가격 책정을 참조하세요.

다중 지역 지원 구성

  • 새로운 GRS(지역 중복 스토리지) 계정을 만듭니다. GRS 계정을 만들려면 스토리지 계정 만들기를 참조하고 계정 만드는 동안 GRS, RA-GRS(읽기 액세스 지역 중복 스토리지), GZRS(지역 영역 중복 스토리지) 또는 RA-GZRS(읽기 액세스 지역 영역 중복 스토리지)를 선택합니다.
  • 기존 스토리지 계정에서 지역 중복을 사용하도록 설정합니다. 기존 스토리지 계정을 GRS(지역 중복 스토리지)로 변환하려면 스토리지 계정 복제 방법 변경을 참조하세요.

    경고

    지역 중복을 위해 계정을 다시 구성한 후, 새로운 주 지역에 있는 기존 데이터가 새로운 보조 지역에 완전히 복사되기까지 상당한 시간이 걸릴 수 있습니다.

    중대한 데이터 손실을 방지하려면 계획되지 않은 장애 조치(failover)를 시작하기 전에 마지막 동기화 시간 속성 값을 확인합니다. 잠재적인 데이터 손실을 평가하려면 마지막 동기화 시간을 데이터가 새 주 지역에 기록된 마지막 시간과 비교합니다.

  • 지역 중복을 사용하지 않도록 설정합니다. 동일한 중복도 구성 변경 프로세스를 사용하여 GRS 계정을 LRS(로컬 중복 스토리지) 또는 ZRS(영역 중복 스토리지)와 같은 단일 지역 구성으로 다시 변환합니다.

모든 지역이 정상인 경우의 동작

이 섹션에서는 스토리지 계정이 지역 중복성을 위해 구성되고 모든 지역이 작동할 때 예상되는 사항에 대해 설명합니다.

  • 지역 간 트래픽 라우팅: Azure Storage는 모든 쓰기 작업과 대부분의 읽기 작업이 주 지역으로 전달되는 활성-수동 방식을 사용합니다.

    RA-GRS(읽기 액세스 지역 중복 스토리지) 및 RA-GZRS(읽기 액세스 지역 영역 중복 스토리지) 구성의 경우, 애플리케이션은 선택적으로 보조 엔드포인트에 액세스하여 보조 지역에서 읽을 수 있습니다. 이 방식에는 명시적인 애플리케이션 구성이 필요하며 자동이 아닙니다. 또한 비동기 복제 지연으로 인해 보조 지역의 데이터가 약간 오래된 것일 수 있습니다.

  • 지역 간 데이터 복제: 쓰기 작업은 다음과 같이 구성된 중복도 형식을 사용하여 먼저 주 지역에 커밋됩니다.

    • GRS(지역 중복 스토리지) 및 RA-GRS에 대한 LRS(로컬 중복 스토리지)
    • GZRS(지역 영역 중복 스토리지) 및 RA-GZRS에 대한 ZRS(영역 중복 스토리지)

    주 지역에서 성공적으로 완료되면 데이터는 LRS를 사용하여 보조 지역에 비동기식으로 복제되어 저장됩니다.

    지역 간 복제는 비동기적 특성을 가지고 있기 때문에 일반적으로 데이터가 주 지역에 기록되는 시점과 보조 지역에서 해당 데이터를 사용할 수 있게 되는 시점 사이에 지연 기간이 발생합니다. 마지막 동기화 시간 속성을 사용하여 복제 시간을 모니터링할 수 있습니다.

지역 오류 중 동작

이 섹션에서는 스토리지 계정이 지역 중복성을 위해 구성되고 주 지역에서 중단이 발생할 때 예상되는 사항에 대해 설명합니다.

  • 고객 관리 장애 조치(failover)(계획되지 않음): 주 지역의 스토리지를 사용할 수 없는 경우 계획되지 않은 장애 조치를 사용합니다.

    • 검색 및 응답: 주 지역에서 스토리지 계정을 사용할 수 없는 경우 고객 관리형 계획되지 않은 장애 조치(failover)를 시작하는 것이 좋습니다. 이 결정을 내리려면 다음 요소를 고려합니다.

      • Azure Resource Health에서 주 지역의 스토리지 계정에 액세스하는 데 문제가 표시되는지 여부

      • Microsoft에서 다른 지역으로 장애 조치(failover)를 수행하도록 권장하는지 여부

      경고

      계획되지 않은 장애 조치(failover) 로 인해 데이터가 손실될 수 있습니다. 고객 관리 장애 조치(failover)를 시작하기 전에 서비스 복원이 데이터 손실 위험을 정당화하는지 여부를 결정합니다.

    • 알림: 지역이 다운된 경우 Microsoft는 자동으로 알리지 않습니다. 그러나:

    • 활성 요청: 장애 조치(failover) 프로세스 중에 읽기 및 쓰기 모두에 대해 기본 및 보조 스토리지 계정 엔드포인트를 일시적으로 사용할 수 없게 됩니다. 활성 요청이 삭제될 수 있으며 장애 조치(failover)가 완료된 후 클라이언트 애플리케이션을 다시 시도해야 합니다.

    • 예상되는 데이터 손실: 계획되지 않은 장애 조치(failover) 중에 비동기 복제 지연으로 인해 데이터 손실이 흔히 발생하며, 이는 최근 쓰기가 복제되지 않을 수 있음을 의미합니다. 마지막 동기화 시간 속성을 확인하면 계획되지 않은 장애 조치(failover) 중에 얼마나 많은 데이터가 손실될 수 있는지 파악할 수 있습니다. 예상 데이터 손실을 RPO(복구 지점 목표)라고도 합니다. 일반적으로 RPO가 15분 미만일 것으로 예상할 수 있지만 해당 시간이 보장되지는 않습니다.

    • 예상 가동 중지 시간: 예상 가동 중지 시간의 양을 RTO(복구 시간 목표)라고도 합니다. 고객 관리 장애 조치(failover)는 일반적으로 계정 크기 및 복잡성에 따라 60분 이내에 완료됩니다.

    • 트래픽 경로 변경: 장애 조치(failover)가 완료되면 Azure는 애플리케이션을 다시 구성할 필요가 없도록 스토리지 계정 엔드포인트를 자동으로 업데이트합니다. 애플리케이션이 DNS(Domain Name System) 항목을 캐시에 보관하는 경우 애플리케이션이 새로운 주 지역으로 트래픽을 전송하도록 캐시를 지워야 할 수도 있습니다.

    • 장애 조치(failover) 후 구성: 계획되지 않은 장애 조치(failover)가 완료된 후 대상 지역의 스토리지 계정은 LRS(로컬 중복 스토리지) 계층을 사용합니다. 다시 지리적으로 복제해야 하는 경우 GRS(지역 중복 스토리지)를 다시 사용하도록 설정하고 데이터가 새 보조 지역으로 복제될 때까지 기다려야 합니다.

    고객 관리 장애 조치를 시작하는 방법에 대한 자세한 내용은 고객 관리(계획되지 않은) 장애 조치(failover) 작동 방식스토리지 계정 장애 조치(failover) 시작을 참조하세요.

  • 고객 관리 장애 조치(failover)(계획됨): 스토리지가 주 지역에서 계속 작동하지만 다른 이유로 전체 솔루션을 보조 지역으로 장애 조치해야 하는 경우 계획된 장애 조치를 사용합니다. 예를 들어 다른 Azure 서비스에 문제가 발생할 수 있으며 전체 솔루션에 보조 지역을 사용하도록 전환해야 합니다. 또는 계획된 장애 조치를 사용하여 규정 준수 및 감사 목적으로 DR(재해 복구) 훈련을 수행할 수 있습니다.

    • 검색 및 응답: 장애 조치(failover)를 결정할 책임이 있습니다. 스토리지 계정이 정상이더라도 지역 간에 장애 조치(failover)가 필요한 경우 일반적으로 이 결정을 내립니다. 예를 들어 주요 지역에서 복구할 수 없는 다른 애플리케이션 구성 요소의 주요 중단이 있는 경우 장애 조치(failover)를 트리거할 수 있습니다.

      • 알림: 지역이 다운된 경우 Microsoft는 자동으로 알리지 않습니다. 그러나:

    • 활성 요청: 장애 조치(failover) 프로세스 중에 읽기 및 쓰기 모두에 대해 기본 및 보조 스토리지 계정 엔드포인트를 일시적으로 사용할 수 없게 됩니다. 활성 요청이 삭제될 수 있으며 장애 조치(failover)가 완료된 후 클라이언트 애플리케이션을 다시 시도해야 합니다.

    • 예상 데이터 손실: 모든 데이터가 동기화된 후에만 장애 조치(failover) 프로세스가 완료되므로 데이터 손실이 발생하지 않으므로 RPO가 0이 됩니다.

    • 예상 가동 중지 시간: 장애 조치(failover)는 일반적으로 60분 이내에 완료됩니다. 즉, 예상 RTO는 계정 크기 및 복잡성에 따라 60분입니다. 장애 조치(failover) 프로세스 중에 읽기 및 쓰기 모두에 대해 기본 및 보조 스토리지 계정 엔드포인트를 일시적으로 사용할 수 없게 됩니다.

    • 트래픽 경로 변경: 장애 조치(failover)가 완료되면 Azure는 애플리케이션을 다시 구성할 필요가 없도록 스토리지 계정 엔드포인트를 자동으로 업데이트합니다. 애플리케이션이 DNS 항목을 캐시한 상태로 유지하는 경우 애플리케이션이 새로운 주 지역으로 트래픽을 전송하도록 캐시를 지워야 할 수도 있습니다.

    • 장애 조치(failover) 후 구성: 계획된 장애 조치(failover)가 완료되면 대상 지역의 스토리지 계정은 계속해서 지리적으로 복제되고 GRS 계층에 유지됩니다.

    고객 관리 장애 조치를 시작하는 방법에 대한 자세한 내용은 고객 관리(계획된) 장애 조치(failover) 작동 방식스토리지 계정 장애 조치(failover) 시작을 참조하세요.

  • Microsoft에서 관리하는 장애 조치(failover): Microsoft에서 주 지역을 영구적으로 복구할 수 없다고 판단하는 대규모 재해가 발생하는 드문 경우 보조 지역에 대한 자동 장애 조치(failover)가 시작될 수 있습니다. Microsoft는 전체 프로세스를 처리하며 고객 작업이 필요하지 않습니다. 장애 조치(failover)가 발생하기 전에 경과되는 시간은 재해의 심각도 및 상황을 평가하는 데 필요한 시간에 따라 달라집니다.

    • 알림: 지역이 다운된 경우 Microsoft는 자동으로 알리지 않습니다. 그러나:

    중요합니다

    고객이 관리하는 장애 조치 옵션을 사용하여 재해 복구 계획을 개발, 테스트 및 구현합니다. 극단적인 상황에서만 사용될 수 있는 Microsoft 관리 장애 조치(failover)에 의존하지 마세요. Microsoft에서 관리하는 장애 조치(failover)는 전체 지역에 대해 시작될 가능성이 높습니다. 개별 스토리지 계정, 구독 또는 고객에 대해 시작할 수 없습니다. 장애 조치는 서로 다른 Azure 서비스에 대해 각기 다른 시간에 발생할 수 있습니다. 고객 관리 장애 조치(failover)를 사용하는 것이 좋습니다.

지역 복구

장애 복구 프로세스는 Microsoft에서 관리하는 장애 조치(failover) 시나리오와 고객에서 관리하는 장애 조치 시나리오 간에 상당한 차이가 있습니다.

  • 고객 관리 장애 조치(failover)(계획되지 않음): 계획되지 않은 장애 조치 후 스토리지 계정은 LRS(로컬 중복 스토리지)로 구성됩니다. 장애 복구를 수행하려면 GRS(지역 중복 스토리지) 관계를 다시 설정하고 데이터가 복제될 때까지 기다려야 합니다.

  • 고객 관리 장애 조치(failover)(계획됨): 계획된 장애 조치 후 스토리지 계정은 지리적으로 복제된 상태로 유지됩니다. 원래 주 지역으로 장애 복구하기 위해 다른 고객 관리 장애 조치(failover)를 시작할 수 있습니다. 동일한 페일오버 고려 사항이 적용됩니다.

  • Microsoft 관리 장애 조치(failover): Microsoft에서 장애 조치를 시작하면 주 지역에서 심각한 재해가 발생했을 가능성이 있으며 주 지역을 복구하지 못할 수도 있습니다. 모든 일정이나 복구 계획은 지역 재해와 복구 활동의 범위에 따라 달라집니다. 자세한 내용은 Azure Service Health 통신을 모니터링해야 합니다.

지역 오류 테스트

재해 복구 절차를 테스트하기 위해 지역적 장애를 시뮬레이션할 수 있습니다.

  • 계획된 장애 조치(failover) 테스트: GRS(지역 중복 스토리지) 계정의 경우 유지 관리 기간 동안 계획된 장애 조치 작업을 수행하여 전체 장애 조치 및 장애 복구 프로세스를 테스트할 수 있습니다. 계획된 장애 조치(failover)에는 데이터 손실이 필요하지 않지만 장애 조치와 장애 복구 중에 가동 중지 시간이 발생합니다.

  • 2차 엔드포인트 테스트: RA-GRS(읽기 액세스 지역 중복 스토리지) 및 RA-GZRS(읽기 액세스 지역 영역 중복 스토리지) 구성의 경우 애플리케이션이 보조 지역에서 데이터를 성공적으로 읽을 수 있는지 확인하기 위해 2차 엔드포인트에 대한 읽기 작업을 정기적으로 테스트합니다.

복원력을 위한 사용자 지정 다중 지역 솔루션

Azure Storage의 지역 간 장애 조치(failover) 기능은 다음과 같은 이유로 적합하지 않을 수 있습니다.

  • 스토리지 계정은 비페어링 지역에 있습니다.

  • 기본 제공 장애 조치(failover) 옵션이 제공하는 복구 시간 또는 데이터 손실로 인해 비즈니스 가동 시간 목표가 충족되지 않습니다.

  • 주 지역의 쌍이 아닌 지역으로 장애 조치(failover)를 취해야 합니다.

  • 지역 간에 활성/활성 구성이 필요합니다.

이 섹션에서는 고려해야 할 몇 가지 방법에 대한 개략적인 개요를 제공합니다. Azure Storage에 대한 다중 지역 배포 토폴로지의 포괄적인 개요는 이 문서의 범위를 벗어납니다.

각 지역에서 별도의 스토리지 계정을 사용하여 여러 지역에 Azure Storage를 배포할 수 있습니다. 이러한 방식은 영역 선택에 있어 유연성을 제공하고, 비페어 지역을 사용할 수 있는 기능과 복제 타이밍 및 데이터 일관성에 대한 보다 세부적인 제어 기능을 제공합니다. 여러 지역에 걸쳐 여러 스토리지 계정을 구현하는 경우 지역 간 데이터 복제를 구성하고, 부하 분산 및 장애 조치(failover) 정책을 구현하고, 지역 간 데이터 일관성을 보장해야 합니다.

개체 복제는 스토리지 계정 간 블록 Blob의 비동기 복사를 제공하는 지역 간 데이터 복제에 대한 추가 옵션을 제공합니다. 고정된 쌍을 이루는 지역을 사용하는 기본 제공 지역 중복 스토리지 옵션과 달리, 개체 복제를 사용하면 쌍이 아닌 지역을 포함하여 모든 Azure 지역의 스토리지 계정 간에 데이터를 복제할 수 있습니다. 이 방식을 사용하면 원본 및 대상 지역, 복제 정책, 복제할 특정 컨테이너 및 Blob 접두사에 대한 완벽한 제어가 가능합니다.

컨테이너 내의 모든 Blob이나 Blob 접두사 및 태그를 기반으로 특정 하위 집합을 복제하도록 개체 복제를 구성할 수 있습니다. 복제는 비동기적으로 진행되며 백그라운드에서 진행됩니다. 여러 복제 정책을 구성하고 여러 스토리지 계정에 걸쳐 복제를 체인 방식으로 연결하여 정교한 다중 지역 토폴로지를 만들 수도 있습니다.

개체 복제는 모든 스토리지 계정과 호환되지 않습니다. 예를 들어, 계층 구조 네임스페이스를 사용하는 스토리지 계정(Azure Data Lake Storage Gen2 계정이라고도 함)에서는 작동하지 않습니다.

자세한 내용은 블록 Blob에 대한 개체 복제개체 복제 구성을 참조하세요.

백업 및 복구

Blob Storage는 포괄적인 백업 전략을 위한 중복도를 보완하는 여러 가지 데이터 보호 메커니즘을 제공합니다. 이 서비스에 기본 제공된 중복도는 인프라 장애로부터 데이터를 보호하고, 추가 백업 기능은 실수로 인한 삭제, 손상 및 악의적인 작업으로부터 데이터를 보호합니다.

PITR(특정 시점 복원)을 사용하면 최대 365일의 구성된 보존 기간 내에 블록 Blob 데이터를 이전 상태로 복원할 수 있습니다. Microsoft에서 이 기능을 완벽하게 관리합니다. 또한 컨테이너 또는 Blob 수준에서 세부적인 복구 기능을 제공합니다. PITR 데이터는 원본 계정과 동일한 지역에 저장되며, 지역 중복 구성을 사용하는 경우 지역 중단 중에도 액세스할 수 있습니다.

Blob 버전 관리는 Blob이 수정되거나 삭제될 때 이전 버전 관리를 자동으로 유지 관리합니다. 각 버전은 별도의 개체로 저장되며 독립적으로 액세스할 수 있습니다. 버전은 현재 Blob과 동일한 지역에 저장되며 스토리지 계정과 동일한 중복도 구성을 따릅니다.

일시 삭제는 구성 가능한 기간 동안 삭제된 데이터를 보존하여 실수로 삭제된 Blob 및 컨테이너에 대한 안전망을 제공합니다. 일시 삭제된 데이터는 동일한 스토리지 계정 및 지역에 남아 있으므로 즉시 복구할 수 있습니다. 지역 중복 계정의 경우, 일시 삭제된 데이터도 보조 지역에 복제됩니다.

Blob 스냅샷은 백업 및 복구 시나리오에 사용할 수 있는 Blob의 읽기 전용, 특정 시점 복사본을 만듭니다. 스냅샷은 동일한 스토리지 계정에 저장되며 기본 Blob과 동일한 중복도 및 지역 복제 설정을 따릅니다.

지역 간 백업 요구 사항의 경우 중앙 집중식 백업 관리를 제공하고 원본 데이터와 다른 지역에 백업 데이터를 저장할 수 있는 Blob용 Azure Backup을 사용하는 것이 좋습니다. 이 서비스는 구성 가능한 보존 정책과 복원 기능을 갖춘 운영 및 자격 증명 모음 백업 옵션을 제공합니다. 자세한 내용은 Blob 백업 개요를 참조하세요.

대부분의 솔루션의 경우 백업에만 의존해서는 안 됩니다. 대신 이 가이드에 설명된 다른 기능을 사용하여 복원력 요구 사항을 지원합니다. 그러나 백업은 다른 방법이 사용하지 않는 일부 위험으로부터 보호합니다. 자세한 내용은 중복도, 복제 및 백업이란?을 참조하세요.

서비스 수준 약정

Azure Storage에 대한 SLA(서비스 수준 계약)는 서비스의 예상 가용성 및 해당 가용성 기대치를 달성하기 위해 충족해야 하는 조건을 설명합니다. 사용자가 적용할 수 있는 가용성 SLA는 스토리지 계층과 사용하는 복제 형식에 따라 달라집니다. 자세한 내용은 온라인 서비스 SLA를 참조하세요.