Share via


IoT 워크로드의 안정성

모든 워크로드와 마찬가지로 IoT 워크로드는 오작동할 가능성이 있습니다. 잘 설계된 IoT 솔루션의 주요 안정성 고려 사항은 변경 내용을 얼마나 빨리 감지할 수 있는지와 작업을 얼마나 빨리 다시 시작할 수 있는지입니다.

IoT 애플리케이션은 대규모로 분산되는 경우가 많으며, 영구 액세스 또는 엔드투엔드 데이터 흐름에 대한 가시성 없이 신뢰할 수 없는 네트워크를 통해 작동할 수 있습니다. 이러한 요인 때문에 가용성 및 복원력을 염두에 두고 IoT 아키텍처를 디자인해야 합니다.

신뢰할 수 있는 IoT 솔루션을 빌드하려면 디바이스, 클라우드 서비스 및 상호 작용하는 방식을 신중하게 고려해야 합니다. 디바이스 하드웨어, 연결 및 프로토콜 및 클라우드 서비스에 대한 선택 사항은 솔루션의 안정성 요구 사항 및 기능에 영향을 줍니다.

IoT 워크로드의 안정성 평가

Well-Architected Framework 안정성 핵심 요소의 렌즈를 통해 IoT 워크로드를 평가하려면 Azure Well-Architected 검토에서 IoT 워크로드에 대한 안정성 질문을 완료합니다. 평가에서 IoT 솔루션에 대한 주요 안정성 권장 사항을 식별한 후 다음 콘텐츠를 사용하여 권장 사항을 구현합니다.

디자인 원칙

아키텍처 우수성의 5가지 핵심 요소는 IoT 워크로드 디자인 방법론을 뒷받침합니다. 이러한 핵심 요소는 주요 IoT 디자인 영역에서 후속 디자인 결정을 내리는 나침반 역할을 합니다. 다음 디자인 원칙은 Azure Well-Architected Framework - 안정성의 품질 핵심 요소를 확장 합니다.

디자인 원리 고려 사항
복원력을 위한 디바이스 디자인 엔드 투 엔드 솔루션의 작동 시간 및 가용성 요구 사항을 충족하도록 디바이스를 디자인합니다. IoT 디바이스가 클라우드에 대한 일시적인 연결로 효율적으로 작동할 수 있는지 확인합니다.
비즈니스 요구 사항을 고려한 디자인 SLA(서비스 수준 계약)를 충족하기 위해 아키텍처 수정을 도입할 때 비용 영향이 불가피합니다. 예를 들어 안정성과 고가용성을 높이려면 지역 간 중복과 자동 크기 조정을 위한 자동화된 시스템을 구현할 수 있습니다. 어떻게 절충할 것인지 신중하게 고려해야 합니다.
안전하고 간단한 업데이트 절차 엔터프라이즈 IoT 솔루션은 운영자가 디바이스를 관리하는 방법에 대한 전략을 제공해야 합니다. IoT 연산자는 간단하고 신뢰할 수 있는 업데이트 도구와 사례가 필요합니다.
애플리케이션 상태 관찰 가시성에 따라 SLI(서비스 수준 지표) 및 SLO(서비스 수준 목표)를 정의합니다. 클라우드 서비스가 제공하는 것 이상으로 감사, 모니터링 및 경고 프로세스를 추가합니다.
중요한 구성 요소에 대한 HA/DR(고가용성 및 재해 복구)입니다. 지역 간 중복을 포함하여 중복성으로 빌드되는 복원력 있는 하드웨어 및 소프트웨어 구성 요소입니다.
용량 계획 서비스 할당량 및 제한, 검색 작업 간의 대기 시간 계획 및 중단 없는 데이터 흐름을 지원하기 위해 프로덕션 규모에서 벤치마크를 설정합니다.

IoT 아키텍처 계층

안정성 디자인 원칙은 IoT 워크로드가 기본 IoT 아키텍처 계층의 요구 사항을 충족하도록 고려 사항을 명확히 하는 데 도움이 됩니다. 전반적인 솔루션 안정성을 달성하려면 각 계층에 허용 가능한 수준의 안정성이 있어야 합니다.

IoT 아키텍처의 레이어 및 교차 절단 작업을 보여 주는 다이어그램

디바이스 및 게이트웨이 계층

전체 IoT 솔루션의 일부로 솔루션의 엔드투엔드 작동 시간 및 가용성 요구 사항을 충족하도록 디바이스를 디자인합니다. 디바이스 및 게이트웨이는 다양한 형태로 제공됩니다. IoT 디바이스 및 게이트웨이는 데이터 수집, 감독 제어 및 에지 분석을 수행할 수 있습니다.

  • 데이터 수집은 디바이스를 센서에 연결하거나 다운스트림 시스템에서 원격 분석으로 구독하고 수집된 데이터를 클라우드로 푸시합니다. IoT 솔루션 디자인은 신뢰할 수 있는 디바이스 관리와 디바이스에서 클라우드로의 안정적인 통신을 보장해야 합니다.

  • 감독 제어를 제공하는 디바이스는 클라우드로 보낼 데이터를 수집할 뿐만 아니라 해당 데이터를 기반으로 작업을 수행합니다. 디바이스는 데이터를 컴퓨터 또는 환경으로 다시 전송하여 감독 작업을 수행합니다. 감독 제어 애플리케이션의 안정성은 매우 중요합니다.

디바이스 디자인

예상 수명 동안 예상되는 운영 조건에서 안정적으로 작동하도록 IoT 디바이스를 디자인하고 선택합니다. 신뢰할 수 있는 디바이스는 하드웨어 및 소프트웨어 사양에 따라 수행되어야 하며, 완화, 수리 또는 교체를 통해 오류를 감지하고 관리해야 합니다. 안정성을 위해 디바이스를 설계할 뿐만 아니라 오류도 계획합니다.

디바이스 수명 주기

제한된 서비스 수명은 솔루션 안정성에 영향을 줍니다. 솔루션에서 디바이스 오류의 결과를 평가하고 솔루션 요구 사항에 따라 디바이스 수명 주기 전략을 정의합니다.

디바이스 오류 영향 평가에는 다음이 포함됩니다.

  • 심각도(예: 단일 실패 지점)
  • 실패 사이의 평균 시간과 같은 확률입니다.
  • 오류 모드 및 효과 분석과 같은 검색 가능성.
  • 허용 가능한 가동 중지 시간.

허용되는 작동 가동 중지 시간은 디바이스 유지 관리의 속도와 범위를 결정합니다. 디바이스 및 부품 공급의 가용성 또는 수명은 디바이스 수명 주기에 대한 중요한 고려 사항입니다.

디자인이 모듈화될수록 특히 일부 부분이 다른 부분보다 더 일찍 사용되지 않는 경우 시스템의 일부를 쉽게 교체할 수 있습니다. 구성 요소 및 모듈 공급망의 대체 또는 다중 소싱은 신뢰할 수 있는 솔루션에 매우 중요합니다.

환경 요구 사항

디바이스가 작동하는 조건은 안정성에 영향을 줍니다. 환경 요구 사항을 정의하고 적절한 기능 사양이 있는 디바이스를 사용합니다. 이러한 사양에는 작동 온도 범위, 습도, IP(수신 보호) 등급, EMI(전자기 간섭) 면역, 충격 및 진동 면역과 같은 매개 변수가 포함됩니다.

운영 프로필

성능 스트레스는 디바이스의 작동 동작과 안정성에 영향을 줍니다. 디바이스 수명 동안 동작을 예측하고 그에 따라 디바이스 안정성을 평가하는 운영 프로필을 정의합니다. 이러한 프로필에는 무선 전송 또는 저전력 모드와 같은 작동 모드와 디바이스 수명 동안 온도와 같은 환경 조건이 포함됩니다.

정상적인 작동 조건에서 디바이스 및 소프트웨어는 지정된 운영 프로필 내에서 안전하게 실행되어야 합니다. 디바이스는 솔루션에 필요한 모든 외부 센서 및 데이터 처리를 서비스하고 처리할 수 있어야 합니다. 디바이스 기능의 제한에서 실행하지 않습니다.

규정 및 표준

특정 산업용 디바이스에는 해당 규정 및 표준이 적용됩니다. 규정 및 표준을 정의하고 디바이스가 규정 준수 및 적합성 요구 사항을 충족하는지 확인합니다. 규정에는 FCC 또는 CE와 같은 인증 및 표시가 포함됩니다. 표준에는 ATEX 및 MIL-SPEC과 같은 산업 또는 에이전시 애플리케이션과 IEC 61508과 같은 안전 준수가 포함됩니다.

장치 관리 및 모델링 계층

클라우드 서비스는 각 디바이스에 ID를 제공하고 대규모로 디바이스를 관리합니다. 클라우드는 디바이스에서 흐르는 모든 메시지에 대한 최종 데이터 수신 지점인 경우가 많습니다. IoT 솔루션에서 클라우드 서비스는 IoT 디바이스가 데이터를 통합하고 전송할 수 있도록 안정성을 제공해야 합니다.

클라우드에 대한 업스트림 로컬 네트워크에 대한 다운스트림을 포함한 디바이스 연결 조건은 IoT 솔루션 안정성 디자인의 일부여야 합니다. 연결 중단 또는 간섭의 잠재적 영향을 평가하고 그에 따라 연결 전략을 정의합니다.

연결 전략에는 대체 기능 및 연결 끊김 관리와 같은 견고성과 중요 또는 안전 기능에 대한 클라우드 종속성을 완화하기 위한 버퍼링 백업이 포함되어야 합니다.

다음 디자인, 오류 처리 및 모니터링 방법은 연결과 관련이 있습니다.

연결 디자인

IoT 솔루션은 간헐적으로 연결된 디바이스와 클라우드 기반 서비스 간의 정보 흐름을 사용하도록 설정해야 합니다. IoT 디바이스가 클라우드에 대한 일시적인 연결로 효율적으로 작동할 수 있는지 확인합니다.

모범 사례에는 다음 권장 사항이 포함됩니다.

  • 디바이스 소프트웨어에서 재시도 및 백오프 논리를 구현합니다.
  • 디바이스 상태를 클라우드와 동기화합니다.
  • 솔루션이 데이터 손실을 허용할 수 없는 경우 디바이스에 데이터를 저장할 수 있는지 확인합니다.
  • 데이터 샘플링 및 시뮬레이션을 사용하여 네트워크 용량 및 스토리지 요구 사항 기준을 측정합니다.

연결 구현

Azure IoT 디바이스 SDK는 디바이스 또는 게이트웨이에서 Azure IoT 서비스와의 연결을 간소화하는 데 사용할 수 있는 클라이언트 라이브러리를 제공합니다. SDK를 사용하여 다음과 같은 IoT 디바이스 클라이언트를 계측할 수 있습니다.

  • 클라우드에 연결합니다.
  • 다양한 플랫폼에서 일관된 클라이언트 개발 환경을 제공합니다.
  • 지터 및 재시도 논리를 사용한 지수 백오프와 같은 기본 프로토콜 및 메시지 처리 패턴의 세부 정보를 추상화하여 일반적인 연결 작업을 간소화합니다.

연결 모니터링

가능한 많은 오류 지점으로 인해 IoT 디바이스에 대한 연결 문제를 해결하기 어려울 수 있습니다. 애플리케이션 논리, 물리적 네트워크, 프로토콜, 하드웨어, Azure IoT Hub 및 기타 클라우드 서비스에 문제가 있을 수 있습니다.

문제의 원인을 감지하고 정확하게 파악하는 기능은 매우 중요합니다. 그러나 대규모 IoT 솔루션에는 수천 개의 디바이스가 있을 수 있으므로 개별 디바이스를 수동으로 검사 것은 실용적이지 않습니다. Azure Monitor 및 Azure Event Grid IoT Hub 연결 문제를 진단하는 데 도움이 될 수 있습니다.

연결 리소스

수집 및 통신 계층

IoT 수집 및 통신 계층은 서비스 할당량 및 제한, 용량, 제한 및 자동 크기 조정을 포함합니다.

중복 용량 디자인

임계값 및 경고를 계획할 때 검색과 수행된 작업 간의 대기 시간을 고려합니다. 시스템 및 운영자가 변경 요청에 응답할 충분한 시간이 있는지 확인합니다. 그렇지 않으면 예를 들어 단위 수를 늘려야 하는 필요성을 감지할 수 있지만 증가가 적용되기 전에 메시지가 손실되어 시스템이 실패할 수 있습니다.

서비스 할당량 계획

모든 플랫폼 서비스와 마찬가지로 IoT Hub 및 IoT Hub DPS(Device Provisioning Service)는 특정 작업에 할당량 및 제한을 적용하므로 Azure는 서비스에 대해 예측 가능한 서비스 수준과 비용을 제공할 수 있습니다. 할당량 및 제한은 배포하는 서비스 계층 및 단위 수에 연결되므로 적절한 수의 리소스로 솔루션을 디자인할 수 있습니다. 할당량 및 제한을 미리 검토하고 그에 따라 IoT Hub 및 DPS 리소스를 디자인합니다.

프로덕션 규모 벤치마크

디바이스 수 또는 데이터 볼륨이 증가함에 따라 클라우드 게이트웨이는 중단 없는 데이터 흐름을 지원하도록 크기를 조정해야 합니다. IoT 솔루션의 분산 특성, 디바이스 수 및 데이터 볼륨으로 인해 전체 솔루션에 대한 규모 벤치마크를 설정하는 것이 중요합니다. 이러한 벤치마크는 용량 위험을 계획하는 데 도움이 됩니다. Azure IoT 디바이스 원격 분석 시뮬레이터를 사용하여 프로덕션 규모 볼륨을 시뮬레이션합니다.

할당량에 동적으로 조정하기 위한 자동 크기 조정

PaaS(Platform as a Service) 구성 요소를 사용할 경우의 이점은 필요에 따라 약간의 노력으로 스케일 업 및 다운할 수 있다는 것입니다. 가장 낮은 비용과 운영 노력을 제공하려면 자동화된 시스템을 구현하여 솔루션의 다양한 요구 사항에 따라 리소스를 확장 및 축소하는 것이 좋습니다.

할당량 및 제한 관리

솔루션 안정성을 보장하려면 할당량 및 제한에 대한 리소스 사용량을 지속적으로 모니터링하여 크기 조정 필요성을 나타내는 사용량 증가를 검색합니다. 비즈니스 요구 사항에 따라 지속적으로 리소스 사용량을 모니터링하고 임계값이 충족되면 운영자에게 경고하거나 자동 크기 조정을 위해 자동화된 시스템을 구현할 수 있습니다.

용량 및 크기 조정 리소스

전송 계층

데이터, 제어 및 관리를 위해 클라우드 서비스에 연결하려면 디바이스가 네트워크에 액세스해야 합니다. IoT 솔루션의 유형에 따라 연결 안정성은 사용자의 책임 또는 네트워크 서비스 공급자의 책임일 수 있습니다. 네트워크에는 간헐적인 연결 문제가 있을 수 있으며 디바이스는 그에 따라 동작을 관리해야 합니다.

DevOps 계층

엔터프라이즈 IoT 솔루션은 운영자가 시스템을 관리하는 전략을 제공해야 합니다. 안정성을 해결하려면 IoT 관리 및 운영에서 DevOps 프로세스를 사용하여 업데이트, 가시성 및 모니터링 및 HA/DR 구현을 처리해야 합니다.

업데이트

IoT 솔루션의 디바이스 측면은 클라우드 기반 솔루션에 비해 문제를 제시합니다. 예를 들어 취약성 및 애플리케이션 변경을 해결하기 위해 디바이스를 지속적으로 업데이트하는 방법이 있어야 합니다.

IoT 솔루션의 분산 특성으로 인해 업데이트를 배포하기 위한 안전하고 안전한 정책을 채택하는 것이 중요합니다. IoT 연산자는 간단하고 신뢰할 수 있는 업데이트 도구 및 사례가 필요합니다.

디바이스 업데이트 솔루션은 다음을 지원해야 합니다.

  • 디바이스 그룹화 및 예약 컨트롤을 통한 점진적 업데이트 롤아웃.
  • 원활한 롤백을 위한 복원력 있는 A/B 디바이스 업데이트를 지원합니다.
  • 자세한 업데이트 관리 및 보고 도구.
  • 사용 가능한 대역폭을 기반으로 네트워크 최적화.

IoT Hub 디바이스 업데이트는 안전하고 안전하며 신뢰할 수 있는 OTA(무선) IoT 디바이스 업데이트를 가능하게 하는 서비스입니다. IoT Hub 대한 디바이스 업데이트는 디바이스를 그룹화하고 업데이트를 받아야 하는 디바이스를 지정할 수 있습니다. 운영자는 업데이트 배포의 상태 각 디바이스가 필요한 업데이트를 성공적으로 적용하는지 여부를 볼 수 있습니다.

업데이트가 실패하면 디바이스 업데이트는 운영자가 실패한 디바이스를 식별하고 오류 세부 정보를 확인하는 데 도움이 됩니다. 실패한 디바이스를 식별하는 기능은 실패 원본을 수동으로 파악하는 데 소요되는 시간을 제거할 수 있습니다.

디바이스 업데이트는 디바이스 배포 및 업데이트의 상태 모니터링하고 사용 가능한 가장 높은 버전 호환 업데이트를 준수하는 디바이스 수를 보고합니다.

관찰 가능성 및 모니터링

전반적인 솔루션 안정성을 관리하고 경고 절차를 정의하려면 IoT 솔루션의 모든 구성 요소를 모니터링해야 합니다. 모든 Azure IoT 서비스는 서비스 상태 및 가용성을 설명하는 메트릭을 게시합니다. 엔드 투 엔드 가시성을 설정하려면 디바이스 쪽에서 필요한 메트릭도 고려합니다. 이러한 메트릭을 전체 솔루션 안정성 모니터링의 일부로 사용합니다.

IoT 애플리케이션 모니터링 및 진단 가용성 및 복원력에 매우 중요합니다. 오류가 발생하면 무엇이, 언제, 왜 실패했는지 알아야 합니다. 정상 상태에 대해 IoT 애플리케이션 및 디바이스의 작업을 모니터링하여 안정성 문제를 감지하고 해결할 수 있습니다.

IoT 애플리케이션 안정성에 영향을 주는 문제를 완화하려면 엔드투엔드 작업에서 문제를 감지하는 데 도움이 되는 로그 및 신호를 캡처할 수 있어야 합니다. 로깅 및 모니터링을 사용하여 IoT 솔루션이 예상대로 작동하는지 확인하고 솔루션 구성 요소 문제를 해결하는 데 도움이 됩니다.

다음 작업은 IoT 솔루션에 대한 가시성을 지원합니다.

  • 성능 메트릭 및 경고를 수집하고 분석하는 메커니즘을 설정합니다.
  • Azure Monitor를 수집하고 연결하도록 디바이스, 클라우드 서비스 및 애플리케이션을 구성합니다.
  • 실시간 대시보드 및 경고를 사용하여 Azure 백 엔드 서비스를 모니터링합니다.
  • 이벤트 및 경고에 대한 모니터링 및 행동에 대한 역할 및 책임을 정의합니다. 자세한 내용은 역할, 책임 및 권한을 참조하세요.
  • 지속적인 모니터링을 구현합니다.

Azure Monitor

Azure Monitor는 Azure IoT 솔루션에 권장되는 모니터링 및 시각화 플랫폼입니다. 배포 위치에 관계없이 디바이스, 클라우드 서비스 및 애플리케이션을 구성하여 로그 메시지를 직접 또는 기본 제공 커넥터를 통해 Azure Monitor에 푸시할 수 있습니다.

  • IoT Edge 디바이스의 원격 모니터링에 Azure Monitor 기본 제공 메트릭 통합을 사용합니다. 디바이스에서 이 기능을 사용하도록 설정하려면 IoT Edge 메트릭 수집기 모듈을 배포에 추가하고 모듈 메트릭을 수집하고 Azure Monitor로 전송하도록 구성합니다.

  • Azure Monitor를 사용하면 IoT Hub 환경의 상태를 모니터링하고, 제대로 실행되고 있는지 확인하고, 디바이스가 제한되거나 연결 문제가 발생하지 않는지 확인할 수 있습니다. IoT Hub 사용된 메시지 수 및 연결된 디바이스 수와 같은 사용 메트릭을 제공합니다. 분석을 위해 이 데이터를 Azure Monitor에 릴레이하고 다른 서비스에 경고할 수 있습니다.

  • 솔루션에서 Azure IoT Central을 사용하는 경우 IoT Central에서 제공하는 메트릭을 사용하여 연결된 디바이스 및 활성 데이터 내보내기의 상태를 평가할 수 있습니다. IoT Central 애플리케이션은 기본적으로 메트릭을 사용하도록 설정하며, Azure Portal 액세스할 수 있습니다. Azure Monitor는 이러한 메트릭과 상호 작용하는 여러 가지 방법을 노출하고 제공합니다.

  • Azure Monitor는 인덱싱 및 검색을 위해 이벤트 및 레코드를 개별 필드로 쉽게 분해할 수 있도록 사용자 지정 로그 구문 분석을 제공합니다.

  • 실시간 대시보드 및 Azure Monitor 경고를 구현하여 Azure 백 엔드 서비스를 모니터링합니다. 경고는 모니터링 데이터의 특정 조건에 대해 사전에 알리므로 고객이 문제를 발견하기 전에 문제를 식별하고 해결할 수 있습니다. 메트릭, 로그 및 활동 로그에서 경고를 설정할 수 있습니다.

Application Insights는 라이브 웹앱에 대해 확장 가능한 애플리케이션 성능 관리 및 모니터링을 제공하는 Azure Monitor 기능입니다. IoT 솔루션이 사용자 지정 Azure App Service, Azure Kubernetes Service 또는 Azure Functions 애플리케이션을 사용하는 경우 앱 모니터링 및 분석에 Application Insights를 사용할 수 있습니다.

Application Insights는 다음을 수행할 수 있습니다.

  • 성능 변칙을 자동으로 검색합니다.
  • 강력한 분석 도구를 사용하여 문제를 진단하는 데 도움이 됩니다.
  • 사용자가 앱을 사용하여 실제로 수행하는 작업을 표시합니다.
  • 앱 성능 및 유용성을 지속적으로 개선하는 데 도움이 됩니다.

연속 모니터링

CI/CD(연속 통합 및 지속적인 배포)는 사용자에게 지속적인 가치를 제공하기 위해 소프트웨어를 보다 빠르고 안정적으로 제공하는 DevOps 사례입니다. CM(연속 모니터링) 은 DevOps 주기의 모든 단계 및 구성 요소에 걸쳐 모니터링을 통합하는 유사한 개념입니다.

CM은 개발, 프로덕션 및 릴리스를 통해 고객에게 전달될 때 앱 및 인프라의 상태, 성능 및 안정성을 지속적으로 보장합니다. 자세한 내용은 다음을 참조하세요.

리소스 모니터링

중요한 구성 요소에 대한 HA/DR

IoT 솔루션을 디자인하고 빌드할 때 솔루션 스택에서 오류 복구를 위해 SLA를 충족해야 합니다. SLA는 HA/DR이 필요한 중요한 시스템 구성 요소에 대해 안내해야 합니다. IoT 솔루션 스택의 중복성에서 특정 계층에 대한 중복성에 이르기까지 여러 가지 방법이 있습니다. 비용은 SLA를 충족하는 것의 중요성에 무게를 두는 주요 고려 사항이기도 합니다.

  • Azure IoT 서비스는 가동 시간 및 가용성 목표를 정의했습니다. 솔루션의 일부인 Azure IoT 서비스에 대한 SLA를 검토하여 가동 시간 목표를 충족하는지 확인합니다. 예를 들어 Azure IoT Hub SLA가 99.9%이므로 하루에 1분 36초의 잠재적 가동 중지 시간을 계획해야 합니다. Azure IoT Hub SDK는 다시 시도 및 백오프를 처리하는 구성 가능한 기본 제공 논리를 제공합니다.

  • 작동 시간 목표를 디바이스 관리 및 데이터 수집 작업의 두 가지 범주로 나누는 것이 좋습니다. 예를 들어 디바이스 관리 서비스를 사용할 수 없는 경우에도 디바이스가 IoT Hub로 데이터를 성공적으로 보내는 것이 중요할 수 있습니다. 자세한 내용은 Azure IoT Hub SDK 안정성 기능을 참조하세요.

  • 센서, 전원 및 스토리지에 중복 하드웨어를 사용하는 것이 좋습니다. 중복 하드웨어를 사용하면 중요한 구성 요소를 사용할 수 없는 경우 디바이스가 작동할 수 있습니다. 하드웨어는 연결 문제에도 도움이 될 수 있습니다. 예를 들어 연결을 사용할 수 없는 경우 데이터에 대해 저장소 및 전달 방법을 사용할 수 있습니다. Azure IoT Edge 이 기능이 기본 제공됩니다.

  • 디바이스는 클라우드 중단을 처리할 수도 있어야 합니다. Azure 지역 페어링은 많은 SLA 요구 사항을 충족하는 IoT Hub HA/DR 전략을 제공합니다. 지역 페어링으로 충분하지 않은 경우 보조 IoT Hub를 구현하는 것이 좋습니다. DPS를 사용하여 디바이스에서 하드 코딩된 IoT Hub 구성을 방지할 수도 있습니다. 기본 IoT Hub가 다운되면 DPS는 디바이스를 다른 허브에 할당할 수 있습니다.

  • 대부분의 경우 온라인 상태일 것으로 예상되는 디바이스에 하트비트 메시지 패턴을 구현하는 것이 좋습니다. 이 패턴은 Azure Stream Analytics, Azure Logic Apps 또는 Azure Functions 사용자 지정 IoT Hub 경로를 사용하여 하트비트가 실패했는지 확인합니다. 하트비트를 사용하여 필요에 따라 작업을 수행하는 Azure Monitor 경고를 정의할 수 있습니다.

HA/DR 리소스

다음 단계