Azure Database for PostgreSQL 유연한 서버에는 Azure의 RHC(Resource Health Check) 프레임워크를 사용하는 HA(고가용성) 상태 모니터링 기능이 포함되어 있습니다. 이 서비스는 HA 지원 인스턴스의 상태에 대한 지속적인 인사이트를 제공하여 연결 및 가용성에 영향을 줄 수 있는 이벤트를 알립니다. 다음은 HA 안정성 문제를 해결하고 유지하는 데 도움이 되는 각 상태 및 관련 시나리오에 대해 자세히 설명합니다.
성능 상태
각 HA 상태는 특정 조건을 나타내는 다양한 내부 신호를 통해 모니터링됩니다. 다음은 Azure Database for PostgreSQL 유연한 서버에 영향을 줄 수 있는 시각적 표시기 및 시나리오와 함께 가능한 HA 상태입니다.
준비 – HA 정상
준비 상태는 HA 사용 서버가 장애 조치 준비 상태에 영향을 주는 검색된 문제 없이 정상적으로 작동함을 나타냅니다. 필요한 모든 구성은 그대로 유지되며 중요한 오류 조건이 검색되지 않았습니다.
성능 저하 - NSG(네트워크 보안 그룹) 또는 가상 어플라이언스 차단 연결
NSG 규칙 또는 가상 어플라이언스가 고가용성을 위해 필요한 필수 연결을 차단하는 경우 성능 저하 상태가 나타날 수 있습니다. 이 구성 문제는 전체 HA 기능을 방지하며 NSG 설정을 조정하여 수정해야 합니다.
성능 저하 – 읽기 전용 상태
PostgreSQL 유연한 서버가 읽기 전용 상태로 들어가면 성능 저하 상태가 이 제한을 반영합니다. 이를 위해서는 일반적으로 추가 리소스를 프로비전하거나 전체 기능을 복원하기 위해 읽기 전용 설정으로 이어진 조건을 해결해야 합니다.
성능 저하 – 성능 저하 상태의 고가용성
일시적인 문제 또는 시스템 수준 조건으로 인해 HA 서비스 자체의 성능이 저하되는 경우 이 상태가 나타납니다. 재시도 논리를 구현하면 이러한 일시적인 연결 중단의 영향을 완화하는 데 도움이 될 수 있습니다. "성능 저하" 상태가 서버를 사용할 수 없다는 의미는 아닙니다. 대신 전체 HA 설정 및 상태 검사가 아직 완전히 완료되지 않았다는 것을 나타냅니다. 이 상태에도 불구하고 서버는 여전히 작동하고 액세스할 수 있습니다.
이러한 기간 동안 데이터베이스의 가용성을 정확하게 모니터링하려면 데이터베이스 가용성 메트릭의 일부로 "is_db_alive" 메트릭을 사용하는 것이 좋습니다. 이 메트릭은 데이터베이스의 가용성에 대한 신뢰할 수 있는 지표를 제공하여 일시적인 불완전한 HA 설정과 실제 가동 중지 시간을 구분하는 데 도움이 됩니다.
성능 저하 – 계획된 장애 조치(failover) 시작됨
서버에 대해 시작된 계획된 장애조치 이벤트 중에 성능 저하 상태가 나타나며 이는 HA 장애 조치(failover) 프로세스가 활성 상태임을 나타냅니다. 이는 일반적으로 짧고 제어되는 프로세스이며, 서비스는 곧 다시 시작해야 합니다.
성능 저하 – 계획되지 않은 장애 조치(failover) 시작됨
un계획된 장애조치 경우 이 상태는 예기치 않은 상황에서 트리거되는 활성 장애 조치(failover) 이벤트를 나타냅니다. 이 시나리오에는 서버가 장애 조치(failover) 절차를 완료할 때까지 짧은 연결 중단이 포함될 수 있습니다.
성능 저하 – 업그레이드 장애 조치(failover) 시작됨
시스템 업그레이드 중에 HA 서버는 필요한 업데이트를 적용하기 위해 업그레이드 장애 조치(failover)를 겪을 수 있습니다. 이 상태에서는 서버가 새 연결을 일시적으로 제한할 수 있으며 일시적인 문제를 효과적으로 처리하려면 재시도 논리를 구현해야 합니다.
Resource Health 경고 구성
HA 사용 PostgreSQL 인스턴스의 상태 변경이 발생할 때 실시간 알림을 받도록 Resource Health 경고를 설정할 수 있습니다. 구성은 Azure Portal을 통해 또는 ARM 템플릿을 사용하여 사용할 수 있으므로 포털을 적극적으로 모니터링하지 않고도 HA 상태 업데이트에 대한 정보를 유지할 수 있습니다.
포털을 통해 리소스 상태 경고를 구성하는 단계
- Azure Portal로 이동하여 PostgreSQL 유연한 서버를 선택합니다.
- 왼쪽 메뉴의 "모니터링" 섹션에서 "경고"를 선택합니다.
- "새 경고 규칙"을 선택하고 Resource Health 신호에 따라 경고 논리를 구성합니다.
- 알림 방법(이메일, SMS 등)을 지정하도록 작업 그룹을 설정합니다.
- 경고 규칙 검토 및 만들기.
ARM 템플릿을 사용하여 Resource Health 경고를 만드는 단계
- Resource Health 경고 ARM 템플릿 가이드에서 ARM 템플릿을 다운로드합니다.
- 특정 서버 세부 정보 및 경고 기본 설정을 사용하여 템플릿을 사용자 지정합니다.
- Azure CLI 또는 Azure PowerShell을 사용하여 ARM 템플릿을 배포합니다.
- 배포를 확인하고 경고가 활성 상태인지 확인합니다.
경고 설정에 대한 자세한 내용은 다음 가이드를 따르세요.
HA 상태 모니터링을 사용하면 PostgreSQL 서버의 HA 성능에 대한 중요한 인사이트를 얻을 수 있으므로 가동 시간 및 가용성 관리에 대한 사전 예방적 접근 방식을 사용할 수 있습니다.