Resource Health를 사용하여 Azure SQL Database 연결 문제 해결

적용 대상:Azure SQL Database

Azure SQL Database용 Resource Health는 Azure 문제가 리소스에 영향을 줄 때 문제를 진단하고 지원을 받는 데 도움이 됩니다. 리소스의 현재 및 이전 상태에 대해 알려주고 문제를 완화하는 데 도움이 됩니다. Resource Health 창은 Azure 서비스 문제에 대해 도움이 필요한 경우 기술 지원을 제공합니다.

Screenshot of the Azure portal showing the Resource Health page for an Azure SQL Database.

상태 검사

Resource health는 리소스에 대한 로그인의 성공 및 실패를 검사하여 SQL 데이터베이스의 상태를 결정합니다. 현재 SQL 데이터베이스 리소스에 대한 Resource health는 시스템 오류로 인한 로그인 실패만 검사하며 사용자 오류는 검사하지 않습니다. 상태는 1~2분 간격으로 업데이트됩니다.

성능 상태

사용 가능

사용 가능 상태는 SQL 데이터베이스의 시스템 오류로 인해 Resource health가 로그인 실패를 감지하지 못했거나 일부 로그인 오류가 있었지만 경고 임계값을 충족하지 못했음을 의미합니다. 다음 섹션에서 경고 임계값에 대한 자세한 정보를 제공합니다.

Screenshot of the Azure portal showing the status message for the state of Available.

성능 저하됨

성능 저하의 상태는 지난 3분 중 2분 동안 Resource health가 감지되었음을 의미합니다.

  • 대부분 성공적인 로그인이지만 둘 이상의 로그인 실패(시스템 오류로 인한)가 발생했거나
  • 시스템 오류로 인해 로그인 오류가 두 번 이상 발생했지만 총 6회 미만의 로그인 시도가 있었습니다.

이러한 오류는 일시적인 로그인 오류일 가능성이 높습니다. 일시적인 로그인 오류로 인한 연결 issue의 효과를 줄이려면 코드에서 다시 시도 논리를 구현합니다.

Screenshot of the Azure portal showing the status message for the state of Degraded.

Unavailable

사용할 수 없음 상태는 Resource health가 마지막 순간에 5회 이상의 로그인 시도가 있음을 감지했으며, 그 중 4분의 1 이상이 시스템상의 이유로 실패했음을 의미합니다. 리소스가 이 상태로 장기간 유지되면 Microsoft 지원에 문의하세요.

Screenshot of the Azure portal showing the status message for the state of Unavailable.

Unknown

알 수 없음 상태는 Resource health에서 이 리소스에 대한 정보를 10분 이상 수신하지 못했음을 의미합니다. 이 상태는 리소스 상태에 대한 명확한 표시는 아니지만 문제 해결 프로세스의 중요한 데이터 포인트입니다. 리소스가 예상한 대로 실행 중이면 몇 분 후 리소스 상태가 사용 가능으로 변경됩니다. 리소스에 문제가 발생하는 경우 상태가 알 수 없음이면, 플랫폼의 이벤트가 리소스에 영향을 미치고 있다는 것을 의미할 수 있습니다.

Screenshot of the Azure portal showing the status message for the state of Unknown.

경고 시간

Resource health 경고에 표시된 시간은 경고를 발생시킨 로그인 실패 시간과 일치하지 않습니다. 이는 Resource health 문제가 있는지 확인하기 위해 원격 분석을 수집하고 분석하는 데 몇 분 정도 걸리기 때문입니다. 따라서 Resource health 경고에 표시된 시간은 로그인 실패 후 몇 분 후입니다.

또한 로그인 오류가 발생한 시간 간격은 Resource health 경고의 시간 간격보다 짧을 수 있습니다.

기록 정보

Resource healthHealth history 섹션에서 최대 30일의 상태 기록에 액세스할 수 있습니다. 섹션에는 가동 중지 시간 이유가 포함됩니다(가능한 경우). 현재 Azure는 데이터베이스 리소스의 가동 중지 시간을 2분 단위로 표시합니다. 실제 가동 중지 시간은 1분 미만일 가능성이 높습니다. 평균은 8초입니다.

가동 중지 시간 원인

데이터베이스에 가동 중지 시간이 발생하면 이유를 확인하기 위해 분석이 수행됩니다. 사용 가능한 경우 가동 중지 시간 이유가 Resource healthHealth history 섹션에 보고됩니다. 가동 중지 시간 이유는 일반적으로 이벤트 발생 후 45분 내에 게시됩니다.

유지 관리 기간 선택

유지 관리 기간을 구성하여 영향을 미치는 유지 관리 이벤트를 예측하고 워크로드 중단을 줄일 수 있습니다. 유지 관리 기간 기능을 사용하면 예측 가능한 업그레이드나 예약된 유지 관리를 계획할 수 있습니다. 사전 알림은 기본이 아닌 유지 관리 기간을 사용하도록 구성된 데이터베이스에서 사용할 수 있습니다. 사전 알림을 통해 고객은 예정된 이벤트보다 최대 24시간 전에 알림을 전송하도록 구성할 수 있습니다.

계획된 유지 관리

Azure 인프라는 정기적으로 계획된 유지 관리를 수행합니다. -데이터 센터의 하드웨어 또는 소프트웨어 구성 요소 업그레이드 데이터베이스에서 유지 관리를 수행하는 동안 Azure SQL은 일부 기존 연결을 종료하고 새 연결을 거부할 수 있습니다. 계획된 유지 관리를 수행하는 동안 발생하는 로그인 실패는 일반적으로 일시적이며 일시적 네트워크 오류를 위한 다시 시도 논리로 그 효과를을 줄일 수 있습니다. 로그인 오류가 계속 발생하면 고객 지원팀에 문의하세요.

Reconfiguration

재구성은 일시적인 조건으로 간주되며 때때로 필요합니다. 이러한 이벤트는 부하 분산 또는 소프트웨어/하드웨어 실패에 의해 트리거될 수 있습니다. 클라우드 데이터베이스에 연결하는 모든 클라이언트 프로덕션 애플리케이션은 이러한 상황을 완화하므로 강력한 연결 일시적 오류에 대한 재시도 논리를 구현해야 하며 일반적으로 오류를 최종 사용자에게 투명하게 해야 합니다.