Resource Health 개요
Azure Resource Health를 통해 Azure 리소스에 영향을 주는 서비스 문제를 진단하고 지원을 받을 수 있습니다. Azure Resource Health는 리소스의 현재 및 과거 상태를 보고합니다.
Azure 상태는 광범위한 Azure 고객 집합에 영향을 주는 서비스 문제를 보고합니다. Resource Health는 개인화된 리소스 상태 대시보드를 제공합니다. Resource Health는 Azure 서비스 문제로 인해 리소스를 사용할 수 없었던 모든 시간을 보여 줍니다. 이 데이터를 통해 SLA 위반 여부를 쉽게 확인할 수 있습니다.
‘리소스’는 가상 머신, 웹앱 또는 SQL Database와 같은 Azure 서비스의 특정 인스턴스입니다. Resource Health는 다양한 Azure 서비스의 신호를 사용하여 리소스의 정상 여부를 평가합니다. 리소스가 정상이 아니면 Resource Health에서 추가 정보를 분석하여 문제 원인을 파악합니다. 또한 Microsoft에서 문제 해결을 위해 수행하는 작업을 보고하고 사용자가 문제 해결을 위해 수행할 수 있는 작업을 식별합니다.
상태 평가 방법에 대한 자세한 내용은 Azure Resource Health에서 리소스 종류 및 상태 검사 목록을 참조하세요.
리소스 상태는 다음 상태 중 하나로 표시됩니다.
‘사용 가능’은 리소스의 상태에 영향을 주는 이벤트가 검색되지 않았음을 의미합니다. 리소스가 지난 24시간 동안 계획되지 않은 가동 중지 시간에서 복구된 경우 “최근에 해결됨” 알림이 표시됩니다.
‘사용할 수 없음’은 리소스의 상태에 영향을 주는 플랫폼 또는 비플랫폼 이벤트가 진행되고 있는 것이 서비스에서 검색되었음을 의미합니다.
플랫폼 이벤트는 Azure 인프라의 여러 구성 요소에 의해 트리거됩니다. 예약된 작업(예: 계획된 유지 관리)과 예기치 않은 인시던트(예: 계획되지 않은 호스트 다시 부팅 또는 지정한 기간 후에 실패할 것으로 예상되는 저하된 호스트 하드웨어)가 모두 포함됩니다.
Resource Health는 이벤트 및 복구 프로세스에 대한 추가 세부 정보를 제공합니다. 활성 지원 계약이 없는 경우에도 Microsoft 지원에 문의할 수 있습니다.
비플랫폼 이벤트는 사용자 작업을 통해 트리거됩니다. 예를 들어 가상 머신 중지, Azure Cache for Redis에 대한 최대 연결 수 도달 등이 포함됩니다.
‘알 수 없음’은 Resource Health가 리소스 관련 정보를 10분 넘게 받지 못했음을 의미합니다. 이는 일반적으로 가상 머신이 할당 해제된 경우에 발생합니다. 이 상태는 리소스 상태를 명확하게 표시하지는 않지만 문제 해결 시 중요한 데이터 요소입니다.
리소스가 예상한 대로 실행 중이면 몇 분 후 리소스 상태가 사용 가능으로 변경됩니다.
리소스 문제가 발생하는 경우 성능 상태가 ‘알 수 없음’이면, 플랫폼의 이벤트가 리소스에 영향을 미치고 있음을 의미할 수 있습니다.
‘저하됨’은 리소스를 계속 사용할 수는 있지만 리소스에서 성능 저하가 검색되었음을 의미합니다.
리소스마다 성능 저하를 보고하는 시기에 대한 고유한 기준이 있습니다.
가상 머신 확장 집합에 대한 자세한 내용은 Azure Virtual Machines 확장 집합에서 리소스 상태가 저하됨 페이지를 참조하세요.
상태가 지원되지 않음 또는 RP에 리소스에 대한 정보가 없거나 해당 리소스에 대한 읽기/쓰기 액세스 권한이 없음이라는 메시지는 상태 메트릭에서 해당 리소스가 지원되지 않음을 의미합니다.
상태 메트릭을 지원하는 리소스를 알아보려면 지원되는 리소스 종류 페이지를 참조하세요.
리소스 상태 이벤트는 다음과 같은 경우 활동 로그에 기록됩니다.
- 리소스에 대한 주석(예: "ResourceDegraded" 또는 "AccountClientThrottling")이 제출됩니다.
- 비정상으로 또는 비정상에서 전환된 리소스입니다.
- 리소스가 15분 넘게 비정상 상태였습니다.
다음 리소스 상태 전환은 활동 로그에 기록되지 않습니다.
- 알 수 없음 상태로 전환합니다.
- 다음과 같은 경우 알 수 없음 상태로 전환합니다.
- 이는 첫 번째 전환입니다.
- 알 수 없는 이전 상태가 이후의 새 상태와 같은 경우 (예를 들어 리소스가 정상에서 알 수 없음으로 전환되고 다시 정상으로 전환된 경우).
- 컴퓨팅 리소스의 경우: 비정상 시간이 35초 미만인 경우 정상에서 비정상으로 전환되었다가 다시 정상으로 전환되는 VM입니다.
참고
이벤트 - 구독 ID별 목록 REST API의 QueryStartTime 매개 변수를 사용하여 최대 1년까지 구독 및 쿼리 데이터의 현재 서비스 상태 이벤트를 나열할 수 있지만, 현재 이벤트 - 단일 리소스로 나열 REST API 아래에 QueryStartTime 매개 변수가 없으므로 지정된 리소스에 대한 현재 서비스 상태 이벤트를 나열하는 동안 최대 1년까지 데이터를 쿼리할 수 없습니다.
Azure Portal에서 Resource Health의 상태 기록 섹션에서 최대 30일의 기록에 액세스할 수 있습니다.
Azure에 플랫폼에서 시작된 사용 불가의 근본 원인에 대한 추가 정보가 있는 경우 해당 정보는 최초 사용 불가 후 최대 72시간까지 리소스 상태에 게시될 수 있습니다. 이 정보는 현재 가상 머신에만 사용할 수 있습니다.
하나의 리소스에 대한 Resource Health를 열려면:
- Azure Portal에 로그인합니다.
- 리소스를 찾습니다.
- 왼쪽 창의 리소스 메뉴에서 Resource Health를 선택합니다.
- 상태 기록 표에서 PDF를 다운로드하거나 RCA “공유/관리” 단추를 클릭하면 됩니다.
모든 서비스를 선택하고 필터 텍스트 상자에 Resource Health를 입력하여 Resource Health에 액세스할 수도 있습니다. 도움말 + 지원 창에서 Resource Health를 선택합니다.
Resource Health에 대한 자세한 내용은 다음 참조를 확인하세요.