Azure Stack Hub에서 상태 및 경고 모니터링

Azure Stack Hub에는 Azure Stack Hub 지역의 상태 및 알림을 볼 수 있는 인프라 모니터링 기능이 포함되어 있습니다. 지역 관리 타일에는 Azure Stack Hub의 모든 배포된 지역이 나열됩니다. 기본적으로 기본 공급자 구독의 관리자 포털에 고정됩니다. 이 타일에는 각 지역의 활성 위험 및 경고 알림 수가 표시됩니다. 타일은 Azure Stack Hub의 상태 및 알림 기능을 이용할 수 있는 곳입니다.

Azure Stack Hub 관리자 포털의 지역 관리 타일

Azure Stack Hub의 상태 이해

상태 리소스 공급자는 상태와 알림을 관리합니다. Azure Stack Hub 인프라 구성 요소는 Azure Stack Hub 배포 및 구성 중에 상태 리소스 공급자에 등록됩니다. 등록하면 각 구성 요소의 상태와 알림을 표시할 수 있습니다. Azure Stack Hub에서 상태는 아주 간단한 개념입니다. 등록된 구성 요소 인스턴스가 있으면 해당 구성 요소의 상태에 최악의 활성 알림 심각도인 경고 또는 위험이 반영됩니다.

알림 심각도 정의

Azure Stack Hub에서는 경고위험이라는 두 가지 심각도의 알림이 발생합니다.

  • 경고
    운영자는 예약된 방식으로 경고 경고를 해결할 수 있습니다. 알림은 일반적으로 사용자 워크로드에 영향을 주지 않습니다.

  • 심각
    운영자는 긴급하게 중요한 경고를 해결해야 합니다. 이러한 알림은 Azure Stack Hub 사용자에게 영향을 주고 있거나 곧 영향을 주게 될 문제를 나타냅니다.

구성 요소 상태 보기 및 관리

관리자 포털 및 REST API와 PowerShell을 통해 구성 요소의 성능 상태를 확인할 수 있습니다.

포털에서 성능 상태를 보려면 지역 관리 타일에서 확인할 지역을 클릭합니다. 인프라 역할 및 리소스 공급자의 성능 상태를 볼 수 있습니다.

인프라 역할 목록

리소스 공급자 또는 인프라 역할을 클릭하면 자세한 정보를 볼 수 있습니다.

경고

인프라 역할을 클릭한 다음 instance 역할을 클릭하면 시작, 다시 시작 또는 종료 옵션이 있습니다. 통합 시스템에 업데이트를 적용할 때는 이러한 작업을 사용하지 마세요. 또한 ASDK(Azure Stack Development Kit) 환경에서는 이러한 옵션을 사용하지 마세요 . 이러한 옵션은 인프라 역할당 두 개 이상의 역할 instance 있는 통합 시스템 환경을 위해 설계되었습니다. ASDK에서 역할 instance(특히 AzS-Xrp01)를 다시 시작하면 시스템 불안정이 발생합니다. 문제 해결 지원을 위해 Azure Stack Hub 포럼에 문제를 게시합니다.

경고 보기

각 Azure Stack Hub 지역의 활성 경고 목록은 지역 관리 블레이드에서 바로 확인할 수 있습니다. 기본 구성의 첫 번째 타일은 지역에 대한 위험 및 경고 알림 요약 정보를 표시하는 알림 타일입니다. 이 블레이드의 다른 타일처럼, 알림 타일도 대시보드에 고정하여 빠르게 액세스할 수 있습니다.

Azure Stack Hub 관리자 포털에서 경고를 표시하는 경고 타일

해당 지역의 전체 활성 경고 목록을 보려면 알림 타일의 맨 위 부분을 선택합니다. 필터링된 알림 목록(위험 또는 경고)을 보려면 타일에서 위험 또는 경고 줄 항목을 선택합니다.

경고 블레이드는 상태(활성 또는 닫힘) 및 심각도(위험 또는 경고)를 모두 필터링하는 기능을 지원합니다. 기본 보기에는 모든 활성 알림이 표시됩니다. 모든 종결된 경고는 7일 후 시스템에서 제거됩니다.

참고

경고가 활성 상태로 유지되지만 하루 동안 업데이트되지 않은 경우 Test-AzureStack 을 실행하고 문제가 보고되지 않으면 경고를 닫을 수 있습니다.

Azure Stack Hub 관리자 포털에서 위험 또는 경고 상태 필터링하는 필터 창

API 보기 작업은 목록 보기를 생성하는 데 사용한 REST API를 표시합니다. 이 작업을 사용하면 알림을 쿼리하는 데 사용할 수 있는 REST API 구문에 빠르게 익숙해질 수 있습니다. 이 API는 자동화에서 사용하거나 기존 데이터 센터 모니터링, 보고 및 티켓 솔루션과의 통합에 사용할 수 있습니다.

특정 알림을 클릭하면 알림 세부 정보를 볼 수 있습니다. 알림 세부 정보는 알림과 연결된 모든 필드를 표시하며, 영향을 받는 구성 요소 및 알림 출처를 빠르게 탐색할 수 있습니다. 예를 들어 인프라 역할 인스턴스 중 하나가 오프라인으로 전환되거나 액세스할 수 없게 되면 다음 경고가 발생합니다.

Azure Stack Hub 관리자 포털의 경고 세부 정보 블레이드

경고 수정

자동 재구성

일부 경고는 이전 이미지와 같이 복구 옵션을 지원합니다. 이 옵션을 선택하면 복구 작업은 경고와 관련된 단계를 수행하여 문제를 resolve 시도합니다. 선택한 후 복구 작업의 상태 포털 알림으로 사용할 수 있습니다.

진행 중인 경고 복구 작업

복구 작업은 동일한 포털 알림 블레이드에서 작업을 성공적으로 완료하거나 완료하지 못했다고 보고합니다. 경고에 대해 복구 작업이 실패하면 경고 세부 정보에서 복구 작업을 다시 실행할 수 있습니다. 복구 작업이 성공적으로 완료되면 복구 작업을 다시 실행하지 마세요. 인프라 역할 instance 다시 온라인 상태가 된 후 이 경고는 자동으로 닫힙니다.

복구 작업이 성공적으로 완료됨

수동 수정

복구 옵션이 지원되지 않는 경우 경고에 제공된 전체 수정 지침 집합을 따라야 합니다. 예를 들어 내부 인증서 만료 수정 단계는 비밀 회전 프로세스를 안내합니다.

인증서 만료 수정

경고 닫기

모든 경고가 아닌 많은 경고는 기본 문제가 해결될 때 자동으로 닫힙니다. Azure Stack Hub에서 문제를 해결하면 복구 작업 단추를 제공하는 경고가 자동으로 닫힙니다. 다른 모든 경고의 경우 수정 단계를 수행한 후 경고 닫기를 선택합니다. 문제가 지속되면 Azure Stack Hub에서 새 경고를 생성합니다. 이 문제를 resolve 경우 경고는 닫힌 상태로 유지되며 더 이상 단계가 필요하지 않습니다.

다음 단계

Azure Stack Hub의 업데이트 관리

Azure Stack Hub의 지역 관리