Azure Stack HCI 클러스터 모니터링

완료됨

Contoso에서 씨름하는 문제 중 하나는 다양한 조각화된 컴퓨팅 환경 때문에 통합된 모니터링 및 관리 솔루션이 없다는 것입니다. 최근의 작동 중단에서 여실히 드러났듯이, 중요 업무용 워크로드에 대한 서비스 수준 계약을 준수하고 워크로드 가용성에 영향을 주는 문제에 적시에 응답하기 위해 이러한 솔루션을 구현하는 것이 매우 중요합니다. Azure Stack HCI 기능을 평가하는 과정에서 클러스터 모니터링 옵션을 탐색하기로 결정합니다. 또한 Contoso의 온-프레미스 데이터 센터에 있는 Azure Stack HCI 클러스터를 포함하여 광범위한 하드웨어 및 소프트웨어 리소스를 모니터링하는 데 사용할 수 있는 단일 창을 제공할 수 있는 솔루션을 파악하려고 합니다.

Azure Stack HCI 클러스터 모니터링 개요

Azure Stack HCI의 상대적으로 복잡한 아키텍처 때문에 포괄적인 모니터링 방법은 다음과 같이 관련된 모든 구성 요소에 대한 가시성을 제공해야 합니다.

  • 클러스터
  • 클러스터 노드
  • 볼륨
  • 드라이브
  • VM(가상 컴퓨터)

Windows Admin Center, Microsoft Azure Monitor 또는 PowerShell의 기본 제공 기능을 사용하여 이러한 방법을 구현할 수 있습니다.

Windows Admin Center를 사용하여 Azure Stack HCI 클러스터 모니터링

Windows Admin Center는 클러스터 및 해당 구성 요소의 상태와 성능을 신속하게 평가할 수 있는 미리 정의된 대시보드를 제공합니다. 대시보드를 통해 제공되는 데이터는 대상 클러스터에 연결하는 즉시 사용할 수 있습니다.

Windows Admin Center를 사용하여 클러스터 모니터링

Windows Admin Center의 클러스터 관리자 인터페이스에는 다음과 같은 클러스터 상태 및 성능에 대한 정보를 표시하는 대시보드가 포함되어 있습니다.

  • 클러스터 관련 경고
  • 클러스터 노드의 목록
  • 클러스터에서 사용할 수 있는 디스크 및 볼륨의 목록
  • 클러스터에서 호스트되는 VM의 목록
  • 총 클러스터 CPU 사용량(모든 클러스터 노드에서 집계)
  • 총 클러스터 메모리 사용량(모든 클러스터 노드에서 집계)
  • 총 클러스터 스토리지 사용량(모든 클러스터 노드에서 집계)
  • 전체 클러스터 노드의 총 IOPS(초당 입출력 작업 수)
  • 전체 클러스터 노드의 디스크 작업 평균 대기 시간(밀리초)

The screenshot depicts the Windows Admin Center dashboard displaying information about the status and performance of a cluster.

클러스터 노드 모니터링

Windows Admin Center를 사용하여 클러스터에 연결한 후 도구 메뉴를 통해 서버 창에 액세스할 수 있습니다. 서버 창의 인벤토리 탭을 사용하면 Azure Stack HCI 클러스터의 멤버인 각 서버에 대해 다음과 같은 정보를 표시할 수 있습니다.

  • 속성
  • 운영 체제 상태
  • 운영 체제 작동 시간
  • 하드웨어 제조업체, 모델 및 일련 번호
  • CPU 및 메모리 사용률

참고

각 서버에 대해 Windows Admin Center의 성능 모니터 창에서 개별 성능 메트릭의 모니터링을 구성할 수 있습니다.

참고

CPU 사용률이 85%를 초과하거나 사용 가능한 메모리가 10분 이상 100MB 미만으로 떨어지는 경우 서버 성능을 조사해야 합니다.

The screenshot depicts the Windows Admin Center dashboard displaying information about the status and performance of cluster nodes.

클러스터 볼륨 모니터링

클러스터에 연결하면 해당 도구 메뉴의 볼륨 창에도 액세스할 수 있습니다. 해당 창의 인벤토리 탭에서 클러스터의 스토리지 공간 다이렉트 스토리지 풀에 포함된 각 볼륨에 대해 다음과 같은 정보를 표시할 수 있습니다.

  • 이름
  • 상태
  • 파일 시스템(ReFS 또는 CSVFS)
  • 복원력(양방향 미러, 3방향 미러 또는 미러 가속 패리티)
  • 전체 크기 및 사용된 공간
  • 볼륨이 속한 스토리지 풀
  • IOPS 성능

The screenshot depicts the Windows Admin Center dashboard displaying information about the status and performance of cluster volumes.

클러스터 드라이브 모니터링

클러스터 노드에 연결된 모든 물리적 드라이브의 상태를 신속하게 평가하려면 Windows Admin Center를 사용하여 클러스터에 연결한 후 도구 메뉴를 통해 드라이브 창으로 이동합니다. 드라이버 창의 인벤토리 탭에서 각 드라이브에 대해 다음과 같은 정보를 표시할 수 있습니다.

  • 모델 및 일련 번호
  • 상태
  • 전체 크기 및 사용된 공간
  • 유형(SSD 또는 HDD)
  • 사용량(캐시 또는 용량)
  • 위치(스토리지 어댑터 및 포트) 및 드라이브가 연결된 서버
  • 드라이브가 속한 스토리지 풀

The screenshot depicts the Windows Admin Center dashboard displaying information about the status and performance of cluster drives.

클러스터된 VM 모니터링

또한 클러스터 내에서 실행되는 VM의 상태 및 성능을 검토하는 옵션도 있습니다. 이렇게 하려면 Windows Admin Center를 사용하여 클러스터에 연결한 후 도구 메뉴를 통해 가상 머신 창으로 이동합니다. 해당 창의 인벤토리 탭을 사용하면 각 VM에 대해 다음과 같은 정보를 표시할 수 있습니다.

  • 속성
  • VM 상태(실행 중 또는 중지됨)
  • VM이 실행 중인 호스트 서버
  • 운영 체제 작동 시간
  • 하트비트 상태
  • 재해 복구 상태
  • CPU 및 메모리 성능 메트릭

The screenshot depicts the Windows Admin Center dashboard displaying information about the status and performance of clustered VMs.

참고 항목

클러스터는 하트비트라고 하는 주기적 검사를 사용하여 VM 가용성의 유효성을 검사합니다.

Azure Monitor를 사용하여 Azure Stack HCI 모니터링

Azure Stack HCI를 Azure Monitor와 통합하여 보다 심층적인 모니터링, 경고 및 로그 분석을 사용할 수 있습니다. 클러스터를 Azure Monitor에 온보딩하는 가장 간단한 방법은 Windows Admin Center를 사용하는 것입니다. 이 워크플로는 먼저 대상 Azure 구독에서 Log Analytics 작업 영역을 프로비저닝한 후에 상태 관리 서비스를 구성하고 각 클러스터 노드에 필요한 에이전트를 설치합니다.

참고

이 상태 관리 서비스는 스토리지 공간 다이렉트의 모니터링을 향상시킵니다.

온보딩 프로세스가 완료되면 클러스터 노드가 원격 분석 및 로그를 Azure Monitor로 전달하기 시작합니다. Azure Portal은 기본 모니터링 대시보드의 역할을 하여 수집된 데이터를 Azure Monitor 블레이드에 표시합니다. 그러면 Log Analytics 쿼리를 실행하여 분석할 수 있습니다. Azure Monitor는 메트릭 또는 로그 기반 규칙을 구현하여 경고 및 자동 수정 작업을 트리거하는 옵션도 제공합니다.

클라우드 기반 모니터링은 온-프레미스 모니터링 시스템의 필요성을 없앨 수도 있습니다. Azure Monitor가 다중 플랫폼 지원을 제공한다는 점을 고려할 때 Contoso는 이를 사용하여 다양한 하드웨어 및 소프트웨어 리소스에서 균일한 모니터링 솔루션을 구현할 수 있습니다.

지식 점검

1.

Contoso를 위한 Azure Stack HCI의 기능을 평가하는 과정에서 클러스터된 워크로드에 영향을 주는 성능 또는 안정성 문제에 대한 응답으로 경고를 구현하기로 결정합니다. 경고 기능을 제공하기 위해 선택해야 하는 기술은 무엇인가요? 정답은 관리 노력을 최소화해야 합니다.