다음을 통해 공유


Azure Virtual Machines 모니터링

이 문서에서는 다음을 설명합니다.

  • 이 서비스에 대해 수집할 수 있는 모니터링 데이터의 유형.
  • 해당 데이터를 분석하는 방법.

참고 항목

이 서비스 및/또는 Azure Monitor에 이미 익숙하고 모니터링 데이터를 분석하는 방법만 알고 싶은 경우 이 문서의 끝부분에 있는 분석 섹션을 참조하세요.

Azure 리소스를 사용하는 중요한 애플리케이션 및 비즈니스 프로세스가 있는 경우 시스템을 모니터링하고 시스템에 대한 경고를 받아야 합니다. Azure Monitor 서비스는 시스템의 모든 구성 요소에서 메트릭과 로그를 수집하고 집계합니다. Azure Monitor는 가용성, 성능, 복원력에 대한 보기를 제공하고 문제를 알려 줍니다. Azure Portal, PowerShell, Azure CLI, REST API 또는 클라이언트 라이브러리를 사용하여 모니터링 데이터를 설정하고 볼 수 있습니다.

이 문서에서는 Azure VM(가상 머신)의 상태와 성능을 모니터링하는 방법에 대한 개요를 제공합니다.

참고 항목

이 문서에서는 Azure Virtual Machines 모니터링을 시작하는 데 도움이 되는 기본 정보를 제공합니다. Azure 및 하이브리드 가상 머신의 전체 환경을 모니터링하는 전체 가이드는 가상 머신 모니터링 배포 가이드를 참조하세요.

개요: VM 호스트 및 게스트 메트릭과 로그 모니터링

다음에서 메트릭 및 로그를 수집할 수 있습니다.

  • VM 호스트 - 이 데이터는 게스트 운영 체제를 관리하는 Hyper-V 세션과 관련이 있으며 CPU, 네트워크 및 디스크 사용률에 대한 정보를 포함합니다.
  • VM 게스트 - 이 데이터는 운영 체제 및 가상 머신 내에서 실행되는 애플리케이션과 관련이 있습니다.

호스트 수준 데이터를 통해 VM의 전반적인 성능과 로드를 이해할 수 있고, 게스트 수준 데이터를 통해 컴퓨터에서 실행되는 애플리케이션, 구성 요소, 프로세스와 해당 성능 및 상태에 대한 표시 여부를 얻을 수 있습니다. 예를 들어, 성능 문제를 해결하는 경우 호스트 메트릭으로 시작하여 어떤 VM이 과부하 상태인지 확인한 다음 게스트 메트릭을 사용하여 운영 체제 및 애플리케이션 성능의 세부 정보를 드릴다운할 수 있습니다.

VM 호스트 데이터

별도의 설정 없이 VM 호스트 데이터를 사용할 수 있습니다.

시나리오 세부 정보 데이터 수집 사용 가능한 데이터 권장 사항
VM 호스트 메트릭 및 로그 VM이 실행되는 실제 호스트의 안정성, 상태, 효율성을 모니터링합니다.
애플리케이션의 로드에 따라 스케일 업 또는 스케일 다운합니다.
추가 설정 없이 기본적으로 사용할 수 있습니다. 주요 호스트 메트릭이 예상 기준 값에서 벗어날 때 경고를 받도록 권장 경고 규칙을 사용하도록 설정합니다.

VM 게스트 데이터

VM 게스트 데이터를 사용하면 VM에서 실행되는 워크로드의 성능과 운영 효율성을 분석하고 문제를 해결할 수 있습니다. VM 게스트 데이터를 모니터링하려면 VM에 Azure Monitor 에이전트를 설치하고 DCR(데이터 수집 규칙)을 설정해야 합니다. VM 인사이트 기능은 VM에 Azure Monitor 에이전트를 자동으로 설치하고 빠르고 쉬운 온보딩을 위해 기본 데이터 수집 규칙을 설정합니다.

시나리오 세부 정보 데이터 수집 사용 가능한 데이터 권장 사항
기본 모니터링: 핵심 성과 지표 미리 정의된 기본 핵심 성능 카운터 집합을 수집하여 운영 체제 성능(CPU 및 디스크 사용률 포함), 사용 가능한 메모리, 네트워크 성능과 관련된 문제를 식별합니다. VM 인사이트 사용 미리 정의된 주요 게스트 성능 카운터 집합
  • 시작점으로 사용합니다.
  • 권장되는 VM용 Azure Monitor 기준 경고를 사용하도록 설정합니다.
  • 필요에 따라 관심 있는 게스트 성능 카운터와 권장 운영 체제 로그를 추가합니다.
기본 모니터링: 애플리케이션 구성 요소 매핑 특정 VM과 여러 VM의 애플리케이션 구성 요소를 매핑하고 애플리케이션 구성 요소 간에 존재하는 종속성을 발견합니다.

이 정보는 문제 해결, 성능 최적화, 애플리케이션 인프라 변경 또는 업데이트 계획에 중요합니다.
VM 인사이트의 맵 기능 사용 VM에서 실행되는 애플리케이션 구성 요소 간의 종속성
VM 운영 체제 메트릭 및 로그(권장) 애플리케이션 성능 및 이벤트, 특정 애플리케이션 및 프로세스별 리소스 사용량, 운영 체제 수준 성능 및 이벤트를 모니터링합니다.

이 데이터는 애플리케이션 관련 문제를 해결하고, VM 내에서 리소스 사용을 최적화하고, VM 내에서 실행되는 워크로드에 대한 최적의 성능을 보장하는 데 중요합니다.
VM에 Azure Monitor 에이전트를 설치하고 DCR을 설정합니다.
  • Windows에서는 위험, 오류경고 수준에서 애플리케이션 로그를 수집합니다.
  • Linux에서는 LOG_WARNING 수준에서 LOG_SYSLOG 시설 로그를 수집합니다.
고급/사용자 지정 VM 게스트 데이터 VM에서 수집하려는 웹 서버, Linux 어플라이언스, 모든 유형의 데이터를 모니터링합니다. VM에 Azure Monitor 에이전트를 설치하고 DCR을 설정합니다.

VM 인사이트

VM 인사이트는 단일 인터페이스에서 Azure 및 하이브리드 가상 머신을 모니터링합니다. VM 인사이트는 Azure Monitor에서 VM을 모니터링하는 데 다음과 같은 이점을 제공합니다.

  • VM(가상 머신) 게스트 운영 체제 및 워크로드를 모니터링할 수 있도록 Azure Monitor 에이전트 및 종속성 에이전트를 간편하게 온보딩.
  • 가장 일반적인 성능 데이터 집합을 수집하는 미리 정의된 데이터 수집 규칙.
  • 가상 머신의 게스트 운영 체제에서 핵심 성능 메트릭을 분석하는 데 사용할 수 있도록 미리 정의된 추세 성능 차트 및 통합 문서.
  • 각 가상 머신에서 실행 중인 프로세스와 다른 머신 및 외부 원본과 상호 연결된 구성 요소를 표시하는 종속성 맵

VM 인사이트 ‘논리적 디스크 성능’ 보기 스크린샷.

VM 인사이트 ‘맵’ 보기 스크린샷.

가상 머신에 대해 VM 인사이트를 사용하도록 설정하는 자습서는 VM 인사이트로 Azure 가상 머신에 대한 모니터링을 사용하도록 설정을 참조하세요. 인사이트 사용 및 VM 온보딩을 위한 다양한 방법에 대한 일반적인 내용은 VM 인사이트 사용 개요를 참조하세요.

VM 인사이트를 사용하도록 설정하면 Azure Monitor 에이전트가 설치되고 미리 정의된 성능 데이터 집합을 Azure Monitor 로그로 보내기 시작합니다. 이벤트 및 기타 성능 데이터를 수집하는 다른 데이터 수집 규칙을 만들 수 있습니다. Azure Monitor 에이전트를 설치하고 수집할 데이터를 정의하는 DCR(데이터 수집 규칙)을 만드는 방법을 알아보려면 자습서: Azure 가상 머신에서 게스트 로그 및 메트릭 수집을 참조하세요.

VM 인사이트에서 Azure Monitor 맵 기능을 사용하여 Azure 또는 사용자 환경에서 실행되는 애플리케이션 구성 요소를 볼 수 있습니다. 종속성 에이전트 VM 확장은 WindowsLinux에서 사용할 수 있습니다.

데이터 저장소

Azure Monitor의 경우:

  • 메트릭 데이터는 Azure Monitor 메트릭 데이터베이스에 저장됩니다.
  • 로그 데이터는 Azure Monitor 로그 저장소에 저장됩니다. 로그 분석은 이 저장소를 쿼리할 수 있는 Azure Portal의 도구입니다.
  • Azure 활동 로그는 Azure Portal에 자체 인터페이스가 있는 별도의 저장소입니다.

선택적으로 메트릭 및 활동 로그 데이터를 Azure Monitor 로그 저장소로 라우팅할 수 있습니다. 그런 다음 Log Analytics를 사용하여 데이터를 쿼리하고 다른 로그 데이터와 상호 연결할 수 있습니다.

많은 서비스에서는 진단 설정을 사용하여 메트릭 및 로그 데이터를 Azure Monitor 외부의 다른 스토리지 위치로 보낼 수 있습니다. 예를 들면 Azure Storage, 호스트된 파트너 시스템Event Hubs를 사용하는 비 Azuree 파트너 시스템이 있습니다.

Azure Monitor가 데이터를 저장하는 방법에 대한 자세한 내용은 Azure Monitor 데이터 플랫폼을 참조하세요.

Azure Monitor 플랫폼 메트릭

Azure Monitor는 대부분의 서비스에 대한 플랫폼 메트릭을 제공합니다. 이러한 메트릭은 다음과 같습니다.

  • 각 네임스페이스에 대해 개별적으로 정의됩니다.
  • Azure Monitor 시계열 메트릭 데이터베이스에 저장됩니다.
  • 간단하며 실시간에 가까운 경고를 지원할 수 있습니다.
  • 시간 경과에 따른 리소스의 성능을 추적하는 데 사용됩니다.

수집: Azure Monitor는 플랫폼 메트릭을 자동으로 수집합니다. 구성이 필요하지 않습니다.

라우팅: 일부 플랫폼 메트릭을 Azure Monitor 로그/Log Analytics로 라우팅하여 다른 로그 데이터로 쿼리할 수도 있습니다. 각 메트릭에 대한 DS 내보내기 설정을 확인하여 진단 설정을 사용하여 메트릭을 Azure Monitor 로그/Log Analytics로 라우팅할 수 있는지 확인합니다.

  • 자세한 내용은 메트릭 진단 설정을 참조하세요.
  • 서비스에 대한 진단 설정을 구성하려면 Azure Monitor에서 진단 설정 만들기를 참조하세요.

Azure Monitor의 모든 리소스에 대해 수집할 수 있는 모든 메트릭 목록은 Azure Monitor에서 지원되는 메트릭을 참조하세요.

Azure VM에 대한 플랫폼 메트릭에는 CPU, 네트워크, 디스크 사용률과 같은 중요한 호스트 메트릭이 포함됩니다. 호스트 OS 메트릭은 게스트 OS(게스트 운영 체제) 세션을 호스트하는 Hyper-V 세션과 관련이 있습니다.

VM에서 실행되는 게스트 OS에 대한 메트릭은 게스트 OS에서 또는 게스트 OS의 일부로 실행되는 Azure Monitor 에이전트와 같은 하나 이상의 에이전트를 통해 수집되어야 합니다. 게스트 OS 메트릭에는 게스트 CPU 백분율 또는 메모리 사용량을 추적하는 성능 카운터가 포함되며, 둘 다 자동 스케일링 또는 경고에 자주 사용됩니다. 자세한 내용은 게스트 OS 및 호스트 OS 메트릭을 참조하세요.

Azure Monitor 에이전트가 VM 모니터링 데이터를 수집하는 방법에 대한 자세한 내용은 Azure Monitor를 사용하여 가상 머신 모니터링: 데이터 수집을 참조하세요.

Virtual Machines에 사용할 수 있는 메트릭 목록은 Virtual Machines 모니터링 데이터 참조를 참조하세요.

Azure 활동 로그

활동 로그에는 해당 리소스의 외부에서 볼 때 각 Azure 리소스에 대한 작업을 추적하는 구독 수준 이벤트(예: 새 리소스 만들기 또는 가상 머신 시작)가 포함되어 있습니다.

수집: 활동 로그 이벤트는 자동으로 생성되고 별도의 저장소에 수집되어 Azure Portal에서 볼 수 있습니다.

라우팅: 다른 로그 데이터와 함께 분석할 수 있도록 활동 로그 데이터를 Azure Monitor 로그로 보낼 수 있습니다. Azure Storage, Azure Event Hubs, 특정 Microsoft 모니터링 파트너와 같은 다른 위치도 사용할 수 있습니다. 활동 로그를 라우팅하는 방법에 대한 자세한 내용은 Azure 활동 로그 개요를 참조하세요.

데이터 수집 규칙

DCR(데이터 수집 규칙)은 Azure Monitor 에이전트에서 데이터 수집을 정의하고 Azure 구독에 저장됩니다. VM의 경우 DCR은 수집할 이벤트 및 성능 카운터와 같은 데이터를 정의하고 데이터를 보낼 Log Analytics 작업 영역과 같은 위치를 지정합니다. 단일 VM을 여러 DCR과 연결할 수 있으며 단일 DCR을 여러 VM과 연결할 수 있습니다.

VM 인사이트 DCR

VM 인사이트는 클라이언트 운영 체제에 대한 일반적인 성능 카운터를 수집하고 이를 Log Analytics 작업 영역의 InsightsMetrics 테이블로 보내는 DCR을 만듭니다. 수집되는 성능 카운터 목록은 VM 인사이트에서 로그를 쿼리하는 방법을 참조하세요. 각 VM에 대해 새 DCR을 만드는 대신 이 DCR을 다른 VM과 함께 사용할 수 있습니다.

필요에 따라 다음 테이블을 채우고 VM 인사이트 맵 기능을 사용하도록 설정하는 프로세스 및 종속성 컬렉션을 사용하도록 설정할 수도 있습니다.

  • VMBoundPort: 컴퓨터의 열린 서버 포트에 대한 트래픽
  • VMComputer: 컴퓨터의 인벤토리 데이터
  • VMConnection: 컴퓨터에 대한 인바운드 및 아웃바운드 연결에 대한 트래픽
  • VMProcess: 컴퓨터에서 실행되는 프로세스

모니터링 데이터 분석

모니터링 데이터를 분석하기 위한 많은 도구가 있습니다.

Azure Monitor 도구

Azure Monitor는 다음과 같은 기본 도구를 지원합니다.

더 복잡한 시각화를 허용하는 도구는 다음과 같습니다.

  • 대시보드: 다양한 종류의 데이터를 Azure Portal에서 하나의 창에 결합할 수 있습니다.
  • 통합 문서: Azure Portal에서 만들 수 있는 사용자 지정 가능한 보고서입니다. 통합 문서에는 텍스트, 메트릭, 로그 쿼리가 포함될 수 있습니다.
  • Grafana: 뛰어난 운영 대시보드를 제공하는 개방형 플랫폼 도구입니다. Grafana를 사용하여 Azure Monitor 외의 여러 소스에서 온 데이터를 포함하는 대시보드를 만들 수 있습니다.
  • Power BI: 다양한 데이터 소스에서 대화형 시각화를 제공하는 비즈니스 분석 서비스입니다. Azure Monitor에서 자동으로 로그 데이터를 가져오도록 Power BI를 구성하여 이러한 시각화를 활용할 수 있습니다.

Azure Monitor 내보내기 도구

다음 방법을 사용하여 Azure Monitor에서 다른 도구로 데이터를 내보낼 수 있습니다.

Azure Monitor용 REST API를 시작하려면 Azure 모니터링 REST API 연습을 참조하세요.

Kusto 쿼리

KQL(Kusto 쿼리 언어)을 사용하여 Azure Monitor 로그/로그 분석 저장소에서 모니터링 데이터를 분석할 수 있습니다.

Important

포털의 서비스 메뉴에서 로그를 선택하면 쿼리 범위가 현재 서비스로 설정된 상태로 로그 분석이 열립니다. 이 범위는 로그 쿼리에 해당 유형의 리소스의 데이터만 포함된다는 의미입니다. 다른 Azure 서비스의 데이터를 포함하는 쿼리를 실행하려면 Azure Monitor 메뉴에서 로그를 선택합니다. 자세한 내용은 Azure Monitor Log Analytics의 로그 쿼리 범위 및 시간 범위를 참조하세요.

모든 서비스에 대한 일반적인 쿼리 목록은 로그 분석 쿼리 인터페이스를 참조하세요.

VM에서 수집하는 로그 데이터를 분석하려면 Log Analytics에서 로그 쿼리를 사용합니다. VM에 대한 몇 가지 기본 제공 쿼리를 사용하거나 직접 쿼리를 만들 수 있습니다. 이러한 쿼리의 결과를 대화형으로 작업하거나 통합 문서에 포함하여 다른 사용자가 사용할 수 있도록 하거나 결과에 따라 경고를 생성할 수 있습니다.

VM에 대한 기본 제공 Kusto 쿼리에 액세스하려면 VM의 Azure Portal 페이지에 있는 왼쪽 탐색의 모니터링 섹션에서 로그를 선택합니다. 로그 페이지에서 쿼리 탭을 선택한 다음, 실행할 쿼리를 선택합니다.

Log Analytics 쿼리 결과를 표시하는 ‘로그’ 창 스크린샷.

경고

Azure Monitor 경고는 모니터링 데이터에서 특정한 조건이 발견될 때 사용자에게 사전에 알립니다. 경고를 통해 사용자에게 알리기 전에 시스템 문제를 식별하고 해결할 수 있습니다. 자세한 내용은 Azure Monitor 경고을 참조하세요.

Azure 리소스에 대한 일반적인 경고의 소스에는 여러 가지가 있습니다. Azure 리소스에 대한 일반적인 경고의 예는 샘플 로그 경고 쿼리를 참조하세요. AMBA(Azure Monitor 기준 경고) 사이트는 중요한 플랫폼 메트릭 경고, 대시보드 및 지침을 구현하는 반자동 방법을 제공합니다. 이 사이트는 ALZ(Azure 랜딩 존)의 일부인 전체 서비스를 포함하여 지속적으로 확장되는 Azure 서비스 하위 집합에 적용됩니다.

공통 경고 스키마는 Azure Monitor 경고 알림의 사용을 표준화합니다. 자세한 내용은 일반 경고 스키마를 참조하세요.

경고 유형

Azure Monitor 데이터 플랫폼의 모든 메트릭 또는 로그 데이터 원본에 대해 경고할 수 있습니다. 모니터링하는 서비스 및 수집하는 모니터링 데이터에 따라 다양한 유형의 경고가 있습니다. 서로 다른 형식의 경고에는 다양한 장점과 단점이 있습니다. 자세한 내용은 올바른 모니터링 경고 유형 선택을 참조하세요.

다음 목록에서는 만들 수 있는 Azure Monitor 경고의 유형에 대해 설명합니다.

  • 메트릭 경고는 정기적으로 리소스 메트릭을 평가합니다. 메트릭은 플랫폼 메트릭, 사용자 지정 메트릭, 메트릭으로 변환된 Azure Monitor의 로그 또는 Application Insights 메트릭일 수 있습니다. 메트릭 경고는 여러 조건과 동적 임계값을 적용할 수도 있습니다.
  • 로그 경고를 사용하면 사용자가 로그 분석 쿼리를 사용하여 미리 정의된 빈도로 리소스 로그를 평가할 수 있습니다.
  • 활동 로그 경고는 정의된 조건과 일치하는 새 활동 로그 이벤트가 발생할 때 트리거됩니다. Resource Health 경고 및 Service Health 경고는 서비스 및 Resource Health를 보고하는 활동 로그 경고입니다.

일부 Azure 서비스는 스마트 검색 경고, Prometheus 경고 또는 권장 경고 규칙도 지원합니다.

일부 서비스의 경우 동일한 Azure 지역에 존재하는 동일한 형식의 여러 리소스에 동일한 메트릭 경고 규칙을 적용하여 대규모로 모니터링할 수 있습니다. 모니터링되는 각 리소스에 대해 개별 알림이 전송됩니다. 지원되는 Azure 서비스 및 클라우드에 대한 내용은 하나의 경고 규칙을 사용하여 여러 리소스 모니터링을 참조하세요.

동일한 지역 내의 특정 리소스 그룹 또는 구독의 모든 VM에 적용되는 단일 다중 리소스 경고 규칙을 만들 수 있습니다. 가용성 메트릭을 사용하는 자습서는 Azure 가상 머신에 대한 가용성 경고 규칙 만들기(미리 보기)를 참조하세요.

일부 Azure 서비스의 경우 권장되는 기본 경고 규칙을 사용하도록 설정할 수 있습니다.

시스템은 다음을 기반으로 권장되는 경고 규칙 목록을 컴파일합니다.

  • 리소스를 모니터링하는 데 중요한 신호 및 임계값에 대한 리소스 공급자의 지식.
  • 이 리소스에 대해 고객이 일반적으로 경고하는 내용을 알려 주는 데이터.

참고 항목

권장 경고 규칙은 다음에 대해 사용할 수 있습니다.

  • 가상 머신
  • AKS(Azure Kubernetes Service) 리소스
  • Log Analytics 작업 영역

Azure VM에 권장되는 경고 규칙에는 VM 실행이 중지되면 경고하는 VM 가용성 메트릭이 포함됩니다.

자세한 내용은 자습서: Azure 가상 머신에 권장되는 경고 규칙 사용을 참조하세요.

일반적인 경고 규칙

Azure Portal에서 일반적인 VM 로그 경고 규칙을 보려면 Log Analytics의 쿼리 창으로 이동합니다. 리소스 종류를 알아보려면 가상 머신을 입력하고, 유형을 알아보려면 경고를 입력합니다.

일반적인 Virtual Machines 경고 규칙에 대한 목록 및 논의는 일반적인 경고 규칙을 참조하세요.

Advisor 권장 사항

일부 서비스의 경우 리소스 작업 중에 위험한 상태 또는 임박한 변경 사항이 발생하는 경우 해당 서비스에서 포털의 개요 페이지에 경고가 표시됩니다. 왼쪽 메뉴의 모니터링 아래 Advisor 권장 사항에서 해당 경고에 대한 자세한 정보와 권장 수정 사항을 찾을 수 있습니다. 정상적으로 작동하는 중에는 Advisor 권장 사항이 표시되지 않습니다.

Azure Advisor에 대한 자세한 내용은 Azure Advisor 개요를 참조하세요.

기타 VM 모니터링 옵션

Azure VM에는 다음과 같은 비Azure Monitor 모니터링 옵션이 있습니다.

부트 진단

부팅 진단은 부팅 시 VM의 직렬 로그 정보 및 스크린샷을 수집하여 VM 부팅 실패를 진단할 수 있는 Azure VM의 디버깅 기능입니다. Azure Portal에서 VM을 만들면 부팅 진단이 기본적으로 사용하도록 설정됩니다. 자세한 내용은 Azure 부팅 진단을 참조하세요.

성능 문제 해결

성능 진단 도구는 머신에서 현재 찾은 문제를 신속하게 진단하고 이에 대한 인사이트를 제공하여 Windows 또는 Linux 가상 머신의 성능 문제를 해결하는 데 도움이 됩니다. 이 도구는 수집한 기록 모니터링 데이터를 분석하지 않고 알려진 문제에 대한 머신의 현재 상태, 모범 사례 구현, VM 성능 저하 또는 CPU, 디스크 공간 또는 메모리의 높은 사용량과 관련된 복잡한 문제를 확인합니다.