Azure Monitor Azure 가상 머신 또는 Arc 지원 서버에 대해 향상된 모니터링을 사용하도록 설정하는 경우 게스트 운영 체제에서 성능 데이터를 수집하고 시각화하기 위한 두 가지 환경 중에서 OpenTelemetry 메트릭 기반 모니터링(새 배포에 권장됨) 및 로그 기반 모니터링(클래식) 중에서 선택합니다. 이 문서에서는 이러한 환경 간의 차이점을 설명하고 선택할 지침을 제공합니다.
포털 온보딩 워크플로에서 OpenTelemetry 메트릭은 기본적으로 사용하도록 설정됩니다. 동일한 워크플로에는 모니터링 선택에 따라 로그 기반 메트릭, 프로세스별 OpenTelemetry 메트릭, 권장 경고 및 Grafana가 포함된 대시보드가 포함될 수 있습니다.
환경 비교
다음 표에서는 Azure Monitor의 Azure 가상 머신에 대한 OpenTelemetry 기반 및 로그 기반 모니터링 환경을 비교합니다.
| 특징 | 지표 기반 | 로그 기반(클래식) |
|---|---|---|
| 데이터 스토리지 | Azure Monitor 작업 영역 | Log Analytics 작업 영역 |
| 적용 대상: | Azure 가상 머신들 Arc 지원 서버 |
Azure 가상 머신들 Arc 지원 서버 VM 스케일 세트 |
| 데이터 모델 | 일관된 플랫폼 간 명명을 사용하는 OpenTelemetry 시스템 메트릭 | 플랫폼별 성능 카운터 |
| 쿼리 언어 | PromQL(Prometheus 쿼리 언어) | KQL(Kusto 쿼리 언어) |
| Latency | 짧은 대기 시간으로 거의 실시간으로 | 일반적으로 1-3분 |
| 비용 | 기본 메트릭 무료 | 표준 Log Analytics 수집 및 보존 비용 |
| 다중 VM 보기 | 현재 제한됨 | 전체 VM 인사이트 다중 VM 대시보드 및 작업 책 |
| 로그와의 상관 관계 | 별도의 쿼리 필요 | 메트릭 및 로그에 대한 단일 작업 영역은 하나의 쿼리에서 상관 관계를 가능하게 합니다. |
로그 기반 환경을 사용하도록 설정하는 경우
기본 메트릭 컬렉션은 무료이므로 모든 경우에 메트릭 기반 환경을 사용하도록 설정해야 합니다. 다음과 같은 경우 로그 기반 메트릭을 사용하도록 선택합니다.
- VM 확장 집합을 모니터링해야 합니다.
- 기본 제공 다중 VM 대시보드 및 추세 보기를 원합니다.
- 단일 쿼리에서 메트릭과 로그의 상관 관계를 지정하려고 합니다.
- 테이블에 따라
InsightsMetrics쿼리, 대시보드 또는 경고를 이미 사용하고 있습니다.
OpenTelemetry의 이점
OS 간 관찰 가능성
시스템 메트릭에 대한 OpenTelemetry 의미 체계 규칙은 Windows 및 Linux 성능 카운터를 일관된 명명 규칙 및 메트릭 데이터 모델로 수렴하여 OS 간 최종 사용자 환경을 간소화합니다. 이렇게 하면 Windows 또는 Linux 운영 체제에 사용되는 단일 쿼리 집합으로 모든 가상 머신을 더 쉽게 관리할 수 있습니다. OpenTelemetry 시스템 메트릭을 채택하는 모든 호스팅 리소스에 동일한 코드로 구성 배포 방법 및 동일한 PromQL 쿼리를 사용할 수 있습니다.
더 많은 성능 카운터
OpenTelemetry 수집기 호스트 메트릭 수신기는 현재 로그 기반 컬렉션에 사용할 수 있는 Azure Monitor보다 더 많은 성능 카운터를 수집합니다. 예를 들어 프로세스별 CPU 사용률, 디스크 I/O 및 메모리 사용량을 모니터링할 수 있습니다.
더 간단한 메트릭 모델
많은 시나리오에서 여러 성능 카운터는 리소스 특성이라고도 하는 메트릭 차원이 있는 단일 OTelemetry(OTel) 시스템 메트릭에 매핑됩니다. 이렇게 하면 컬렉션과 쿼리가 모두 간소화됩니다.
예를 들어 OTel에는 메트릭이 system.cpu.time 포함됩니다.
State 차원에서 사용자, 시스템, 유휴 등의 값에 대해 필터링할 수 있습니다. 로그 기반 컬렉션을 사용하면 다음 성능 카운터를 수집하고 쿼리해야 합니다.
- Windows:
\Processor Information(_Total)\% Processor Time,\Processor Information(_Total)\% Privileged Time,\Processor Information(_Total)\% User Time - Linux:
Cpu/usage_user,,Cpu/usage_systemCpu/usage_idle,Cpu/usage_activeCpu/usage_nice, ,Cpu/usage_iowaitCpu/usage_irq
Azure Monitor 작업 영역의 이점
Azure Monitor 작업 영역에 저장된 메트릭은 Azure Monitor 작업 영역이 시계열 검색에 최적화되어 있으므로 Log Analytics 작업 영역에 저장된 동일한 데이터보다 더 저렴하고 빠르게 쿼리할 수 있습니다. 또한 Azure Monitor 작업 영역에서 OTel 메트릭을 사용하면 로그 기반 컬렉션에 사용되는 여러 스키마를 방지할 수 있습니다. 기본 로그 기반 메트릭은 테이블에 저장 InsightsMetrics 되고, 사용 가능한 추가 메트릭은 다른 스키마를 사용하는 테이블에 저장 Perf 됩니다.
OpenTelemetry를 사용한 향상된 모니터링은 사용 가능한 시스템 메트릭의 하위 집합을 사용하여 팀 전체에서 대시보드, 경고 및 PromQL 쿼리를 표준화하는 데 도움이 됩니다.
메트릭 기반 컬렉션의 제한 사항
- 메트릭 기반 컬렉션은 현재 개별 VM 및 Arc 지원 서버에서만 사용할 수 있습니다. 로그 기반 컬렉션은 VM Scale Sets에도 사용할 수 있습니다.
- 메트릭 기반 컬렉션은 현재 프라이빗 링크를 지원하지 않습니다.
- Log Analytics 작업 영역 및 Azure Monitor 작업 영역의 데이터에서 단일 쿼리를 수행할 수 없습니다. 로그 기반 컬렉션을 사용하면 VM에 대한 로그 및 메트릭이 함께 저장되므로 단일 KQL 쿼리에서 둘 사이의 상관 관계를 지정할 수 있습니다. 메트릭 기반 컬렉션을 사용하면 메트릭이 Azure Monitor 작업 영역에 저장되고 로그가 Log Analytics 작업 영역에 저장되어 각각에 대해 별도의 쿼리가 요구됩니다.
- OpenTelemetry 메트릭을 사용하여 다중 VM 차트를 보기 위해 고유한 통합 문서 및 대시보드를 만들 수 있지만 로그 기반 컬렉션에 사용할 수 있는 것과 같은 기본 제공 환경은 Azure Portal에 없습니다. 및 로그는 각각에 대해 별도의 쿼리가 필요한 Log Analytics 작업 영역에 저장됩니다.
- OpenTelemetry 메트릭을 사용하여 다중 VM 차트를 보기 위해 고유한 통합 문서 및 대시보드를 만들 수 있지만 로그 기반 컬렉션에 사용할 수 있는 것과 같은 기본 제공 환경은 Azure Portal에 없습니다.
팁 (조언)
Azure Monitor GitHub 커뮤니티 에 게시하거나 포털 피드백을 통해 보고 싶은 새로운 성능 카운터 또는 기능에 대한 피드백을 공유합니다.
관련 콘텐츠
- 자습서: Azure 가상 머신에 대해 향상된 모니터링 사용 - Azure Portal을 사용하여 단일 VM에 대한 모니터링을 사용하도록 설정합니다.
- Azure 가상 머신에 대한 OpenTelemetry 메트릭 사용자 지정 - 게스트 운영 체제에서 수집된 기본 OpenTelemetry 메트릭을 변경합니다.
- Azure Monitor를 사용하여 가상 머신에서 성능 카운터 수집 - 데이터 수집 규칙을 사용하여 추가 성능 카운터 수집을 구성합니다.
- 로그 기반에서 Azure 가상 머신에 대한 OpenTelemetry 메트릭으로 마이그레이션 - 로그 기반 환경을 사용 중지하고 메트릭 기반 모니터링으로 완전히 이동할 시기를 결정합니다.