Azure Stack HCI에 대한 로그 경고 설정
적용 대상: Azure Stack HCI, 버전 23H2 및 22H2
이 문서에서는 Azure Stack HCI 시스템에 대한 로그 경고를 설정하는 방법을 설명합니다. Azure Stack HCI용 인사이트 사용 및 기존 샘플 로그 쿼리(예: 평균 서버 CPU, 사용 가능한 메모리, 사용 가능한 볼륨 용량 등)를 사용합니다.
메트릭 경고를 설정하는 방법에 대한 자세한 내용은 Azure Stack HCI에 대한 메트릭 경고 설정을 참조하세요.
잠시 시간을 내어 새 로그 수집, Insights 통합 문서 사용자 지정 및 로그를 사용하여 경고 만들기에 대한 비디오 연습을 watch.
사전 요구 사항
시작하기 전에 다음 필수 구성 요소가 완료되었는지 확인합니다.
- 배포 및 등록된 Azure Stack HCI 클러스터에 액세스할 수 있습니다.
- 클러스터에서 Insights를 사용하도록 설정해야 합니다. Insights를 사용하도록 설정하면 Log Analytics 작업 영역에서 필요한 로그를 수집하도록 클러스터가 구성됩니다.
Insights를 사용하여 로그 경고 설정
중요
높은 심각도 경고에는 Insights를 사용하지 않는 것이 좋습니다. 로그를 수집하는 데 15분이 걸릴 수 있습니다.
인사이트를 사용하여 로그 경고를 설정하려면 다음 단계를 수행합니다. 필수 구성 요소를 검토하고 완료했는지 확인합니다.
Azure Portal 모니터로 이동하거나 검색하고 Azure Stack HCI를 선택합니다.
탭 중 하나를 선택하여 리소스의 상태를 확인합니다. 예를 들어 서버를 선택하여 클러스터의 서버 상태를 확인합니다.
통합 문서를 사용자 지정하고 파란색 로그 보기 아이콘이 표시될 때까지 편집합니다. 아이콘을 선택하여 쿼리를 보고 편집합니다.
쿼리가 로드된 후 + 새 경고 규칙을 선택합니다.
경고 인터페이스에서 경고 조건, 작업 등을 설정할 수 있습니다. 자세한 내용은 로그 쿼리 결과 및 경고 작업 및 세부 정보를 참조하세요.
샘플 로그 쿼리를 사용하여 경고 설정
Azure Portal 사용할 수 있는 기존 로그 쿼리를 사용하여 Azure Stack HCI 시스템 모니터링 및 경고 설정을 시작할 수 있습니다. 이러한 쿼리는 시스템의 상태를 검사 모니터링하는 데 도움이 될 수 있습니다.
샘플 로그 쿼리를 사용하여 로그 경고를 설정하려면 다음 단계를 수행합니다. 필수 구성 요소를 검토하고 완료했는지 확인합니다.
Azure Portal Azure Stack HCI 클러스터 리소스 페이지로 이동한 다음 샘플 로그 쿼리를 사용하여 모니터링할 클러스터를 선택합니다.
클러스터 개요 페이지에서 JSON 보기를 선택합니다.
리소스 ID 상자에서 ClusterArmId 세부 정보를 복사합니다.
Azure Portal 모니터로 이동하거나 검색하고 로그를 선택합니다.
+ 필터 추가를 선택하여 리소스 종류에 대한 필터를 추가합니다.
Azure Stack HCI 시스템 샘플 로그의 채워진 목록을 보려면 Azure Stack HCI를 선택합니다.
로드를 선택하여 편집기 쿼리 작업 영역을 엽니다.
scope 클러스터 리소스에 연결된 로그에 대한 Log Analytics 작업 영역으로 설정합니다.
클러스터와 관련된 결과를 보려면 쿼리 섹션에
where ClusterArmId =~
ClusterArmId 세부 정보를 붙여넣습니다.실행을 선택합니다.
정보가 표시되면 로그를 검사하고 결과에 따라 경고를 만들 수 있습니다. 자세한 내용은 로그 쿼리 결과 및 경고 작업 및 세부 정보를 참조하세요.
여러 클러스터에 대한 경고 설정
여러 클러스터 ClusterArmId를 수용하도록 새 쿼리를 설정하거나 기존 쿼리를 변경하려면 쿼리에 절을 | where ClusterArmId in~
추가합니다. 쿼리에 사용하려는 각 클러스터에 대한 ClusterArmId를 포함합니다. 예를 들어 | where ClusterArmId in~ ('ClusterArmId1', 'ClusterArmId2', 'ClusterArmId3')
로그 쿼리 결과
로그를 추가한 후 클러스터 로그를 저장하는 작업 영역에 대해 쿼리를 실행하여 예상 결과를 얻을 수 있는지 확인해야 합니다. 예상 결과를 얻지 못하면 로그 쿼리를 수정하고 다시 실행합니다.
새 경고 규칙을 만들 때 조건부 세부 정보를 설정하여 쿼리 결과를 요약해야 합니다. 이러한 세부 정보는 측정, 차원별 분할 및 경고 논리의 세 가지 범주를 기반으로 합니다. 경고 세부 정보에서 다음 구성 요소를 입력합니다.
- 측정값: 경고를 설정하는 데 사용되는 값입니다. 기본적으로 숫자 값만 사용합니다. 값을 정수로 변환하고 드롭다운 목록에서 올바른 값을 선택합니다.
- 집계 유형: 클러스터 메모리 값이 지정한 값을 하나만 충족하더라도 경고를 받도록 합니다. 여러 클러스터에 대한 경고의 경우 집계 유형을 평균 또는 합계가 아닌 최대값으로 배치해야 합니다.
-
리소스 ID 열: 다른 값에 따라 경고 측정값을 분할합니다. 클러스터에서 경고를 받으려면 또는 를 사용하여
clusterarmID
서버에_resourceID
대한 경고를 설정합니다. 정확도는 로그 쿼리에서 값 이름을 확인합니다. -
차원 이름: 경고 측정값을 추가로 분할합니다. 예를 들어 서버당 경고를 받으려면 를
Nodename
선택합니다.- 경고를 설정할 때 드롭다운 메뉴에 모든 값이 표시되지 않을 수 있습니다. 클러스터의 여러 서버에 동일한 경고를 설정하려면 모든 이후 값 포함 확인란을 선택합니다.
- 임계값: 설정한 값에 따라 알림을 제공합니다.
이 예제에서는 최대 집계 형식의 측정값 Memoryusageint가 임계값인 15분 임계값에 도달하면 경고가 발생합니다.
세부 정보가 설정되면 경고 정확도에 대한 조건을 검토할 수 있습니다.
경고 작업 및 세부 정보
클러스터 경고에 대한 알림을 받는 방법을 확인하려면 이미지에 표시된 대로 작업 탭을 사용합니다. 새 작업 그룹을 만들거나 기존 작업 그룹에 대한 경고 규칙을 설정할 수 있습니다. 이메일, Event Hubs 등을 통해 알림을 받도록 선택할 수 있습니다.
작업을 설정한 후에는 세부 정보 탭을 사용하여 경고 심각도, 이름, 설명 및 지역을 설정할 수 있습니다. 검토 + Create 선택하여 모든 경고 설정을 최종 검토하고 경고를 만듭니다.
경고가 설정되면 경고 탭에서 경고 규칙, 작업 그룹 등을 모니터링할 수 있습니다 .
로그 수집 빈도
기본적으로 로그는 매시간 생성됩니다. 로그가 수집되는 빈도를 검사 다음 PowerShell 명령을 사용합니다.
get-clusterresource "sddc management" | get-clusterparameter
로컬 컴퓨터에서 로그 생성 빈도를 변경하려면 로그 수집 매개 변수를 CacheDumpIntervalInSeconds
변경합니다.
다음은 15분마다 설정된 로그 빈도의 예입니다.
get-clusterresource "sddc management" | set-clusterparameter -name "CacheDumpIntervalInSeconds" -value 900
참고
모든 로그를 수집하려면 빈도를 15분 미만으로 낮추지 않습니다.
다음 단계
Azure Monitor 경고 규칙을 Create 방법을 알아봅니다.