Azure Stream Analytics 작업 메트릭

Azure Stream Analytics는 쿼리 및 작업 성능을 모니터링하고 문제를 해결하는 데 사용할 수 있는 많은 메트릭을 제공합니다. 이러한 메트릭의 데이터는 Azure Portal의 개요 페이지, 모니터링 섹션에서 볼 수 있습니다.

Screenshot of the Azure portal that shows the section for monitoring Stream Analytics jobs.

특정 메트릭을 확인하려면 모니터링 섹션에서 메트릭을 선택합니다. 표시되는 페이지에서 메트릭을 선택합니다.

Screenshot that shows selecting a metric in the Stream Analytics job monitoring dashboard.

Stream Analytics에 사용 가능한 메트릭

Azure Stream Analytics는 작업 상태를 모니터링할 수 있도록 다음 메트릭을 제공합니다.

메트릭 정의
백로그된 입력 이벤트 백로그되는 입력 이벤트 수입니다. 이 메트릭의 값이 0이 아니면 작업이 수신 이벤트 수를 따라갈 수 없음을 의미합니다. 이 값이 천천히 증가하거나 지속적으로 0이 아니면 작업을 확장해야 합니다. 자세한 내용은 스트리밍 단위 이해 및 조정을 참조하세요.
데이터 변환 오류 예상되는 출력 스키마로 변환할 수 없는 출력 이벤트의 수입니다. 이 시나리오가 발생하는 이벤트를 삭제하려면 오류 정책을 삭제로 변경할 수 있습니다.
CPU 사용률(%)(미리 보기) 작업에서 사용하는 CPU의 백분율입니다. 이 값이 매우 높더라도(90% 이상) 이 메트릭만을 기준으로 SU 수를 늘리면 안 됩니다. 백로그된 입력 이벤트 수 또는 워터마크 지연이 증가하면 이 메트릭을 사용하여 CPU가 병목 상태인지 여부를 확인할 수 있습니다.

이 메트릭은 간헐적으로 급증할 수 있습니다. CPU 병목 현상으로 인해 입력이 백로그되거나 워터마크 지연이 증가한 후 작업의 상한을 확인하기 위해 크기 조정 테스트를 수행하는 것이 좋습니다.
조기 입력 이벤트 애플리케이션 타임스탬프가 도착 시간보다 5분 넘게 이른 이벤트입니다.
실패한 함수 요청 실패한 Azure Machine Learning 함수 호출 수입니다(있는 경우).
함수 이벤트 Azure Machine Learning 함수(있는 경우)에 전송된 이벤트 수입니다.
함수 요청 Azure Machine Learning 함수에 대한 호출 수입니다(있는 경우).
입력 역직렬화 오류 역직렬화할 수 없는 입력 이벤트의 수입니다.
입력 이벤트 바이트 Stream Analytics 작업이 받은 데이터의 양(바이트)입니다. 이 메트릭을 사용하여 이벤트가 입력 소스로 전송되고 있는지 확인할 수 있습니다.
입력 이벤트 입력 이벤트에서 역직렬화된 레코드 수입니다. 이 수에는 역직렬화 오류를 발생시키는 수신 이벤트가 포함되지 않습니다. Stream Analytics는 내부 복구 및 셀프 조인과 같은 시나리오에서 동일한 이벤트를 여러 번 수집할 수 있습니다. 작업에 간단한 통과 쿼리가 있는 경우 입력 이벤트출력 이벤트 메트릭이 일치할 것으로 기대하지 마십시오.
수신된 입력 원본 작업이 수신하는 메시지 수입니다. Azure Event Hubs의 경우 메시지는 단일 EventData 항목입니다. Azure Blob Storage의 경우 메시지는 단일 Blob입니다.

역직렬화 전에 입력 원본이 계산됩니다. 역직렬화 오류가 발생하면 입력 원본이 입력 이벤트보다 클 수 있습니다. 그렇지 않으면 입력 원본이 입력 이벤트보다 작거나 같을 수 있습니다. 각 메시지에 여러 이벤트가 포함될 수 있기 때문입니다.
지연 입력 이벤트 지연 도착에 대해 구성된 허용 시간보다 늦게 도착한 이벤트입니다. Azure Stream Analytics 이벤트 순서 고려 사항에 대해 자세히 알아보세요..
잘못된 순서 이벤트 이벤트 순서 지정 정책에 기반하여 조정된 타임스탬프를 받거나 삭제된 순서가 정해지지 않은 수신 이벤트의 수입니다. 이 메트릭은 잘못된 순서 허용 시간 설정 구성의 영향을 받을 수 있습니다.
출력 이벤트 Stream Analytics 작업이 출력 대상에 보낸 데이터의 양입니다(이벤트 수).
런타임 오류 쿼리 처리와 관련된 총 오류 수입니다. 이벤트를 수집하거나 결과를 출력하는 동안 발견된 오류는 제외됩니다.
SU(메모리) % 사용률 작업에서 사용하는 메모리의 백분율입니다. 이 메트릭이 지속적으로 80%를 초과하고 워터마크 지연이 증가하고 백로그된 이벤트 수가 증가하는 경우 SU(스트리밍 단위)를 증가시키는 것이 좋습니다. 사용률이 높으면 작업에서 할당된 최대 리소스에 가까운 용량을 사용하고 있음을 나타냅니다.
워터마크 지연 작업에 있는 모든 출력의 모든 파티션에서 발생하는 최대 워터마크 지연입니다.

모니터링할 시나리오

Azure Stream Analytics는 서버리스 분산 스트리밍 처리 서비스를 제공합니다. 작업은 서비스에서 자동으로 관리하는 하나 이상의 분산 스트리밍 노드에서 실행할 수 있습니다. 입력 데이터는 분할되어 처리를 위해 다른 스트리밍 노드에 할당됩니다.

메트릭 조건 시간 집계 Threshold 수정 작업
SU(메모리) % 사용률 초과 평균 80 여러 요인으로 인해 SU의 사용률이 증가합니다. 쿼리 병렬화로 크기 조정하거나 SU 수를 늘릴 수 있습니다. 자세한 내용은 Azure Stream Analytics에서 쿼리 병렬 처리 활용을 참조하세요.
CPU 사용률(%) 초과 평균 90 즉, 일부 작업(예: 사용자 정의 함수, 사용자 정의 집계 또는 복잡한 입력 역직렬화)에는 많은 CPU 주기가 필요합니다. 일반적으로 작업에 대한 SU 수를 늘려 이 문제를 극복할 수 있습니다.
런타임 오류 보다 큼 총계 0 활동 또는 리소스 로그를 검사하고 입력, 쿼리 또는 출력을 적절하게 변경합니다.
워터마크 지연 초과 평균 마지막 15분 동안 이 메트릭의 평균 값이 지연 도착 허용 시간(초)보다 큰 경우. 지연 도착 허용 시간을 수정하지 않은 경우, 기본값은 5초로 설정됩니다. SUS 수를 늘리거나 쿼리를 병렬 처리해 보세요. SU에 대한 자세한 내용은 스트리밍 단위 이해 및 조정을 참조하세요. 쿼리 병렬 처리에 대한 자세한 내용은 Azure Stream Analytics에서 쿼리 병렬 처리 활용을 참조 하세요.
입력 역직렬화 오류 보다 큼 총계 0 활동 또는 리소스 로그를 검사하고 입력을 적절하게 변경합니다. 리소스 로그에 대한 자세한 내용은 리소스 로그를 사용하여 Azure Stream Analytics 문제 해결을 참조하세요.

도움말 보기

추가 지원을 받으려면 Azure Stream Analytics대한 Microsoft Q&A 페이지를 사용해 보세요.

다음 단계