변칙 검색 및 예측

버전 드롭다운 목록을 사용하여 서비스를 전환합니다. 탐색에 대해 자세히 알아봅니다.
적용 대상: ✅ Microsoft Fabric ✅ Azure Data Explorer ✅ Azure Monitor ✅ Microsoft Sentinel

클라우드 서비스 및 IoT 디바이스는 서비스 상태, 프로덕션 프로세스 및 사용 추세를 모니터링하는 데 사용하는 원격 분석을 생성합니다. 시계열 분석을 사용하면 각 메트릭의 기준 패턴에서 편차를 확인할 수 있습니다.

KQL(Kusto Query Language)에는 여러 시계열을 만들고 조작하고 분석하기 위한 기본 지원이 포함됩니다. KQL을 사용하여 거의 실시간 모니터링을 위해 몇 초 만에 수천 대의 시계열을 만들고 분석합니다.

이 문서에서는 KQL 시계열 변칙 검색 및 예측 기능을 설명합니다. 함수는 각 시계열을 계절, 추세 및 잔차 구성 요소로 분할하는 강력하고 잘 알려진 분해 모델을 사용합니다. 잔차 구성 요소에서 이상값을 찾아 변칙을 탐지합니다. 계절 및 추세 구성 요소를 추정하여 예측합니다. KQL은 자동 계절성 검색, 강력한 이상값 분석 및 수천 개의 시계열을 초 단위로 처리하는 벡터화된 구현을 추가합니다.

필수 조건

Microsoft 계정 또는 Microsoft Entra 사용자 ID를 사용합니다. Azure 구독이 필요하지 않습니다.
시계열 분석의 시계열 기능에 대해 알아봅니다.

시계열 분해 모델

시계열 예측 및 변칙 검색을 위한 KQL 네이티브 구현은 잘 알려진 분해 모델을 사용합니다. 서비스 트래픽, 구성 요소 하트비트 및 정기적인 IoT 측정과 같은 주기적이고 추세적인 동작이 있는 시계열에 이 모델을 사용하여 향후 값을 예측하고 변칙을 검색합니다. 회귀에서는 계절 및 추세 구성 요소를 제거한 후 나머지가 임의라고 가정합니다. 계절 및 추세 구성 요소(기준)에서 미래 값을 예측하고 잔차를 무시합니다. 잔차 구성 요소에서 이상값 분석을 실행하여 변칙을 검색합니다. 이 함수를 series_decompose() 사용하여 분해 모델을 만듭니다. 각 시계열을 계절, 추세, 잔차 및 기준 구성 요소로 분해합니다.

예: 내부 웹 서비스 트래픽 분해:

쿼리 실행

let min_t = datetime(2017-01-05);
let max_t = datetime(2017-02-03 22:00);
let dt = 2h;
demo_make_series2
| make-series num=avg(num) on TimeStamp from min_t to max_t step dt by sid 
| where sid == 'TS1'   // Select a single time series for cleaner visualization
| extend (baseline, seasonal, trend, residual) = series_decompose(num, -1, 'linefit')  // Decompose each time series into seasonal, trend, residual, and baseline (seasonal + trend)
| render timechart with(title='Web app traffic for one month, decomposition', ysplit=panels)

시간 차트의 계절, 추세, 잔차 및 기준 구성 요소에 대한 원래 계열 및 패널을 보여 주는 시계열 분해 스크린샷

원래 시계열은 num (빨간색)으로 표시됩니다.
이 프로세스는 함수를 사용하여 series_periods_detect() 계절성을 자동으로 검색하고 계절 패턴(자주색)을 추출합니다.
원래 시계열에서 계절 패턴을 빼고 함수를 series_fit_line() 사용하여 선형 회귀를 실행하여 추세 구성 요소(연한 파랑)를 찾습니다.
이 함수는 추세를 빼고 나머지는 잔차 구성 요소(녹색)입니다.
마지막으로 계절 및 추세 구성 요소를 추가하여 기준선 (파란색)을 생성합니다.

시계열 변칙 검색

이 함수 series_decompose_anomalies() 는 시계열 집합에서 비정상적인 점을 찾습니다. 이 함수는 분해 모델을 빌드하기 위해 호출 series_decompose() 한 다음, 잔차 구성 요소에서 실행됩니다 series_outliers() . series_outliers() 는 Tukey의 펜스 테스트를 사용하여 잔여 구성 요소의 각 지점에 대한 변칙 점수를 계산합니다. 1.5 이하 또는 -1.5 미만의 변칙 점수는 각각 가벼운 변칙 상승 또는 감소를 나타냅니다. 3.0 이상 또는 -3.0 미만의 변칙 점수는 강력한 변칙을 나타냅니다.

다음 쿼리를 사용하면 내부 웹 서비스 트래픽에서 변칙을 검색할 수 있습니다.

쿼리 실행

let min_t = datetime(2017-01-05);
let max_t = datetime(2017-02-03 22:00);
let dt = 2h;
demo_make_series2
| make-series num=avg(num) on TimeStamp from min_t to max_t step dt by sid 
| where sid == 'TS1'   //  select a single time series for a cleaner visualization
| extend (anomalies, score, baseline) = series_decompose_anomalies(num, 1.5, -1, 'linefit')
| render anomalychart with(anomalycolumns=anomalies, title='Web app. traffic of a month, anomalies') //use "| render anomalychart with anomalycolumns=anomalies" to render the anomalies as bold points on the series charts.

시계열 변칙 검색

원래 시계열(빨간색)입니다.
기준(계절별 + 추세) 구성 요소(파란색)입니다.
원래 시계열 위에 있는 자주색 비정상적인 점입니다. 비정상적인 점이 예상 기준 값과 크게 다릅니다.

시계열 예측

이 함수 series_decompose_forecast() 는 시계열 집합의 미래 값을 예측합니다. 이 함수 series_decompose() 는 분해 모델을 빌드한 다음 각 시계열에 대해 기준 구성 요소를 미래로 추정합니다.

다음 쿼리를 사용하면 다음 주 웹 서비스 트래픽을 예측할 수 있습니다.

쿼리 실행

let min_t = datetime(2017-01-05);
let max_t = datetime(2017-02-03 22:00);
let dt = 2h;
let horizon=7d;
demo_make_series2
| make-series num=avg(num) on TimeStamp from min_t to max_t+horizon step dt by sid 
| where sid == 'TS1'   //  select a single time series for a cleaner visualization
| extend forecast = series_decompose_forecast(num, toint(horizon/dt))
| render timechart with(title='Web app. traffic of a month, forecasting the next week by Time Series Decomposition')

시계열 예측.

원본 메트릭(빨간색) 미래 값이 누락되고 기본적으로 0으로 설정됩니다.
기준 구성 요소(파란색)를 추정하여 다음 주 값을 예측합니다.

확장성

Kusto 쿼리 언어 구문을 사용하면 단일 호출에서 여러 시계열을 처리할 수 있습니다. 고유한 최적화된 구현을 통해 빠른 성능을 구현할 수 있으며, 이는 거의 실시간 시나리오에서 수천 개의 카운터를 모니터링할 때 효과적인 변칙 검색 및 예측에 매우 중요합니다.

다음 쿼리는 세 개의 시계열을 동시에 처리하는 방법을 보여줍니다.

쿼리 실행

let min_t = datetime(2017-01-05);
let max_t = datetime(2017-02-03 22:00);
let dt = 2h;
let horizon=7d;
demo_make_series2
| make-series num=avg(num) on TimeStamp from min_t to max_t+horizon step dt by sid
| extend offset=case(sid=='TS3', 4000000, sid=='TS2', 2000000, 0)   //  add artificial offset for easy visualization of multiple time series
| extend num=series_add(num, offset)
| extend forecast = series_decompose_forecast(num, toint(horizon/dt))
| render timechart with(title='Web app. traffic of a month, forecasting the next week for 3 time series')

시계열 확장성.

요약

이 문서에서는 시계열 변칙 검색 및 예측을 위한 네이티브 KQL 함수에 대해 자세히 설명합니다. 각 원래 시계열은 변칙 및/또는 예측을 검색하기 위해 계절, 추세 및 잔차 구성 요소로 분해됩니다. 이러한 기능은 오류 감지, 예측 유지 관리, 수요 및 부하 예측과 같은 거의 실시간 모니터링 시나리오에 사용할 수 있습니다.

KQL 을 사용하는 변칙 진단 기능에 대해 알아보기

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-02-05

변칙 검색 및 예측

필수 조건

시계열 분해 모델

시계열 변칙 검색

시계열 예측

확장성

요약

관련 콘텐츠

피드백

추가 리소스