다음을 통해 공유


SrCnnAnomalyEstimator 클래스

정의

Spectral Residual(SR) 알고리즘을 사용하여 시계열의 변칙 검색

public sealed class SrCnnAnomalyEstimator : Microsoft.ML.Data.TrivialEstimator<Microsoft.ML.Transforms.TimeSeries.SrCnnAnomalyDetector>
type SrCnnAnomalyEstimator = class
    inherit TrivialEstimator<SrCnnAnomalyDetector>
Public NotInheritable Class SrCnnAnomalyEstimator
Inherits TrivialEstimator(Of SrCnnAnomalyDetector)
상속

설명

이 예측 도구를 만들려면 DetectAnomalyBySrCnn을 사용합니다.

예측 도구 특성

이 예측 도구는 매개 변수를 학습하기 위해 데이터를 확인해야 합니까? No
입력 열 데이터 형식 Single
출력 열 데이터 형식 의 3개 요소 벡터Double
ONNX로 내보낼 수 있습니다.

배경

Microsoft에서는 고객이 시계열을 지속적으로 모니터링하고 시간에 따라 잠재적인 인시던트에 대해 경고하는 데 도움이 되는 시계열 변칙 검색 서비스를 개발했습니다. 시계열 변칙 검색 문제를 해결하기 위해 SR(스펙트럼 잔차) 및 CNN(나선형 신경망)을 기반으로 하는 새로운 알고리즘을 제안합니다. SR 모델은 시각적 타액 감지 도메인에서 시계열 변칙 검색으로 차용됩니다. 여기서는 먼저 이 SR 알고리즘을 온보딩했습니다.

SR(스펙트럼 잔차) 알고리즘은 감독되지 않습니다. 즉, SR을 사용하는 동안 학습 단계가 필요하지 않습니다. 세 가지 주요 단계로 구성됩니다. (1) 로그 진폭 스펙트럼을 가져오기 위한 푸리에 변환; (2) 분광 잔류의 계산; (3) 시퀀스를 공간 도메인으로 다시 변환하는 역 푸리에 변환입니다. 수학적으로 ,시퀀스 $\mathbf{x}$, $$A(f) = Amplitude(\mathfrak{F}(\mathbf{x}))\P(f) = Phrase(\mathfrak{F}(\mathbf{x}))\L(f) = log(A(f)\AL(f) = h_n(f) \cdot L(f)이 있습니다.\R(f) = L(f) - AL(f)\S(\mathbf{x}) = \mathfrak{F}^{-1}(exp(R(f) + P(f)^{2})$$ where $\mathfrak{F}$ 및 $\mathfrak{F}^{-1}$ 각각 푸리에 변환 및 역 푸리에 변환을 나타냅니다. $\mathbf{x}$는 셰이프 $n × 1$인 입력 시퀀스입니다. $A(f)$는 시퀀스 $\mathbf{x}$의 진폭 스펙트럼입니다. $P(f)$는 시퀀스 $\mathbf{x}$의 해당 위상 스펙트럼입니다. $L(f)$는 $A(f)$의 로그 표현입니다. 및 $AL(f)$는 입력 시퀀스를 $h_n(f)$로 구성하여 근사값을 계산할 수 있는 $L(f)$의 평균 스펙트럼입니다. 여기서 $h_n(f)$은 $$n_f(f) = \begin{bmatrix}1&1&1&\cdots&1\1&1&1로 정의된 $n × n$ 행렬입니다.&\cdots&1\\vdots&\vdots&\vdots&\ddots&\vdots\1&1&1&\cdots&1\ end{bmatrix}$$ $R(f)$는 스펙트럼 잔차입니다. 즉, 평균 로그 스펙트럼 $AL(f)$을 뺀 로그 스펙트럼 $L(f)$입니다. 스펙트럼 잔차는 원래 시퀀스의 혁신 부분이 더 중요해지는 동안 시퀀스의 압축된 표현으로 사용됩니다. 마침내 역 푸리에 변환을 통해 시퀀스를 공간 도메인으로 다시 전송합니다. 결과 시퀀스 $S(\mathbf{x})$를 saliency map이라고 합니다. saliency map $S(\mathbf{x})$를 지정하면 출력 시퀀스 $O(\mathbf{x})$는 $$O(x_i) = \begin{cases}1로 계산됩니다. if \frac{S(x_i)-\overline{S(x_i)}}{S(x_i)} > \tau\0,그렇지 않으면\end{cases}$$ 여기서 $x_i$는 시퀀스 $\mathbf{x}$의 임의 지점을 나타냅니다. $S(x_i)는 saliency map에서 해당 지점을 $is$ 및 $\overline{S(x_i)}$는 이전 $포인트의 로컬 평균입니다.S(x_i)$.

SR 알고리즘에 대한 몇 가지 매개 변수가 있습니다. 성능이 우수한 모델을 얻으려면 처음에는 windowSizethreshold 를 조정하는 것이 좋습니다. 이러한 매개 변수는 SR에 대한 가장 중요한 매개 변수입니다. 그런 다음 windowSize보다 크지 않은 적절한 판단WindowSize를 검색할 수 있습니다. 그리고 나머지 매개 변수의 경우 기본값을 직접 사용할 수 있습니다.

자세한 내용은 Microsoft 문서의 시계열 변칙 검색 서비스를 참조하세요.

메서드

Fit(IDataView)

Spectral Residual(SR) 알고리즘을 사용하여 시계열의 변칙 검색

(다음에서 상속됨 TrivialEstimator<TTransformer>)
GetOutputSchema(SchemaShape)

Spectral Residual(SR) 알고리즘을 사용하여 시계열의 변칙 검색

확장 메서드

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

추정기 체인에 '캐싱 검사점'을 추가합니다. 이렇게 하면 다운스트림 예측 도구가 캐시된 데이터에 대해 학습됩니다. 여러 데이터 전달을 수행하는 트레이너 앞에 캐싱 검사점이 있으면 도움이 됩니다.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

추정기가 지정된 경우 가 호출되면 Fit(IDataView) 대리자를 호출할 래핑 개체를 반환합니다. 예측 도구가 적합한 항목에 대한 정보를 반환하는 것이 중요하기 때문에 Fit(IDataView) 메서드는 일반 ITransformer가 아닌 특별히 형식화된 개체를 반환합니다. 그러나 동시에 IEstimator<TTransformer> 많은 개체가 있는 파이프라인으로 형성되는 경우가 많으므로 변환기를 가져오려는 추정기가 이 체인의 어딘가에 묻혀 있는 위치를 통해 EstimatorChain<TLastTransformer> 추정기 체인을 빌드해야 할 수 있습니다. 이 시나리오에서는 fit이 호출되면 호출될 대리자를 이 메서드를 통해 연결할 수 있습니다.

적용 대상

추가 정보