다음을 통해 공유


SsaChangePointEstimator 클래스

정의

단수 스펙트럼 분석을 사용하여 시계열의 변경 지점을 검색합니다.

public sealed class SsaChangePointEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.TimeSeries.SsaChangePointDetector>
type SsaChangePointEstimator = class
    interface IEstimator<SsaChangePointDetector>
Public NotInheritable Class SsaChangePointEstimator
Implements IEstimator(Of SsaChangePointDetector)
상속
SsaChangePointEstimator
구현

설명

이 추정기를 만들려면 DetectChangePointBySsa를 사용합니다.

입력 및 출력 열

입력 열이 하나만 있습니다. 입력 열은 값이 Single 시계열의 타임스탬프 값을 나타내는 위치여야 Single 합니다.

요소가 4개인 벡터인 열을 생성합니다. 출력 벡터에는 경고 수준(0이 아닌 값은 변경 지점을 의미함), 점수, p-value 및 martingale 값이 순차적으로 포함됩니다.

추정기 특성

이 예측 도구는 매개 변수를 학습하기 위해 데이터를 확인해야 합니까?
입력 열 데이터 형식 Single
출력 열 데이터 형식 의 4개 요소 벡터Double
ONNX로 내보낼 수 있습니다. 아니요

추정기 특성

기계 학습 작업 이상 감지
정규화가 필요한가요? 아니요
캐싱이 필요한가요? 아니요
Microsoft.ML 외에도 필요한 NuGet Microsoft.ML.TimeSeries

학습 알고리즘 세부 정보

이 클래스는 SSA(단수 스펙트럼 분석)를 기반으로 하는 일반 변칙 검색 변환을 구현합니다. SSA는 시계열을 추세, 계절성 및 노이즈 구성 요소로 분해하고 시계열의 미래 가치를 예측하기 위한 강력한 프레임워크입니다. 원칙에 따라 SSA는 입력 시계열에서 스펙트럼의 각 구성 요소가 시계열의 추세, 계절 또는 노이즈 구성 요소에 해당하는 스펙트럼 분석을 수행합니다. SSA(단수 스펙트럼 분석)에 대한 자세한 내용은 이 문서를 참조하세요.

Anomaly Scorer

타임스탬프의 원시 점수가 계산되면 변칙 점수 구성 요소에 공급되어 해당 타임스탬프에서 최종 변칙 점수를 계산합니다. 이 득점자, p-값 및 martingale 점수와 관련된 두 가지 통계가 있습니다.

P-값 점수

p-value 점수는 원시 점수 분포에 따라 현재 계산된 원시 점수의 p-값을 나타냅니다. 여기서 분포는 가장 최근의 원시 점수 값을 기준으로 기록의 특정 깊이까지 예측됩니다. 더 구체적으로 말하면, 이 분포는 적응 대역폭의 가우스 커널과 함께 커널 밀도 추정을 사용하여 추정됩니다. p-value 점수는 항상 $[0, 1]$에 있으며 값이 낮을수록 현재 점이 이상값(스파이크라고도 함)일 가능성이 높습니다.

마팅게일 점수에 따른 변경 지점 검색

martingale 점수는 p-value 점수를 기반으로 하는 추가 점수 수준입니다. 이 아이디어는 i.i.d. 값 스트림에 대한 배포 변경을 감지하는 Exchangeability Martingales 를 기반으로 합니다. 즉, 작은 p 값 시퀀스가 행에서 검색되면 martingale 점수의 값이 크게 증가하기 시작합니다. 기본 데이터 생성 프로세스의 배포가 변경되었음을 나타냅니다. 따라서 마팅게일 점수는 변경 지점 검색에 사용됩니다. 가장 최근에 관찰된 p-값, $p 1, \dots, p_n$의 시퀀스를 감안할 때 martingale 점수는 다음과 같이 계산됩니다. $s(p1, \dots, p_n) = \prod_{i=1}^n \beta(p_i)$. $\beta$의 두 가지 선택 항목은 $\beta(p) = e p^{\epsilon - 1}$ for $0 < \epsilon < 1$ 또는 $\beta(p) = \int_{0}^1 \epsilon p^{\epsilon - 1} d\epsilon$입니다.

martingle 점수가 $q_i=1 - \frac{\text{confidence}}{100}$인 $s(q_1, \dots, q_n)$를 초과하는 경우 연결된 타임스탬프는 변경 지점 검색에 대해 0이 아닌 경고 값을 가져올 수 있습니다. $\text{confidence}$는 DetectChangePointBySsa 또는 DetectIidChangePoint의 서명에 정의되어 있습니다.

사용 예제에 대한 링크는 참고 섹션을 확인하세요.

메서드

Fit(IDataView)

변환기를 학습시키고 반환합니다.

GetOutputSchema(SchemaShape)

변환기에 대한 스키마 전파입니다. 입력 스키마가 제공된 스키마와 같으면 데이터의 출력 스키마를 반환합니다.

확장 메서드

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

추정기 체인에 '캐싱 검사점'을 추가합니다. 이렇게 하면 다운스트림 추정기가 캐시된 데이터에 대해 학습됩니다. 여러 데이터 전달을 수행하는 트레이너 앞에 캐싱 검사점이 있는 것이 좋습니다.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

추정기가 지정된 경우 호출된 대리 Fit(IDataView) 자를 호출할 래핑 개체를 반환합니다. 예측 도구가 적합한 항목에 대한 정보를 반환하는 것이 중요한 경우가 많습니다. 따라서 Fit(IDataView) 메서드는 일반 ITransformer개체가 아닌 구체적으로 형식화된 개체를 반환합니다. 그러나 동시에 IEstimator<TTransformer> 개체가 많은 파이프라인으로 형성되는 경우가 많으므로 변환기를 가져올 추정기가 이 체인의 어딘가에 묻혀 있는 위치를 통해 EstimatorChain<TLastTransformer> 추정기 체인을 빌드해야 할 수 있습니다. 이 시나리오에서는 이 메서드를 통해 fit이 호출되면 호출될 대리자를 연결할 수 있습니다.

적용 대상

추가 정보