Udostępnij za pośrednictwem


Informacje techniczne algorytm serii czasowych firmy Microsoft

The Microsoft czas Series algorithm includes two separate algorithms:

  • Algorytmu ARTXP, który został wprowadzony w SQL Server 2005, jest zoptymalizowana ze względu na przewidywaniu następnej prawdopodobnie wartości w serii.

  • Algorytm ARIMA został dodany SQL Server 2008 Aby zwiększyć dokładność w długoterminowych przewidywanie.

Domyślnie Analysis Services za pomocą algorytmu każdy osobno na szkolić w modelu, a następnie łączy wyniki do dają najlepsze przewidywanie dla zmiennej liczby prognoz. Można także użyć tylko jednego z algorytmów, na podstawie własnych danych i przewidywanie wymagań.W SQL Server 2008 Enterprise, można także dostosować Punkt odcięcia, który kontroluje mieszania algorytmy podczas przewidywanie.

Ten temat zawiera dodatkowe informacje na temat sposobu implementacji każdy algorytm i dostosować algorytm przez ustawienie parametrów w celu dostosowania do analizy i przewidywanie wyników.

Implementacja algorytmów seria czas

Microsoft Badania opracowane algorytm ARTXP i na jej podstawie Microsoft Algorytm drzewa decyzji, czyli model drzewa autoregressive odpowiadające okresowe czas serii danych. Algorytm ARTXP odnosi się zmienna liczba poprzednich elementów dla każdego bieżącego zapasu, który jest jest przewidywane.Imię i nazwisko, ARTXP, wynika z fakt algorytm ART lub metoda drzewa autoregressive, zastosowana do wielu, nieznany stanów wcześniejsze.Aby szczegółowy opis algorytmu ARTXP zobacz Modele Autoregressive drzewa na moduł analiz czas serii.

Algorytm ARIMA służy do przewidywanie długoterminowe.Jest to implementacja algorytmu ARIMA opracowane przez pole i Jenkins.ARIMA lub średnią ruchomą autoregressive zintegrowanych, jest dobrze znanych metoda określania zależności w obserwacje dokonane sekwencyjnie w czas.Obsługuje ona również multiplikatywne sezonowością.Algorytm ARIMA używa autoregressive i przenoszenie terminów średnia.

Mimo że algorytm ARTXP obsługuje wzajemne przewidywanie, nie obsługuje algorytmu ARIMA.Dlatego przewidywanie krzyżyk jest dostępny tylko wtedy, gdy jest używany mieszany algorytmów lub podczas konfigurowania modelu w celu wykorzystania tylko ARTXP.

Dostosowywanie Microsoft czas serii algorytm

The Microsoft czas Series algorithm supports several parameters that affect the behavior, performance, and accuracy of the resulting model wyszukiwania.

Wykrywanie sezonowością

Both algorithms support detection of seasonality or periodicity.Analysis Services uses Fast Fourier transformation to detect seasonality before training.

Aby osiągnąć jak najlepsze wyniki, można kontrolować sezonowością wykrywania przez ustawienie parametrów algorytmu.Zmieniając wartość AUTODETECT_SEASONALITY, liczba możliwych może mieć wpływ czas segmenty, które są generowane. Przez ustawienie wartości lub wiele wartości dla PERIODICITY_HINT, można dostarczać informacje o znanych okresy powtarzające się algorytm i zwiększyć dokładność wykrywania.

Uwaga

Algorytmy ARTXP i ARIMA jest wielkość liter do sezonowością wskazówek.W związku z tym zapewniając niewłaściwy wskazówkę dotyczącą może niekorzystnie wpłynąć na wyniki.

Mieszanie algorytmy

Domyślnie Analysis Services łączy i jednakowo przeprowadzi algorytmów. Jednak w SQL Server 2008 Enterprise, można dostosować mieszania wyników przez wybranie opcji mieszane i ustawienie parametru przeprowadzi wyniki kierunku krótkim lub długoterminowe przewidywanie.

Jeśli chcesz użyć krzyżyk przewidywanie, należy użyć ARTXP lub mieszane opcji ponieważ ARIMA nie obsługuje przewidywanie granic.

Aby kontrolować wybór algorytmu, który zestaw FORECAST_METHOD parametr. Domyślnie FORECAST_METHOD parametr jest zestaw do mieszane, a Analysis Services używa Oba algorytmy, a następnie przeprowadzi ich wartości, aby zmaksymalizować mocnych każdego algorytmu. Można jednak zestaw FORECAST_METHOD Aby ARTXP, jeśli chcesz używać jedynie algorytmu ARTXP lub ARIMA, jeśli chcesz używać jedynie algorytmu ARIMA.

W SQL Server 2008 Enterprise, można także dostosować sposób Analysis Services miesza kombinacji algorytmów ARIMA i ARTXP. Oba punktu początkowego mieszanki i szybkość zmian można kontrolować, ustawiając PREDICTION_SMOOTHING parametr:

  • Jeśli użytkownik zestaw PREDICTION_SMOOTHING 0 model staje się ARTXP czysty.

  • Jeśli użytkownik zestaw PREDICTION_SMOOTHING 1 model staje się ARIMA czysty.

  • Jeśli użytkownik set PREDICTION_SMOOTHING wartość od 0 do 1 model przeprowadzi algorytm ARTXP jako funkcja wykładniczo zmniejszającej kroków przewidywanie. W tym samym czas, model również przeprowadzi algorytm ARIMA jako uzupełnienie 1 ARTXP wagi.Model używa normalizacji i stała stabilizacji na gładkie krzywe.

Ogólnie rzecz biorąc Jeśli przewidywania wycinki czas do 5, ARTXP jest prawie zawsze lepszym rozwiązaniem.Niemniej jednak jak możesz zwiększyć liczbę wycinków czas do przewidywania, ARIMA zazwyczaj wykonuje lepiej.

Na poniższym diagramie przedstawiono, w jaki sposób model przejścia algorytmów po PREDICTION_SMOOTHING jest zestaw domyślną wartość 0,5. ARIMA i ARTXP są liczone równomiernie na początku, ale jest numerem przewidywanie kroki wzrasta, ARIMA jest znacznie bardziej ważone.

default curve for mix of time series algorithms

Natomiast poniższy rysunek stanowi ilustrację mieszania algorytmów po PREDICTION_SMOOTHING ma wartość 0,2. W kroku 0, model przeprowadzi ARIMA 0,2 i ARTXP jako 0,8. Po tej dacie wagi ARIMA wykładniczo zwiększa i waga ARTXP wykładniczo zmniejsza.

decay curve for time series model mixing

Ustawianie parametrów algorytmu

W poniższej tabela opisano parametry, które mogą być używane z Microsoft Algorytm seria czas.

Parameter

Description

AUTO_DETECT_PERIODICITY

Określa wartość liczbową między 0 do 1, które wykrywa okresowości. Wartość domyślna to 0,6.

Jeśli wartość jest bliżej 0, okresowości jest wykrywany tylko dla danych zdecydowanie okresowych.

Ustawienie tej wartości bliżej 1 preferuje odnajdowanie wielu wzorców, które są prawie okresowe i automatyczne generowanie okresowości wskazówek.

NoteNote:
Zajmowanie wielu wskazówek okresowości prawdopodobnie będą prowadziły do znacznie dłuższy czas szkolenia modelu, ale dokładniej modeli.

COMPLEXITY_PENALTY

Określa przyrost drzewo decyzyjne.Wartość domyślna to 0,1.

Zmniejszenie tej wartości wzrasta ryzyko podziału.Zwiększenie tej wartości zmniejsza ryzyko podziału.

NoteNote:
Ten parametr jest dostępny tylko w SQL Server Flaga.

FORECAST_METHOD

Określa, który algorytm ma być używany do analizy i prognozowania.Możliwe wartości to ARTXP, ARIMA lub mieszane.Wartością domyślną jest mieszane.

HISTORIC_MODEL_COUNT

Określa liczbę modeli historycznych, które zostanie zbudowana.Wartość domyślna to 1.

NoteNote:
Ten parametr jest dostępny tylko w SQL Server Flaga.

HISTORICAL_MODEL_GAP

Określa zwłokę czasową między dwoma modelami historycznych następujących po sobie.Wartość domyślna to 10.Wartość oznacza liczbę jednostek czas, w których jednostka jest zdefiniowane przez model.

Na przykład ustawienie tej wartości g powoduje, że historycznych modele mają zostać zbudowane dla danych, który jest obcięty przez czas wycinki odstępach g, 2 * g, 3 * gi tak dalej.

NoteNote:
Ten parametr jest dostępny tylko w SQL Server Flaga.

INSTABILITY_SENSITIVITY

Określa punkt, w którym przewidywanie odchylenie przekracza określony próg i algorytm ARTXP pomija prognoz.Wartość domyślna to 1.

NoteNote:
Ten parametr dotyczy tylko ARTXP i dlatego nie ma zastosowania do modeli, które są tworzone przy użyciu tylko algorytm ARIMA.W wypadku zastosowania modelu mieszane, parametr ma zastosowanie tylko do części ARTXP modelu.

The default value of 1 provides the same behavior for ARTXP models as in SQL Server 2005.Analysis Services monitors the normalized standard deviation for each prediction.Jak najszybciej odchyleń standardize dla wszelkich przewidywanie przekracza próg, algorytm serii czas zwraca wartość NULL i zatrzymuje proces przewidywanie.

Wartość 0 Zatrzymuje niestabilność wykrywania. Oznacza to, że można utworzyć nieskończoną liczbę prognoz, niezależnie od odchylenie.

NoteNote:
Ten parametr można modyfikować tylko w SQL Server Flaga. W SQL Server Standard, Analysis Services używa tylko domyślną wartość 1.

MAXIMUM_SERIES_VALUE

Określa maksymalną wartość dla prognoz.Ten parametr jest używany, wraz z MINIMUM_SERIES_VALUE, aby ograniczyć prognoz do niektórych oczekiwano zakres. Na przykład można określić, że przewidywane ilości sprzedaży dla każdego dnia nigdy nie powinna przekraczać liczby produktów w magazynie.

NoteNote:
Ten parametr jest dostępny tylko w SQL Server Flaga.

MINIMUM_SERIES_VALUE

Określa minimalną wartość można przewidzieć.Ten parametr jest używany, wraz z MAXIMUM_SERIES_VALUE, aby ograniczyć prognoz do niektórych oczekiwano zakres. Na przykład można określić, że przewidywane ilości sprzedaży nigdy nie powinna być liczbą ujemną.

NoteNote:
Ten parametr jest dostępny tylko w SQL Server Flaga.

MINIMUM_SUPPORT

Określa minimalną liczbę wycinków czas wymaganych do generowania podział w drzewie serii każdej godziny.Wartość domyślna to 10.

MISSING_VALUE_SUBSTITUTION

Określa, w jaki sposób są wpisywane przerw w danych historycznych.Domyślnie przerwy w danych nie są dozwolone.

W poniższej tabela przedstawiono możliwe wartości tego parametru:

WartośćDescription
PreviousPowtarza się wartości z poprzedniego przedział czas.
MeanUżywa średniej ruchomej wycinków czas w szkolenia.
stała liczbowejUżywa określonej liczby w celu zastąpienia wszystkich brakujących wartości.
NoneZastępuje brakujące wartości z wartościami są wykreślane wzdłuż krzywej wyszkolonych modelu.Jest to wartość domyślna.

Jeśli dane zawierają wiele serii danych, serii nie może mieć ragged krawędzie.Oznacza to wszystkie serie powinny mieć takie same rozpoczęcia i punktów końcowych.

Analysis Services Aby wypełnić przerwy w nowych danych, podczas wykonywania używa również wartość tego parametru PREDICTION JOIN na czas modelu serii.

PERIODICITY_HINT

Zawiera wskazówki w algorytmie, aby okresowości danych.Na przykład jeśli sprzedaży zależy od roku, a jednostki miary w serii są miesiące, okresowość wynosi 12.Ten parametr ma format {n [, n]}, where n jest dowolną liczbą dodatnią.

The n in the brackets [] is optional and can be repeated as frequently as needed.Na przykład aby udostępnia kilka wskazówek okresowość dla dostarczonych danych co miesiąc, możesz wpisać {12, 3, 1} do wykrywać wzorów rok, kwartał i miesiąc.Okresowość ma jednak silny wpływ na jakość modelu.Jeśli wskazówki, którzy zetknęli różni się od rzeczywistej okresowości, wyniki wyszukiwania mogą mieć negatywny wpływ.

Wartość domyślna to {1}.

NoteNote:
Wymagane są nawiasy klamrowe.Ponadto ten parametr ma typ danych ciąg znaków.W związku z tym jeśli ten parametr zostanie wpisana jako część instrukcja DMX (wyszukiwanie danych rozszerzenia), należy ująć numer i nawiasy w cudzysłowach.

PREDICTION_SMOOTHING

Określa, jak modelu powinny być łączone w celu zoptymalizowania prognozowania.Można wpisać dowolną wartość z przedziału 0 1 i lub użyj jednej z następujących wartości:

NoteNote:
Użycie FORECAST_METHOD parametru do formantu szkolenia.
WartośćDescription
0Określa, że przewidywanie używa tylko ARTXP.Prognozowanie jest zoptymalizowany pod kątem mniej prognoz.
1Określa, że przewidywanie używa tylko ARIMA.Prognozowanie jest zoptymalizowany pod kątem wielu prognoz.
0.5(Domyślnie) Określa, w przypadku przewidywanie Oba algorytmy, należy użyć, a wyniki mieszane.
NoteNote:
Ten parametr jest dostępny tylko w SQL Server Flaga.

Modelowanie flagi

The Microsoft czas Series algorithm supports the following modeling flags. Podczas tworzenia struktura wyszukiwania lub model wyszukiwania, należy zdefiniować modelowania flagi, aby określić sposób obsługi wartości w każdej kolumnie podczas analizy.Aby uzyskać więcej informacji zobaczFlagi modelowania (wyszukiwanie danych).

Flaga modelowania

Description

NIEDOZWOLONE WARTOŚCI NULL

Wskazuje, że kolumna nie może zawierać wartość null.Jeżeli usługi Analysis Services napotyka wartość null podczas szkolenia modelu, spowoduje błąd.

Stosuje się do kolumn struktura wyszukiwania.

MODEL_EXISTENCE_ONLY

Oznacza, że kolumna będą traktowane jako mające dwóch możliwych stanów: Brak i istniejącego. Wartość null jest brak wartości.

Stosuje się do kolumn w model wyszukiwania.

Wymagania

Czas modelu serii musi zawierać kolumnę klucz czasu, która zawiera unikatowych wartości, wejściowy kolumny i co najmniej jedną przewidywalna kolumna.

Dane wejściowe i uzyskania przewidywalnej kolumny

The Microsoft czas Series algorithm supports the specific input column content types, przewidywalna kolumna content types, and modeling flags that are listed in the following tabela.

Kolumna

Typy zawartości

Atrybut wejściowy

Ciągłe, klucza, klucz czas i tabela

Atrybut przewidywalne

Ciągłe, tabela

Uwaga

Obsługiwane są typy zawartości Cyclical i Zamówione, ale algorytm traktuje je jako discrete wartości i nie wykonuje przetwarzania specjalne.