Udostępnij za pośrednictwem


Funkcje opóźnień prognozowania szeregów czasowych w rozwiązaniu AutoML

W tym artykule opisano, jak zautomatyzowane uczenie maszynowe (AutoML) w usłudze Azure Machine Learning tworzy funkcje agregacji opóźnień i okien krocznych, które ułatwiają prognozowanie modeli regresji szeregów czasowych. Funkcje rozwiązania AutoML używają historycznych danych modelu, które mogą znacznie zwiększyć dokładność modelu, pomagając modelowi uczyć się wzorców korelacji w czasie.

Jeśli chcesz dowiedzieć się więcej na temat metodologii prognozowania w rozwiązaniu AutoML, zobacz Omówienie metod prognozowania w rozwiązaniu AutoML. Aby zapoznać się z przykładami trenowania modeli prognozowania w rozwiązaniu AutoML, zobacz Konfigurowanie rozwiązania AutoML do trenowania modelu prognozowania szeregów czasowych przy użyciu zestawu SDK i interfejsu wiersza polecenia.

Opóźnienie cechowania w rozwiązaniu AutoML

Rozwiązanie AutoML generuje funkcje opóźnień, które odpowiadają horyzontowi prognozy. W tej sekcji omówiono opóźnienie cechowania w rozwiązaniu AutoML dla modelu z horyzontem prognozy trzech i kolejności opóźnienia docelowego jednego. W poniższych tabelach przedstawiono dane modelu i funkcje opóźnień dla comiesięcznych szeregów czasowych.

Tabela 1. Oryginalna seria czasowa

Data $y_t$
1/1/2001 0
2/1/2001 10
3/1/2001 20
4/1/2001 30
5/1/2001 40
6/1/2001 50

Pierwszy krok generuje funkcję opóźnienia tylko dla horyzontu $h=1$. W kolejnych tabelach pokazano, dlaczego proces używa poszczególnych horyzontów do ukończenia cechowania opóźnienia.

Tabela 2. Opóźnienie cechowania dla horyzontu $h=1$

Data $y_t$ Pochodzenie $y_{t-1}$ $h$
1/1/2001 0 12/1/2000 - 1
2/1/2001 10 1/1/2001 0 1
3/1/2001 20 2/1/2001 10 1
4/1/2001 30 3/1/2001 20 1
5/1/2001 40 4/1/2001 30 1
6/1/2001 50 5/1/2001 40 1

Rozwiązanie AutoML generuje dane w tabeli 2 z danych w tabeli 1 przez przesunięcie kolumny $y_t$ w dół przez pojedynczą obserwację. Tabele od 2 do 5 zawierają kolumnę Origin , aby pokazać daty, z których pochodzą funkcje opóźnienia.

Następny krok generuje funkcję opóźnienia tylko dla horyzontu prognozy $h=2$.

Tabela 3. Opóźnienie cechowania dla horyzontu prognozy $h=2$

Data $y_t$ Pochodzenie $y_{t-2}$ $h$
1/1/2001 0 11/1/2000 - 2
2/1/2001 10 12/1/2000 - 2
3/1/2001 20 1/1/2001 0 2
4/1/2001 30 2/1/2001 10 2
5/1/2001 40 3/1/2001 20 2
6/1/2001 50 4/1/2001 30 2

Rozwiązanie AutoML generuje dane w tabeli 3 z danych w tabeli 1, przenosząc kolumnę $y_t$ w dół o dwie obserwacje.

Następny krok generuje funkcję opóźnienia tylko dla horyzontu prognozy $h=3$.

Tabela 4. Opóźnienie cechowania dla horyzontu prognozy $h=3$

Data $y_t$ Pochodzenie $y_{t-3}$ $h$
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 3/1/2001 20 3

Ostatni krok łączy dane w tabelach 1, 2 i 3 oraz zmienia kolejność wierszy.

Tabela 5. Ukończenie cechowania

Data $y_t$ Pochodzenie $y_{t-1}^{(h)}$ $h$
1/1/2001 0 12/1/2000 - 1
1/1/2001 0 11/1/2000 - 2
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 1/1/2001 0 1
2/1/2001 10 12/1/2000 - 2
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 2/1/2001 10 1
3/1/2001 20 1/1/2001 0 2
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 3/1/2001 20 1
4/1/2001 30 2/1/2001 10 2
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 4/1/2001 30 1
5/1/2001 40 3/1/2001 20 2
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 4/1/2001 40 1
6/1/2001 50 4/1/2001 30 2
6/1/2001 50 3/1/2001 20 3

W tabeli 5 nazwa kolumny opóźnienie została zmieniona na $y_{t-1}^{(h)}$ w celu odzwierciedlenia, że opóźnienie jest generowane w odniesieniu do określonego horyzontu. Tabela 5 pokazuje, jak opóźnienia generowane w odniesieniu do horyzontu mogą być mapowane na konwencjonalne sposoby generowania opóźnień w poprzednich tabelach.

Tabela 5 jest przykładem rozszerzania danych stosowanego przez rozwiązanie AutoML do danych szkoleniowych w celu umożliwienia bezpośredniego prognozowania z modeli regresji. Gdy konfiguracja zawiera funkcje opóźnień, rozwiązanie AutoML tworzy opóźnienia zależne od horyzontu wraz z funkcją horyzontu o wartości całkowitej. Modele regresji prognozowania automatycznego uczenia maszynowego mogą przewidywać na horyzoncie $h$ bez względu na przewidywanie na poziomie $h-1$, w przeciwieństwie do rekursywnie zdefiniowanych modeli, takich jak ARIMA.

Zagadnienia dotyczące cech opóźnienia

Istnieje kilka zagadnień związanych z opóźnieniem cechowania modelu. Zapoznaj się z poniższymi sekcjami, aby zidentyfikować potencjalne akcje dla danego scenariusza.

Wzrost rozmiaru zestawu danych

Gdy rozwiązanie AutoML generuje funkcje opóźnienia zależnego od horyzontu, dodaje nowe wiersze do zestawu danych modelu. Liczba nowych wierszy jest proporcjonalna do horyzontu prognozy.

Wzrost rozmiaru zestawu danych może prowadzić do błędów braku pamięci w mniejszych węzłach obliczeniowych lub gdy rozmiar zestawu danych jest już duży. Rozwiązania tego problemu można znaleźć w artykule Często zadawane pytania dotyczące prognozowania automatycznego uczenia maszynowego.

Oddzielenie kolejności opóźnień i horyzontu prognozy

Strategia automatycznego uczenia maszynowego opóźnia kolejność opóźnień i horyzont prognozy. Załóżmy, że twój horyzont prognozy wynosi siedem i chcesz, aby rozwiązanie AutoML używało funkcji opóźnień. W tym scenariuszu nie trzeba ustawiać kolejności opóźnienia na siedem, aby zapewnić przewidywanie na pełnym horyzoncie prognozy. Ponieważ automl generuje opóźnienia w odniesieniu do horyzontu, można ustawić kolejność opóźnienia na jedną. Rozwiązanie AutoML rozszerza dane, dzięki czemu opóźnienia dowolnego zamówienia są prawidłowe do horyzontu prognozy.