Funkcje opóźnień prognozowania szeregów czasowych w rozwiązaniu AutoML
W tym artykule opisano, jak zautomatyzowane uczenie maszynowe (AutoML) w usłudze Azure Machine Learning tworzy funkcje agregacji opóźnień i okien krocznych, które ułatwiają prognozowanie modeli regresji szeregów czasowych. Funkcje rozwiązania AutoML używają historycznych danych modelu, które mogą znacznie zwiększyć dokładność modelu, pomagając modelowi uczyć się wzorców korelacji w czasie.
Jeśli chcesz dowiedzieć się więcej na temat metodologii prognozowania w rozwiązaniu AutoML, zobacz Omówienie metod prognozowania w rozwiązaniu AutoML. Aby zapoznać się z przykładami trenowania modeli prognozowania w rozwiązaniu AutoML, zobacz Konfigurowanie rozwiązania AutoML do trenowania modelu prognozowania szeregów czasowych przy użyciu zestawu SDK i interfejsu wiersza polecenia.
Opóźnienie cechowania w rozwiązaniu AutoML
Rozwiązanie AutoML generuje funkcje opóźnień, które odpowiadają horyzontowi prognozy. W tej sekcji omówiono opóźnienie cechowania w rozwiązaniu AutoML dla modelu z horyzontem prognozy trzech i kolejności opóźnienia docelowego jednego. W poniższych tabelach przedstawiono dane modelu i funkcje opóźnień dla comiesięcznych szeregów czasowych.
Tabela 1. Oryginalna seria czasowa
Data | $y_t$ |
---|---|
1/1/2001 | 0 |
2/1/2001 | 10 |
3/1/2001 | 20 |
4/1/2001 | 30 |
5/1/2001 | 40 |
6/1/2001 | 50 |
Pierwszy krok generuje funkcję opóźnienia tylko dla horyzontu $h=1$. W kolejnych tabelach pokazano, dlaczego proces używa poszczególnych horyzontów do ukończenia cechowania opóźnienia.
Tabela 2. Opóźnienie cechowania dla horyzontu $h=1$
Data | $y_t$ | Pochodzenie | $y_{t-1}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 12/1/2000 | - | 1 |
2/1/2001 | 10 | 1/1/2001 | 0 | 1 |
3/1/2001 | 20 | 2/1/2001 | 10 | 1 |
4/1/2001 | 30 | 3/1/2001 | 20 | 1 |
5/1/2001 | 40 | 4/1/2001 | 30 | 1 |
6/1/2001 | 50 | 5/1/2001 | 40 | 1 |
Rozwiązanie AutoML generuje dane w tabeli 2 z danych w tabeli 1 przez przesunięcie kolumny $y_t$ w dół przez pojedynczą obserwację. Tabele od 2 do 5 zawierają kolumnę Origin , aby pokazać daty, z których pochodzą funkcje opóźnienia.
Następny krok generuje funkcję opóźnienia tylko dla horyzontu prognozy $h=2$.
Tabela 3. Opóźnienie cechowania dla horyzontu prognozy $h=2$
Data | $y_t$ | Pochodzenie | $y_{t-2}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 11/1/2000 | - | 2 |
2/1/2001 | 10 | 12/1/2000 | - | 2 |
3/1/2001 | 20 | 1/1/2001 | 0 | 2 |
4/1/2001 | 30 | 2/1/2001 | 10 | 2 |
5/1/2001 | 40 | 3/1/2001 | 20 | 2 |
6/1/2001 | 50 | 4/1/2001 | 30 | 2 |
Rozwiązanie AutoML generuje dane w tabeli 3 z danych w tabeli 1, przenosząc kolumnę $y_t$ w dół o dwie obserwacje.
Następny krok generuje funkcję opóźnienia tylko dla horyzontu prognozy $h=3$.
Tabela 4. Opóźnienie cechowania dla horyzontu prognozy $h=3$
Data | $y_t$ | Pochodzenie | $y_{t-3}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 10/1/2000 | - | 3 |
2/1/2001 | 10 | 11/1/2000 | - | 3 |
3/1/2001 | 20 | 12/1/2000 | - | 3 |
4/1/2001 | 30 | 1/1/2001 | 0 | 3 |
5/1/2001 | 40 | 2/1/2001 | 10 | 3 |
6/1/2001 | 50 | 3/1/2001 | 20 | 3 |
Ostatni krok łączy dane w tabelach 1, 2 i 3 oraz zmienia kolejność wierszy.
Tabela 5. Ukończenie cechowania
Data | $y_t$ | Pochodzenie | $y_{t-1}^{(h)}$ | $h$ |
---|---|---|---|---|
1/1/2001 | 0 | 12/1/2000 | - | 1 |
1/1/2001 | 0 | 11/1/2000 | - | 2 |
1/1/2001 | 0 | 10/1/2000 | - | 3 |
2/1/2001 | 10 | 1/1/2001 | 0 | 1 |
2/1/2001 | 10 | 12/1/2000 | - | 2 |
2/1/2001 | 10 | 11/1/2000 | - | 3 |
3/1/2001 | 20 | 2/1/2001 | 10 | 1 |
3/1/2001 | 20 | 1/1/2001 | 0 | 2 |
3/1/2001 | 20 | 12/1/2000 | - | 3 |
4/1/2001 | 30 | 3/1/2001 | 20 | 1 |
4/1/2001 | 30 | 2/1/2001 | 10 | 2 |
4/1/2001 | 30 | 1/1/2001 | 0 | 3 |
5/1/2001 | 40 | 4/1/2001 | 30 | 1 |
5/1/2001 | 40 | 3/1/2001 | 20 | 2 |
5/1/2001 | 40 | 2/1/2001 | 10 | 3 |
6/1/2001 | 50 | 4/1/2001 | 40 | 1 |
6/1/2001 | 50 | 4/1/2001 | 30 | 2 |
6/1/2001 | 50 | 3/1/2001 | 20 | 3 |
W tabeli 5 nazwa kolumny opóźnienie została zmieniona na $y_{t-1}^{(h)}$ w celu odzwierciedlenia, że opóźnienie jest generowane w odniesieniu do określonego horyzontu. Tabela 5 pokazuje, jak opóźnienia generowane w odniesieniu do horyzontu mogą być mapowane na konwencjonalne sposoby generowania opóźnień w poprzednich tabelach.
Tabela 5 jest przykładem rozszerzania danych stosowanego przez rozwiązanie AutoML do danych szkoleniowych w celu umożliwienia bezpośredniego prognozowania z modeli regresji. Gdy konfiguracja zawiera funkcje opóźnień, rozwiązanie AutoML tworzy opóźnienia zależne od horyzontu wraz z funkcją horyzontu o wartości całkowitej. Modele regresji prognozowania automatycznego uczenia maszynowego mogą przewidywać na horyzoncie $h$ bez względu na przewidywanie na poziomie $h-1$, w przeciwieństwie do rekursywnie zdefiniowanych modeli, takich jak ARIMA.
Zagadnienia dotyczące cech opóźnienia
Istnieje kilka zagadnień związanych z opóźnieniem cechowania modelu. Zapoznaj się z poniższymi sekcjami, aby zidentyfikować potencjalne akcje dla danego scenariusza.
Wzrost rozmiaru zestawu danych
Gdy rozwiązanie AutoML generuje funkcje opóźnienia zależnego od horyzontu, dodaje nowe wiersze do zestawu danych modelu. Liczba nowych wierszy jest proporcjonalna do horyzontu prognozy.
Wzrost rozmiaru zestawu danych może prowadzić do błędów braku pamięci w mniejszych węzłach obliczeniowych lub gdy rozmiar zestawu danych jest już duży. Rozwiązania tego problemu można znaleźć w artykule Często zadawane pytania dotyczące prognozowania automatycznego uczenia maszynowego.
Oddzielenie kolejności opóźnień i horyzontu prognozy
Strategia automatycznego uczenia maszynowego opóźnia kolejność opóźnień i horyzont prognozy. Załóżmy, że twój horyzont prognozy wynosi siedem i chcesz, aby rozwiązanie AutoML używało funkcji opóźnień. W tym scenariuszu nie trzeba ustawiać kolejności opóźnienia na siedem, aby zapewnić przewidywanie na pełnym horyzoncie prognozy. Ponieważ automl generuje opóźnienia w odniesieniu do horyzontu, można ustawić kolejność opóźnienia na jedną. Rozwiązanie AutoML rozszerza dane, dzięki czemu opóźnienia dowolnego zamówienia są prawidłowe do horyzontu prognozy.