Funkcje opóźnień prognozowania szeregów czasowych w rozwiązaniu AutoML

Artykuł
10/02/2024

W tym artykule opisano, jak zautomatyzowane uczenie maszynowe (AutoML) w usłudze Azure Machine Learning tworzy funkcje agregacji opóźnień i okien krocznych, które ułatwiają prognozowanie modeli regresji szeregów czasowych. Funkcje rozwiązania AutoML używają historycznych danych modelu, które mogą znacznie zwiększyć dokładność modelu, pomagając modelowi uczyć się wzorców korelacji w czasie.

Jeśli chcesz dowiedzieć się więcej na temat metodologii prognozowania w rozwiązaniu AutoML, zobacz Omówienie metod prognozowania w rozwiązaniu AutoML. Aby zapoznać się z przykładami trenowania modeli prognozowania w rozwiązaniu AutoML, zobacz Konfigurowanie rozwiązania AutoML do trenowania modelu prognozowania szeregów czasowych przy użyciu zestawu SDK i interfejsu wiersza polecenia.

Opóźnienie cechowania w rozwiązaniu AutoML

Rozwiązanie AutoML generuje funkcje opóźnień, które odpowiadają horyzontowi prognozy. W tej sekcji omówiono opóźnienie cechowania w rozwiązaniu AutoML dla modelu z horyzontem prognozy trzech i kolejności opóźnienia docelowego jednego. W poniższych tabelach przedstawiono dane modelu i funkcje opóźnień dla comiesięcznych szeregów czasowych.

Tabela 1. Oryginalna seria czasowa

Data	$y_t$
1/1/2001	0
2/1/2001	10
3/1/2001	20
4/1/2001	30
5/1/2001	40
6/1/2001	50

Pierwszy krok generuje funkcję opóźnienia tylko dla horyzontu $h=1$. W kolejnych tabelach pokazano, dlaczego proces używa poszczególnych horyzontów do ukończenia cechowania opóźnienia.

Tabela 2. Opóźnienie cechowania dla horyzontu $h=1$

Data	$y_t$	Pochodzenie	$y_{t-1}$	$h$
1/1/2001	0	12/1/2000	-	1
2/1/2001	10	1/1/2001	0	1
3/1/2001	20	2/1/2001	10	1
4/1/2001	30	3/1/2001	20	1
5/1/2001	40	4/1/2001	30	1
6/1/2001	50	5/1/2001	40	1

Rozwiązanie AutoML generuje dane w tabeli 2 z danych w tabeli 1 przez przesunięcie kolumny $y_t$ w dół przez pojedynczą obserwację. Tabele od 2 do 5 zawierają kolumnę Origin , aby pokazać daty, z których pochodzą funkcje opóźnienia.

Następny krok generuje funkcję opóźnienia tylko dla horyzontu prognozy $h=2$.

Tabela 3. Opóźnienie cechowania dla horyzontu prognozy $h=2$

Data	$y_t$	Pochodzenie	$y_{t-2}$	$h$
1/1/2001	0	11/1/2000	-	2
2/1/2001	10	12/1/2000	-	2
3/1/2001	20	1/1/2001	0	2
4/1/2001	30	2/1/2001	10	2
5/1/2001	40	3/1/2001	20	2
6/1/2001	50	4/1/2001	30	2

Rozwiązanie AutoML generuje dane w tabeli 3 z danych w tabeli 1, przenosząc kolumnę $y_t$ w dół o dwie obserwacje.

Następny krok generuje funkcję opóźnienia tylko dla horyzontu prognozy $h=3$.

Tabela 4. Opóźnienie cechowania dla horyzontu prognozy $h=3$

Data	$y_t$	Pochodzenie	$y_{t-3}$	$h$
1/1/2001	0	10/1/2000	-	3
2/1/2001	10	11/1/2000	-	3
3/1/2001	20	12/1/2000	-	3
4/1/2001	30	1/1/2001	0	3
5/1/2001	40	2/1/2001	10	3
6/1/2001	50	3/1/2001	20	3

Ostatni krok łączy dane w tabelach 1, 2 i 3 oraz zmienia kolejność wierszy.

Tabela 5. Ukończenie cechowania

Data	$y_t$	Pochodzenie	$y_{t-1}^{(h)}$	$h$
1/1/2001	0	12/1/2000	-	1
1/1/2001	0	11/1/2000	-	2
1/1/2001	0	10/1/2000	-	3
2/1/2001	10	1/1/2001	0	1
2/1/2001	10	12/1/2000	-	2
2/1/2001	10	11/1/2000	-	3
3/1/2001	20	2/1/2001	10	1
3/1/2001	20	1/1/2001	0	2
3/1/2001	20	12/1/2000	-	3
4/1/2001	30	3/1/2001	20	1
4/1/2001	30	2/1/2001	10	2
4/1/2001	30	1/1/2001	0	3
5/1/2001	40	4/1/2001	30	1
5/1/2001	40	3/1/2001	20	2
5/1/2001	40	2/1/2001	10	3
6/1/2001	50	4/1/2001	40	1
6/1/2001	50	4/1/2001	30	2
6/1/2001	50	3/1/2001	20	3

W tabeli 5 nazwa kolumny opóźnienie została zmieniona na $y_{t-1}^{(h)}$ w celu odzwierciedlenia, że opóźnienie jest generowane w odniesieniu do określonego horyzontu. Tabela 5 pokazuje, jak opóźnienia generowane w odniesieniu do horyzontu mogą być mapowane na konwencjonalne sposoby generowania opóźnień w poprzednich tabelach.

Tabela 5 jest przykładem rozszerzania danych stosowanego przez rozwiązanie AutoML do danych szkoleniowych w celu umożliwienia bezpośredniego prognozowania z modeli regresji. Gdy konfiguracja zawiera funkcje opóźnień, rozwiązanie AutoML tworzy opóźnienia zależne od horyzontu wraz z funkcją horyzontu o wartości całkowitej. Modele regresji prognozowania automatycznego uczenia maszynowego mogą przewidywać na horyzoncie $h$ bez względu na przewidywanie na poziomie $h-1$, w przeciwieństwie do rekursywnie zdefiniowanych modeli, takich jak ARIMA.

Zagadnienia dotyczące cech opóźnienia

Istnieje kilka zagadnień związanych z opóźnieniem cechowania modelu. Zapoznaj się z poniższymi sekcjami, aby zidentyfikować potencjalne akcje dla danego scenariusza.

Wzrost rozmiaru zestawu danych

Gdy rozwiązanie AutoML generuje funkcje opóźnienia zależnego od horyzontu, dodaje nowe wiersze do zestawu danych modelu. Liczba nowych wierszy jest proporcjonalna do horyzontu prognozy.

Wzrost rozmiaru zestawu danych może prowadzić do błędów braku pamięci w mniejszych węzłach obliczeniowych lub gdy rozmiar zestawu danych jest już duży. Rozwiązania tego problemu można znaleźć w artykule Często zadawane pytania dotyczące prognozowania automatycznego uczenia maszynowego.

Oddzielenie kolejności opóźnień i horyzontu prognozy

Strategia automatycznego uczenia maszynowego opóźnia kolejność opóźnień i horyzont prognozy. Załóżmy, że twój horyzont prognozy wynosi siedem i chcesz, aby rozwiązanie AutoML używało funkcji opóźnień. W tym scenariuszu nie trzeba ustawiać kolejności opóźnienia na siedem, aby zapewnić przewidywanie na pełnym horyzoncie prognozy. Ponieważ automl generuje opóźnienia w odniesieniu do horyzontu, można ustawić kolejność opóźnienia na jedną. Rozwiązanie AutoML rozszerza dane, dzięki czemu opóźnienia dowolnego zamówienia są prawidłowe do horyzontu prognozy.

Udostępnij za pośrednictwem

Funkcje opóźnień prognozowania szeregów czasowych w rozwiązaniu AutoML

Opóźnienie cechowania w rozwiązaniu AutoML

Zagadnienia dotyczące cech opóźnienia

Wzrost rozmiaru zestawu danych

Oddzielenie kolejności opóźnień i horyzontu prognozy

Opinia

Dodatkowe zasoby

Udostępnij za pośrednictwem

Funkcje opóźnień prognozowania szeregów czasowych w rozwiązaniu AutoML

Opóźnienie cechowania w rozwiązaniu AutoML

Zagadnienia dotyczące cech opóźnienia

Wzrost rozmiaru zestawu danych

Oddzielenie kolejności opóźnień i horyzontu prognozy

Powiązana zawartość

Opinia

Dodatkowe zasoby