Dela via


Fördröj funktioner för tidsserieprognoser i AutoML

Den här artikeln beskriver hur automatiserad maskininlärning (AutoML) i Azure Machine Learning skapar aggregeringsfunktioner för fördröjning och rullande fönster som hjälper dig att prognostisera regressionsmodeller för tidsserier. AutoML-funktionerna använder historiska modelldata som avsevärt kan öka modellens noggrannhet genom att hjälpa modellen att lära sig korrelationsmönster i tid.

Om du är intresserad av att lära dig mer om prognosmetoden i AutoML kan du läsa Översikt över prognosmetoder i AutoML. Information om hur du utforskar träningsexempel för prognosmodeller i AutoML finns i Konfigurera AutoML för att träna en prognosmodell för tidsserier med SDK och CLI.

Fördröj funktionalisering i AutoML

AutoML genererar fördröjningsfunktioner som motsvarar prognoshorisonten. Det här avsnittet utforskar fördröjning i AutoML för en modell med en prognoshorisont på tre och målfördröjningsordningen på en. Följande tabeller visar modelldata och fördröjningsfunktioner för en månatlig tidsserie.

Tabell 1: Ursprunglig tidsserie

Datum $y_t$
1/1/2001 0
2/1/2001 10
3/1/2001 20
4/1/2001 30
5/1/2001 40
6/1/2001 50

Det första steget genererar fördröjningsfunktionen för horisonten $h=1$ endast. De efterföljande tabellerna visar varför processen använder enskilda horisonter för att slutföra fördröjningen.

Tabell 2: Fördröjning för horisont $h=1$

Datum $y_t$ Ursprung $y_{t-1}$ $h$
1/1/2001 0 12/1/2000 - 1
2/1/2001 10 1/1/2001 0 1
3/1/2001 20 2/1/2001 10 1
4/1/2001 30 3/1/2001 20 1
5/1/2001 40 4/1/2001 30 1
6/1/2001 50 5/1/2001 40 1

AutoML genererar data i tabell 2 från data i tabell 1 genom att flytta kolumnen $y_t$ nedåt med en enda observation. Tabellerna 2 till och med 5 innehåller kolumnen Ursprung för att visa datum från vilka fördröjningsfunktionerna kommer.

Nästa steg genererar fördröjningsfunktionen för prognoshorisonten $h=2$ endast.

Tabell 3: Fördröjning för prognoshorisonten $h=2$

Datum $y_t$ Ursprung $y_{t-2}$ $h$
1/1/2001 0 11/1/2000 - 2
2/1/2001 10 12/1/2000 - 2
3/1/2001 20 1/1/2001 0 2
4/1/2001 30 2/1/2001 10 2
5/1/2001 40 3/1/2001 20 2
6/1/2001 50 4/1/2001 30 2

AutoML genererar data i tabell 3 från data i tabell 1 genom att flytta kolumnen $y_t$ nedåt med två observationer.

Nästa steg genererar fördröjningsfunktionen för prognoshorisonten $h=3$ endast.

Tabell 4: Fördröjning för prognoshorisonten $h=3$

Datum $y_t$ Ursprung $y_{t-3}$ $h$
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 3/1/2001 20 3

Det sista steget sammanfogar data i tabellerna 1, 2 och 3 och ordnar om raderna.

Tabell 5: Fördröjning av funktionalisering slutförd

Datum $y_t$ Ursprung $y_{t-1}^{(h)}$ $h$
1/1/2001 0 12/1/2000 - 1
1/1/2001 0 11/1/2000 - 2
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 1/1/2001 0 1
2/1/2001 10 12/1/2000 - 2
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 2/1/2001 10 1
3/1/2001 20 1/1/2001 0 2
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 3/1/2001 20 1
4/1/2001 30 2/1/2001 10 2
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 4/1/2001 30 1
5/1/2001 40 3/1/2001 20 2
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 4/1/2001 40 1
6/1/2001 50 4/1/2001 30 2
6/1/2001 50 3/1/2001 20 3

I tabell 5 ändras fördröjningskolumnen till $y_{t-1}^{(h)}$ för att återspegla att fördröjningen genereras med avseende på en specifik horisont. Tabell 5 visar hur fördröjningar som genereras med avseende på horisonten kan mappas till de konventionella sätten att generera fördröjningar i föregående tabeller.

Tabell 5 är ett exempel på den dataförstoring som AutoML använder för träningsdata för att möjliggöra direkt prognostisering från regressionsmodeller. När konfigurationen innehåller fördröjningsfunktioner skapar AutoML horisontberoende fördröjningar tillsammans med en heltalsvärdeshorisontfunktion. AutoML-prognostiseringsregressionsmodeller kan göra en förutsägelse vid horisont $h$ utan hänsyn till förutsägelsen vid $h-1$, till skillnad från rekursivt definierade modeller som ARIMA.

Överväganden för fördröjning

Det finns några överväganden som rör fördröjning av funktionalisering för en modell. Granska följande avsnitt för att identifiera potentiella åtgärder för ditt scenario.

Datamängdsstorlekstillväxt

När AutoML genererar horisontberoende fördröjningsfunktioner läggs nya rader till i modelldatauppsättningen. Antalet nya rader är proportionellt mot prognoshorisonten.

Ökningen av datamängdsstorleken kan leda till minnesfel på mindre beräkningsnoder eller när datamängdens storlek redan är stor. Du hittar lösningar för att lösa det här problemet i vanliga frågor och svar för AutoML-prognostisering.

Avkoppling av fördröjningsordning och prognoshorisont

Den autoML-eftersläpande strategin frikopplar fördröjningsordningen och prognoshorisonten. Anta att prognoshorisonten är sju och du vill att AutoML ska använda fördröjningsfunktioner. I det här scenariot behöver du inte ange fördröjningsordningen till sju för att säkerställa förutsägelse över en fullständig prognoshorisont. Eftersom AutoML genererar fördröjningar med avseende på horisont kan du ange fördröjningsordningen till en. AutoML utökar data så att fördröjningar i valfri ordning är giltiga fram till prognoshorisonten.