Fördröjda funktioner för tidsserieprognoser i AutoML

Den här artikeln fokuserar på AutoML:s metoder för att skapa aggregeringsfunktioner för fördröjning och rullande fönster för prognostisering av regressionsmodeller. Funktioner som dessa som använder tidigare information kan avsevärt öka noggrannheten genom att hjälpa modellen att lära sig korrelationsmönster i tid. Se översiktsartikeln om metoder för allmän information om prognostiseringsmetodik i AutoML. Instruktioner och exempel för modeller för träningsprognoser i AutoML finns i vår artikel om att konfigurera AutoML för prognostisering av tidsserier .

Exempel på fördröjningsfunktion

AutoML genererar fördröjningar med avseende på prognoshorisonten. Exemplet i det här avsnittet illustrerar det här konceptet. Här använder vi en prognoshorisont på tre och målfördröjningsordningen på en. Tänk på följande månatliga tidsserier:

Tabell 1: Ursprunglig tidsserie

Date $y_t$
1/1/2001 0
2/1/2001 10
3/1/2001 20
4/1/2001 30
5/1/2001 40
6/1/2001 50

Först genererar vi fördröjningsfunktionen endast för horisonten $h=1$. När du fortsätter att läsa blir det tydligt varför vi använder enskilda horisonter i varje tabell.

Tabell 2: Fördröj funktionalisering för $h=1$

Date $y_t$ Ursprung $y_{t-1}$ $h$
1/1/2001 0 12/1/2000 - 1
2/1/2001 10 1/1/2001 0 1
3/1/2001 20 2/1/2001 10 1
4/1/2001 30 3/1/2001 20 1
5/1/2001 40 4/1/2001 30 1
6/1/2001 50 5/1/2001 40 1

Tabell 2 genereras från tabell 1 genom att flytta kolumnen $y_t$ nedåt med en enda observation. Vi har lagt till en kolumn med namnet Origin som har de datum som fördröjningsfunktionerna kommer från. Därefter genererar vi den släpande funktionen för prognoshorisonten $h=2$ endast.

Tabell 3: Fördröj funktionalisering för $h=2$

Date $y_t$ Ursprung $y_{t-2}$ $h$
1/1/2001 0 11/1/2000 - 2
2/1/2001 10 12/1/2000 - 2
3/1/2001 20 1/1/2001 0 2
4/1/2001 30 2/1/2001 10 2
5/1/2001 40 3/1/2001 20 2
6/1/2001 50 4/1/2001 30 2

Tabell 3 genereras från tabell 1 genom att flytta kolumnen $y_t$ nedåt med två observationer. Slutligen genererar vi den släpande funktionen för prognoshorisonten endast $h=3$.

Tabell 4: Fördröj funktionalisering för $h=3$

Date $y_t$ Ursprung $y_{t-3}$ $h$
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 3/1/2001 20 3

Därefter sammanfogar vi tabellerna 1, 2 och 3 och ordnar om raderna. Resultatet finns i följande tabell:

Tabell 5: Fördröjning slutförd

Date $y_t$ Ursprung $y_{t-1}^{(h)}$ $h$
1/1/2001 0 12/1/2000 - 1
1/1/2001 0 11/1/2000 - 2
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 1/1/2001 0 1
2/1/2001 10 12/1/2000 - 2
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 2/1/2001 10 1
3/1/2001 20 1/1/2001 0 2
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 3/1/2001 20 1
4/1/2001 30 2/1/2001 10 2
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 4/1/2001 30 1
5/1/2001 40 3/1/2001 20 2
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 4/1/2001 40 1
6/1/2001 50 4/1/2001 30 2
6/1/2001 50 3/1/2001 20 3

I den sista tabellen har vi ändrat namnet på fördröjningskolumnen till $y_{t-1}^{(h)}$ så att den återspeglar att fördröjningen genereras med avseende på en specifik horisont. Tabellen visar att de fördröjningar som vi genererade med avseende på horisonten kan mappas till konventionella sätt att generera fördröjningar i föregående tabeller.

Tabell 5 är ett exempel på den dataförstärkning som AutoML använder för träningsdata för att möjliggöra direkt prognostisering från regressionsmodeller. När konfigurationen innehåller fördröjningsfunktioner skapar AutoML horisontberoende fördröjningar tillsammans med en heltalsvärdeshorisontfunktion. Detta gör det möjligt för AutoML:s prognostiserade regressionsmodeller att göra en förutsägelse vid horisont $h$ utan hänsyn till förutsägelsen vid $h-1$, till skillnad från rekursivt definierade modeller som ARIMA.

Anteckning

Generering av horisontberoende fördröjningsfunktioner lägger till nya rader i datauppsättningen. Antalet nya rader är proportionellt mot prognoshorisonten. Den här datamängdens storlekstillväxt kan leda till minnesfel på mindre beräkningsnoder eller när datauppsättningens storlek redan är stor. I artikeln med vanliga frågor och svar finns lösningar på det här problemet.

En annan konsekvens av denna eftersläpande strategi är att fördröjningsordningen och prognoshorisonten är frikopplade. Om prognoshorisonten till exempel är sju och du vill att AutoML ska använda fördröjningsfunktioner behöver du inte ange fördröjningsordningen till sju för att säkerställa förutsägelse över en fullständig prognoshorisont. Eftersom AutoML genererar fördröjningar med avseende på horisont kan du ange fördröjningsordningen till en och AutoML utökar data så att fördröjningar i valfri ordning är giltiga upp till prognoshorisonten.

Nästa steg