Funcionalidades atrasadas para a previsão de série temporal no AutoML

Este artigo centra-se nos métodos do AutoML para criar funcionalidades de agregação de atraso e janela temporal para a previsão de modelos de regressão. Funcionalidades como estas que utilizam informações anteriores podem aumentar significativamente a precisão ao ajudar o modelo a aprender padrões correlacionais no tempo. Veja o artigo de descrição geral dos métodos para obter informações gerais sobre a metodologia de previsão no AutoML. Pode encontrar instruções e exemplos para preparar modelos de previsão no AutoML no nosso artigo configurar a AutoML para previsão de série temporal .

Exemplo de funcionalidade de atraso

O AutoML gera atrasos no que diz respeito ao horizonte de previsão. O exemplo nesta secção ilustra este conceito. Aqui, utilizamos um horizonte de previsão de três e uma ordem de atraso de destino de um. Considere as seguintes séries de tempo mensais:

Tabela 1: Série temporal original

Date $y_t$
1/1/2001 0
2/1/2001 10
3/1/2001 20
4/1/2001 30
5/1/2001 40
6/1/2001 50

Em primeiro lugar, geramos a funcionalidade de atraso apenas para o horizonte $h=1$. À medida que continua a ler, ficará claro por que razão utilizamos horizontes individuais em cada tabela.

Tabela 2: Caracterização de atraso para $h=1$

Date $y_t$ Origem $y_{t-1}$ $h$
1/1/2001 0 12/1/2000 - 1
2/1/2001 10 1/1/2001 0 1
3/1/2001 20 2/1/2001 10 1
4/1/2001 30 3/1/2001 20 1
5/1/2001 40 4/1/2001 30 1
6/1/2001 50 5/1/2001 40 1

A Tabela 2 é gerada a partir da Tabela 1 ao deslocar a coluna $y_t$ para baixo por uma única observação. Adicionámos uma coluna com o nome Origin que tem as datas de origem das funcionalidades de atraso. Em seguida, geramos a funcionalidade de atraso apenas para o horizonte de previsão $h=2$.

Tabela 3: Caracterização de atraso para $h=2$

Date $y_t$ Origem $y_{t-2}$ $h$
1/1/2001 0 11/1/2000 - 2
2/1/2001 10 12/1/2000 - 2
3/1/2001 20 1/1/2001 0 2
4/1/2001 30 2/1/2001 10 2
5/1/2001 40 3/1/2001 20 2
6/1/2001 50 4/1/2001 30 2

A Tabela 3 é gerada a partir da Tabela 1 ao deslocar a coluna $y_t$ para baixo por duas observações. Por fim, iremos gerar a funcionalidade de atraso apenas para o horizonte de previsão $h=3$.

Tabela 4: Desfasamento da caracterização para $h=3$

Date $y_t$ Origem $y_{t-3}$ $h$
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 3/1/2001 20 3

Em seguida, concatenamos as Tabelas 1, 2 e 3 e reorganizamos as linhas. O resultado encontra-se na seguinte tabela:

Tabela 5: A caracterização do atraso está concluída

Date $y_t$ Origem $y_{t-1}^{(h)}$ $h$
1/1/2001 0 12/1/2000 - 1
1/1/2001 0 11/1/2000 - 2
1/1/2001 0 10/1/2000 - 3
2/1/2001 10 1/1/2001 0 1
2/1/2001 10 12/1/2000 - 2
2/1/2001 10 11/1/2000 - 3
3/1/2001 20 2/1/2001 10 1
3/1/2001 20 1/1/2001 0 2
3/1/2001 20 12/1/2000 - 3
4/1/2001 30 3/1/2001 20 1
4/1/2001 30 2/1/2001 10 2
4/1/2001 30 1/1/2001 0 3
5/1/2001 40 4/1/2001 30 1
5/1/2001 40 3/1/2001 20 2
5/1/2001 40 2/1/2001 10 3
6/1/2001 50 4/1/2001 40 1
6/1/2001 50 4/1/2001 30 2
6/1/2001 50 3/1/2001 20 3

Na tabela final, alterámos o nome da coluna lag para $y_{t-1}^{(h)}$ para refletir que o atraso é gerado relativamente a um horizonte específico. A tabela mostra que os atrasos gerados relativamente ao horizonte podem ser mapeados para as formas convencionais de gerar atrasos nas tabelas anteriores.

A Tabela 5 é um exemplo do aumento de dados que o AutoML aplica aos dados de preparação para ativar a previsão direta a partir de modelos de regressão. Quando a configuração inclui funcionalidades de desfasamento, o AutoML cria atrasos dependentes do horizonte juntamente com uma funcionalidade de horizonte com valor inteiro. Isto permite que os modelos de regressão de previsão da AutoML façam uma predição no horizonte $h$ sem ter em conta a predição em $h-1$, em contraste com modelos definidos recursivamente como o ARIMA.

Nota

As funcionalidades de desfasamento dependente da geração de horizonte adicionam novas linhas ao conjunto de dados. O número de novas linhas é proporcional ao horizonte de previsão. Este crescimento do tamanho do conjunto de dados pode levar a erros de memória insuficiente em nós de computação mais pequenos ou quando o tamanho do conjunto de dados já é grande. Veja o artigo perguntas mais frequentes sobre soluções para este problema.

Outra consequência desta estratégia atrasada é que a ordem de atraso e o horizonte de previsão são dissociados. Se, por exemplo, o horizonte de previsão for sete e quiser que a AutoML utilize funcionalidades de atraso, não tem de definir a ordem de atraso para sete para garantir a predição num horizonte de previsão completo. Uma vez que o AutoML gera atrasos em relação ao horizonte, pode definir a ordem de atraso para um e o AutoML irá aumentar os dados para que os atrasos de qualquer encomenda sejam válidos até ao horizonte de previsão.

Passos seguintes