Share via


Características de retardo para predecir series temporales en AutoML

Este artículo se centra en los métodos de AutoML para crear características de agregación de ventanas graduales y de retardo para predecir modelos de regresión. Las características como estas que usan información pasada pueden aumentar significativamente la precisión al ayudar al modelo a aprender patrones correlacionales en el tiempo. Consulte el artículo de información general sobre los métodos para obtener información general sobre la metodología de previsión en AutoML. Encontrará instrucciones y ejemplos para entrenar modelos de previsión en AutoML en nuestro artículo configuración de AutoML para la previsión de series temporales.

Ejemplo de característica de retardo

AutoML genera retardos con respecto al horizonte de previsión. En el ejemplo de esta sección se muestra este concepto. Aquí, usamos un horizonte de previsión de tres y un destino de orden de retardo de uno. Tenga en cuenta las siguientes series temporales mensuales:

Tabla 1: Serie temporal original

Date $y_t$
1/1/2001 0
1/2/2001 10
1/3/2001 20
1/4/2001 30
1/5/2001 40
1/6/2001 50

En primer lugar, generamos la característica de retardo para el horizonte $h=1$ solo. A medida que siga leyendo, quedará claro por qué usamos horizontes individuales en cada tabla.

Tabla 2: Caracterización de retardo para $h=1$

Date $y_t$ Origen $y_{t-1}$ $h$
1/1/2001 0 1/12/2000 - 1
1/2/2001 10 1/1/2001 0 1
1/3/2001 20 1/2/2001 10 1
1/4/2001 30 1/3/2001 20 1
1/5/2001 40 1/4/2001 30 1
1/6/2001 50 1/5/2001 40 1

La tabla 2 se genera a partir de la tabla 1 desplazando la columna $y_t$ hacia abajo por una sola observación. Hemos agregado una columna denominada Origin que tiene las fechas de las que se originan las características de retardo. A continuación, se genera la característica de retardo para el horizonte de previsión $h=2$ solo.

Tabla 3: Caracterización de retardo para $h=2$

Date $y_t$ Origen $y_{t-2}$ $h$
1/1/2001 0 1/11/2000 - 2
1/2/2001 10 1/12/2000 - 2
1/3/2001 20 1/1/2001 0 2
1/4/2001 30 1/2/2001 10 2
1/5/2001 40 1/3/2001 20 2
1/6/2001 50 1/4/2001 30 2

La tabla 3 se genera a partir de la tabla 1 desplazando la columna $y_t$ hacia abajo por dos observaciones. Por último, generaremos la característica de retardo para el horizonte de previsión $h=3$ solo.

Tabla 4: Caracterización de retardo para $h=3$

Date $y_t$ Origen $y_{t-3}$ $h$
1/1/2001 0 1/10/2000 - 3
1/2/2001 10 1/11/2000 - 3
1/3/2001 20 1/12/2000 - 3
1/4/2001 30 1/1/2001 0 3
1/5/2001 40 1/2/2001 10 3
1/6/2001 50 1/3/2001 20 3

A continuación, concatenamos las tablas 1, 2 y 3 y reorganizamos las filas. El resultado se muestra en la tabla siguiente:

Tabla 5: Caracterización de retardo completa

Date $y_t$ Origen $y_{t-1}^{(h)}$ $h$
1/1/2001 0 1/12/2000 - 1
1/1/2001 0 1/11/2000 - 2
1/1/2001 0 1/10/2000 - 3
1/2/2001 10 1/1/2001 0 1
1/2/2001 10 1/12/2000 - 2
1/2/2001 10 1/11/2000 - 3
1/3/2001 20 1/2/2001 10 1
1/3/2001 20 1/1/2001 0 2
1/3/2001 20 1/12/2000 - 3
1/4/2001 30 1/3/2001 20 1
1/4/2001 30 1/2/2001 10 2
1/4/2001 30 1/1/2001 0 3
1/5/2001 40 1/4/2001 30 1
1/5/2001 40 1/3/2001 20 2
1/5/2001 40 1/2/2001 10 3
1/6/2001 50 1/4/2001 40 1
1/6/2001 50 1/4/2001 30 2
1/6/2001 50 1/3/2001 20 3

En la tabla final, hemos cambiado el nombre de la columna de retardos a $y_{t-1}^{(h)}$ para reflejar que el retardo se genera con respecto a un horizonte específico. En la tabla se muestra que los retardos generados con respecto al horizonte se pueden asignar a las formas convencionales de generar retardos en las tablas anteriores.

La tabla 5 es un ejemplo del aumento de datos que AutoML aplica a los datos de entrenamiento para habilitar la previsión directa de los modelos de regresión. Cuando la configuración incluye características de retardo, AutoML crea retardos dependientes del horizonte junto con una característica de horizonte con valores enteros. Esto permite que los modelos de regresión de previsión de AutoML realicen una predicción en el horizonte $h$ sin tener en cuenta la predicción en $h-1$, a diferencia de los modelos definidos recursivamente como ARIMA.

Nota

La generación de características de retardo dependientes del horizonte agrega nuevas filas al conjunto de datos. El número de filas nuevas es proporcional al horizonte de previsión. Este aumento del tamaño del conjunto de datos puede provocar errores de memoria insuficiente en nodos de proceso más pequeños o cuando el tamaño del conjunto de datos ya es grande. Consulte el artículo de preguntas más frecuentes para ver las soluciones a este problema.

Otra consecuencia de esta estrategia de retardo es que el orden de retardo y el horizonte de previsión están desacoplados. Si, por ejemplo, el horizonte de previsión es siete y quiere que AutoML use características de retardo, no tiene que establecer el orden de retardo en siete para garantizar la predicción en un horizonte de previsión completo. Dado que AutoML genera retardos con respecto al horizonte, puede establecer el orden de retardo en uno y AutoML aumentará los datos para que los retardos de cualquier orden sean válidos hasta el horizonte de previsión.

Pasos siguientes