Personalizar y procesar el modelo de pronóstico (tutorial intermedio de minería de datos)
El algoritmo de serie temporal de Microsoft proporciona varios parámetros que afectan al modo de creación de un modelo y al modo en que se analizan los datos temporales. Cambiar estas propiedades puede afectar de forma significativa a la manera en que el modelo de minería de datos realiza las predicciones.
Para esta tarea del tutorial, modificará el modelo mediante las tareas siguientes:
Personalizará la manera en que el modelo controla los períodos de tiempo agregando un nuevo valor para el parámetro PERIODICITY_HINT.
Aprenderá otros dos parámetros importantes para el algoritmo de serie temporal de Microsoft: FORECAST_METHOD, que le permite controlar el método usado para la predicción, y PREDICTION_SMOOTHING, que permite personalizar la combinación de predicciones a largo plazo y a corto plazo.
Opcionalmente, indicará al algoritmo cómo desea que se imputen los valores ausentes.
Una vez realizados todos los cambios, implementará y procesará el modelo.
Establecer los parámetros de serie temporal
Sugerencias de periodicidad
El parámetro PERIODICITY_HINT proporciona al algoritmo información sobre los períodos de tiempo adicionales que se espera ver en los datos. De forma predeterminada, los modelos de serie temporal intentarán detectar automáticamente un patrón en los datos. Sin embargo, si ya conoce el período de tiempo esperado, proporcionar una sugerencia de periodicidad podría mejorar la exactitud del modelo. Sin embargo, si proporciona una sugerencia de periodicidad errónea, puede reducir la exactitud; por consiguiente, si no está seguro del valor que debe utilizarse, es mejor usar el valor predeterminado.
Por ejemplo, la vista utilizada para este modelo agrega datos de ventas mensuales de Adventure Works DW Multidimensional 2012 . Por consiguiente, cada segmento de tiempo utilizado en el modelo representa un mes y todas las predicciones también estarán en términos de meses. Dado que hay 12 meses en un año y prevé que los patrones de ventas se repetirán más o menos cada año, debe establecer el parámetro PERIODICITY_HINT en 12, para indicar que 12 segmentos de tiempo (meses) constituyen un ciclo completo de ventas.
Método de pronóstico
El parámetro FORECAST_METHOD controla si el algoritmo de serie temporal está optimizado para las predicciones a corto o a largo plazo. De forma predeterminada, el parámetro FORECAST_METHOD está establecido en MIXED, lo que significa que se combinan y equilibran dos algoritmos de predicción diferentes para ofrecer resultados correctos en las predicciones a corto y a largo plazo.
No obstante, si sabe que debe usar un algoritmo concreto, puede cambiar el valor a ARIMA o ARTXP.
Ponderar predicciones a largo plazo y a corto plazo
También puede personalizar el modo en que las predicciones a largo plazo y a corto plazo se combinan mediante el parámetro PREDICTION_SMOOTHING. De forma predeterminada, este parámetro está establecido en 0,5, lo que generalmente proporciona el mayor equilibrio para conseguir la máxima precisión.
Para cambiar los parámetros del algoritmo
En la pestaña Modelos de minería de datos, haga clic con el botón secundario en Pronóstico y seleccione Establecer parámetros de algoritmo.
En la fila PERIODICITY_HINT del cuadro de diálogo Parámetros de algoritmo, haga clic en la columna Valor y, a continuación, escriba {12}, incluidas las llaves.
De forma predeterminada, el algoritmo también agregará el valor {1}.
En la fila FORECAST_METHOD, compruebe que el cuadro de texto Valor está en blanco o contiene el valor MIXED. Si se ha especificado un valor diferente, escriba MIXED para volver a establecer el parámetro en el valor predeterminado.
En la fila PREDICTION_SMOOTHING, compruebe que el cuadro de texto Valor esté en blanco o establecido en 0.5. Si se ha especificado un valor diferente, haga clic en Valor y escriba 0.5 para volver a establecer el parámetro en el valor predeterminado.
[!NOTA]
El parámetro PREDICTION_SMOOTHING solo está disponible en SQL Server Enterprise. Por consiguiente, en SQL Server Standard no puede ver ni cambiar el valor del parámetro PREDICTION_SMOOTHING. Sin embargo, el comportamiento predeterminado es utilizar los dos algoritmos y ponderarlos de forma equitativa.
Haga clic en Aceptar.
Manejar la ausencia de datos (opcional)
En muchos casos, los datos de ventas podrían tener huecos que se rellenan con caracteres nulos, o es posible que un almacén no haya podido cumplir la fecha tope de notificación, con lo que se ha dejado una celda vacía al final de la serie. En estos escenarios, Analysis Services genera el error siguiente y no procesa el modelo.
"Error (minería de datos): marcas de tiempo no sincronizadas que empiezan con la serie <nombre de serie> del modelo de minería de datos <nombre del modelo>. Todas las series temporales deben terminar en la misma marca de tiempo y no pueden tener puntos de datos ausentes arbitrarios. Cuando el valor del parámetro MISSING_VALUE_SUBSTITUTION es Previous o una constante numérica, se revisarán automáticamente los puntos de datos ausentes siempre que sea posible."
Para evitar este error, puede especificar que Analysis Services proporcione automáticamente los valores nuevos para rellenar los huecos utilizando uno de los métodos siguientes:
Utilizar un valor promedio. El promedio se calcula utilizando todos los valores válidos en la misma serie de datos.
Utilizar el valor anterior. Puede sustituir los valores anteriores para varias celdas que falten, pero no puede rellenar los valores de iniciales.
Utilizar un valor constante que proporcione el usuario.
Para especificar que los huecos se rellenen calculando el promedio de los valores
En la pestaña Modelos de minería de datos, haga clic con el botón secundario en la columna Forecasting y seleccione Establecer parámetros de algoritmo.
En el cuadro de diálogo Parámetros de algoritmo, en la fila MISSING_VALUE_SUBSTITUTION, haga clic en la columna Valor y escriba Promedio.
Generar el modelo
Para usar el modelo, debe implementarlo en un servidor y procesarlo ejecutando los datos de aprendizaje a través del algoritmo.
Para procesar el modelo de pronóstico
En el menú Modelo de minería de datos de SQL Server Data Tools, seleccione Procesar estructura de minería de datos y todos los modelos.
En la advertencia en la que se pregunta si desea generar e implementar el proyecto, haga clic en Sí.
En el cuadro de diálogo Procesar estructura de minería de datos - Pronóstico, haga clic en Ejecutar.
Se abre el cuadro de diálogo Progreso del proceso para mostrar información acerca del procesamiento del modelo. El procesamiento del modelo puede tardar algún tiempo.
Cuando se complete el proceso, haga clic en Cerrar para salir del cuadro de diálogo Progreso del proceso.
Haga clic de nuevo en Cerrar para salir del cuadro de diálogo Procesar estructura de minería de datos - Pronóstico.
Siguiente tarea de la lección
Explorar el modelo de previsión (tutorial intermedio de minería de datos)
Vea también
Referencia
Referencia técnica del algoritmo de serie temporal de Microsoft
Conceptos
Algoritmo de serie temporal de Microsoft
Requisitos y consideraciones de procesamiento (minería de datos)