Condividi tramite


Personalizzazione ed elaborazione del modello di previsione (Esercitazione intermedia sul data mining)

L'algoritmo Microsoft Time Series fornisce parametri che influiscono sulle modalità di creazione di un modello e di analisi dei dati temporali. La modifica di queste proprietà può influire in modo significativo sul modo in cui il modello di data mining esegue le stime.

In questa attività dell'esercitazione si modificherà il modello nel modo seguente:

  1. Si personalizzerà il modo in cui il modello gestisce i periodi di tempo aggiungendo un nuovo valore per il parametro PERIODICITY_HINT.

  2. Si conosceranno altri due importanti parametri per l'algoritmo Microsoft Time Series: FORECAST_METHOD che consente di controllare il metodo utilizzato per la previsione e PREDICTION_SMOOTHING che consente di personalizzare la combinazione di stime a lungo e breve termine.

  3. Facoltativamente, si indicherà in che modo si desidera che l'algoritmo attribuisca i valori mancanti.

  4. Dopo avere apportato tutte le modifiche, si procederà alla distribuzione e all'elaborazione del modello.

Impostazione dei parametri di Time Series

Hint di periodicità

Il parametro PERIODICITY_HINT fornisce all'algoritmo informazioni sui periodi di tempo aggiuntivi previsti nei dati. Per impostazione predefinita, i modelli Time Series tenteranno di rilevare automaticamente un modello nei dati. Se tuttavia si conosce già il ciclo temporale previsto, l'indicazione di un hint di periodicità può migliorare potenzialmente l'accuratezza del modello. Se si fornisce tuttavia l'hint di periodicità errato, l'accuratezza può diminuire. Di conseguenza, in caso di dubbi sul valore da utilizzare, è preferibile utilizzare il valore predefinito.

Ad esempio, la vista utilizzata per questo modello aggrega dati di vendita da Adventure Works DW Multidimensional 2012 su base mensile. Ogni intervallo di tempo utilizzato dal modello rappresenta pertanto un mese e tutte le stime saranno anch'esse indicate in termini di mesi. Poiché in un anno ci sono 12 mesi e si prevede che i modelli delle vendite si ripetano più o meno su base annuale, si imposterà il parametro PERIODICITY_HINT su 12, per indicare che 12 intervalli di tempo (mesi) costituiscono un ciclo di vendite completo.

Metodo di previsione

Il parametro FORECAST_METHOD controlla se l'algoritmo Time Series è ottimizzato per le stime a breve o a lungo termine. Per impostazione predefinita, il parametro FORECAST_METHOD è impostato su MIXED e ciò indica che due diversi algoritmi vengono combinati per fornire risultati ottimali per una stima sia a breve che a lungo termine.

Se tuttavia si desidera utilizzare un algoritmo particolare, è possibile modificare il valore in ARIMA o ARTXP.

Ponderazione tra stime a lungo termine rispetto a stime a breve termine

È inoltre possibile personalizzare la modalità di combinazione delle stime a lungo e a breve termine tramite il parametro PREDICTION_SMOOTHING. Per impostazione predefinita, questo parametro è impostato su 0,5, che generalmente fornisce il miglior bilanciamento per l'accuratezza complessiva.

Per modificare i parametri dell'algoritmo

  1. Nella scheda Modelli di data mining fare clic con il pulsante destro del mouse su Forecasting e scegliere Imposta parametri algoritmo.

  2. Nella riga PERIODICITY_HINT della finestra di dialogo Parametri algoritmo fare clic sulla colonna Valore, quindi digitare {12}, incluse le parentesi graffe.

    Per impostazione predefinita, verrà aggiunto il valore {1}.

  3. Nella riga FORECAST_METHOD verificare che la casella di testo Valore sia vuota o impostata su MIXED. Se è stato inserito un valore diverso, digitare MIXED per ripristinare il valore predefinito del parametro.

  4. Nella riga PREDICTION_SMOOTHING verificare che la casella di testo Valore sia vuota o impostata su 0,5. Se è stato inserito un valore diverso, fare clic su Valore e digitare 0,5 per ripristinare il valore predefinito del parametro.

    [!NOTA]

    Il parametro PREDICTION_SMOOTHING è disponibile solo in SQL Server Enterprise. Non è pertanto possibile visualizzare o modificare il valore di tale parametro in SQL Server Standard. Il comportamento predefinito consiste tuttavia nell'utilizzare entrambi gli algoritmi con un fattore di ponderazione equivalente.

  5. Scegliere OK.

Gestione di dati mancanti (facoltativo)

In diversi casi, è possibile che nei dati di vendita siano presenti gap riempiti con valori Null oppure che un negozio non sia stato in grado di inviare il report prima della scadenza, lasciando una cella vuota alla fine della serie. In questi scenari, in Analysis Services viene generato l'errore seguente e il modello non viene elaborato.

"Errore (data mining): Timestamp non sincronizzati a partire dalla serie <nome serie> del modello di data mining <nome modello>. Tutte le serie temporali devono terminare allo stesso contrassegno temporale e i punti dati non possono essere omessi arbitrariamente. Se si imposta il parametro MISSING_VALUE_SUBSTITUTION su Previous o su una costante numerica, i punti dati mancanti verranno aggiunti automaticamente ove possibile."

Per evitare l'errore, è possibile impostare Analysis Services in modo da fornire automaticamente nuovi valori per riempire i gap tramite i metodi seguenti:

  • Utilizzo di un valore medio. La media viene calcolata utilizzando tutti i valori validi nella stessa serie di dati.

  • Utilizzo del valore precedente. È possibile sostituire i valori precedenti di più celle mancanti, ma non è possibile riempire i valori iniziali.

  • Utilizzo di un valore costante fornito dall'utente.

Per specificare che le lacune vengano colmate tramite valori medi

  1. Nella scheda Modelli di data mining fare clic con il pulsante destro del mouse sulla colonna Forecasting e scegliere Imposta parametri algoritmo.

  2. Nella riga MISSING_VALUE_SUBSTITUTION della finestra di dialogo Parametri algoritmo fare clic sulla colonna Valore e digitare Mean.

Compilare il modello

Per utilizzare il modello, è necessario distribuirlo a un server ed elaborarlo mediante l'esecuzione di dati di training tramite l'algoritmo.

Per elaborare il modello di previsione

  1. Scegliere Elabora struttura di data mining e tutti i modelli dal menu Modello di data mining di SQL Server Data Tools.

  2. Nella finestra di avviso che chiede se si desidera compilare e distribuire il progetto fare clic su .

  3. Nella finestra di dialogo Elabora struttura di data mining - Forecasting fare clic su Esegui.

    Verrà aperta la finestra di dialogo Stato elaborazione in cui sono visualizzate le informazioni sull'elaborazione del modello. L'elaborazione del modello può richiedere alcuni minuti.

  4. Al termine dell'elaborazione, fare clic su Chiudi per chiudere la finestra di dialogo Stato elaborazione.

  5. Fare nuovamente clic su Chiudi per chiudere la finestra di dialogo Elabora struttura di data mining - Forecasting.

Attività successiva della lezione

Esplorazione del modello di previsione (Esercitazione intermedia sul data mining)

Vedere anche

Riferimento

Riferimento tecnico per l'algoritmo Microsoft Time Series

Concetti

Algoritmo Microsoft Time Series

Requisiti e considerazioni sull'elaborazione (data mining)