Condividi tramite


Personalizzazione ed elaborazione del modello di previsione (esercitazione intermedia sul data mining)

L'algoritmo Microsoft Time Series fornisce parametri che influiscono sulla modalità di creazione di un modello e sulla modalità di analisi dei dati temporali. La modifica di queste proprietà può influire in modo significativo sul modo in cui il modello di data mining esegue stime.

Per questa attività nell'esercitazione si eseguiranno le attività seguenti per modificare il modello:

  1. Si personalizza il modo in cui il modello gestisce i periodi di tempo aggiungendo un nuovo valore per il parametro PERIODICITY_HINT .

  2. Verranno illustrati altri due parametri importanti per l'algoritmo Microsoft Time Series: FORECAST_METHOD, che consente di controllare il metodo usato per la previsione e PREDICTION_SMOOTHING, che consente di personalizzare la combinazione di stime a lungo termine e a breve termine.

  3. Facoltativamente, si indicherà all'algoritmo come si desidera che i valori mancanti vengano imputati.

  4. Dopo aver apportato tutte le modifiche, distribuirai ed elaborerai il modello.

Impostazione dei parametri delle serie temporali

Hint di periodicità

Il parametro PERIODICITY_HINT fornisce all'algoritmo informazioni sui periodi di tempo aggiuntivi che si prevede di visualizzare nei dati. Per impostazione predefinita, i modelli time series tenteranno di rilevare automaticamente un modello nei dati. Tuttavia, se si conosce già il ciclo di tempo previsto, fornire un hint di periodicità può potenzialmente migliorare l'accuratezza del modello. Tuttavia, se si fornisce l'hint di periodicità errato, può diminuire l'accuratezza; pertanto, se non si è certi del valore da usare, è consigliabile usare il valore predefinito.

Ad esempio, la vista usata per questo modello aggrega i dati sulle vendite di Adventure Works DW Multidimensional 2012 su base mensile. Pertanto, ogni sezione temporale usata dal modello rappresenta un mese e tutte le stime saranno anche in termini di mesi. Poiché sono presenti 12 mesi in un anno e si prevede che i modelli di vendita vengano ripetuti più o meno su base annuale, si imposta il parametro PERIODICITY_HINT su 12per indicare che 12 sezioni temporali (mesi) costituiscono un ciclo di vendita completo.

Metodo di previsione

Il parametro FORECAST_METHOD controlla se l'algoritmo time series è ottimizzato per stime a breve o a lungo termine. Per impostazione predefinita, il parametro FORECAST_METHOD è impostato su MIXED, il che significa che due algoritmi diversi vengono mescolati ed equilibrati per fornire buoni risultati sia a breve termine che a lungo termine.

Tuttavia, se si sa che si vuole usare un particolare algoritmo, è possibile modificare il valore in ARIMA o ARTXP.

Ponderazione Long-Term e stime Short-Term

È anche possibile personalizzare il modo in cui le stime a lungo termine e a breve termine vengono combinate usando il parametro PREDICTION_SMOOTHING. Per impostazione predefinita, questo parametro è impostato su 0,5, che in genere fornisce il miglior equilibrio per l'accuratezza complessiva.

Per modificare i parametri dell'algoritmo

  1. Nella scheda Modelli di data mining fare clic con il pulsante destro del mouse su Previsione e scegliere Imposta parametri algoritmo.

  2. PERIODICITY_HINT Nella riga della finestra di dialogo Parametri algoritmo fare clic sulla colonna Valore, quindi digitare {12}, incluse le parentesi graffe.

    Per impostazione predefinita, l'algoritmo aggiungerà anche il valore {1}.

  3. FORECAST_METHOD Nella riga verificare che la casella di testo Valore sia vuota o impostata su MIXED. Se è stato immesso un valore diverso, digitare MIXED per tornare al valore predefinito.

  4. Nella riga PREDICTION_SMOOTHING verificare che la casella di testo Valore sia vuota o impostata su 0,5. Se è stato immesso un valore diverso, fare clic su Valore e digitare 0.5 per tornare al valore predefinito.

    Annotazioni

    Il parametro PREDICTION_SMOOTHING è disponibile solo in SQL Server Enterprise. Pertanto, non è possibile visualizzare o modificare il valore del parametro PREDICTION_SMOOTHING in SQL Server Standard. Tuttavia, il comportamento predefinito consiste nell'usare entrambi gli algoritmi e ponderarli equamente.

  5. Fare clic su OK.

Gestione dei dati mancanti (facoltativo)

In molti casi, i dati di vendita potrebbero avere lacune riempite con valori null oppure un negozio potrebbe non essere riuscito a rispettare la scadenza della relazione, lasciando una cella vuota entro la fine della serie. In questi scenari, Analysis Services genera l'errore seguente e non elabora il modello.

Errore (data mining): timestamp non sincronizzati a partire dalla serie <nome della serie>, del modello di data mining, <nome del modello>. Tutte le serie temporali devono terminare contemporaneamente e non possono contenere punti dati arbitrariamente mancanti. Se possibile, l'impostazione del parametro MISSING_VALUE_SUBSTITUTION su Previous o su una costante numerica patchrà automaticamente i punti dati mancanti."

Per evitare questo errore, è possibile specificare che Analysis Services fornisca automaticamente nuovi valori per colmare le lacune usando uno dei metodi seguenti:

  • Uso di un valore medio. La media viene calcolata usando tutti i valori validi nella stessa serie di dati.

  • Utilizzo del valore precedente. È possibile sostituire i valori precedenti per più celle mancanti, ma non è possibile riempire i valori iniziali.

  • Uso di un valore costante fornito.

Per specificare che i gap devono essere riempiti in base ai valori medi

  1. Nella scheda Modelli di data mining fare clic con il pulsante destro del mouse sulla colonna Previsione e scegliere Imposta parametri algoritmo.

  2. Nella riga MISSING_VALUE_SUBSTITUTION della finestra di dialogo Parametri algoritmo fare clic sulla colonna Valore e digitare Mean.

Compilare il modello

Per usare il modello, è necessario distribuirlo in un server ed elaborare il modello eseguendo i dati di training tramite l'algoritmo .

Per elaborare il modello di previsione

  1. Nel menu Modello di data mining di SQL Server Data Tools, selezionare Elabora la struttura di data mining e tutti i modelli.

  2. All'avviso che chiede se si vuole compilare e distribuire il progetto, fare clic su .

  3. Nella finestra di dialogo Struttura di Process Mining - Previsione, fai clic su Esegui.

    Verrà visualizzata la finestra di dialogo Stato processo per visualizzare informazioni sull'elaborazione del modello. L'elaborazione del modello può richiedere del tempo.

  4. Al termine dell'elaborazione, fare clic su Chiudi per uscire dalla finestra di dialogo Stato processo .

  5. Fare di nuovo clic su Chiudi per uscire dalla finestra di dialogo Struttura di Process Mining - Previsione.

Attività successiva nella lezione

Esplorazione del modello di previsione (esercitazione intermedia sul data mining)

Vedere anche

Riferimento tecnico per l'algoritmo Microsoft Time Series
Microsoft Time Series Algoritmo
Requisiti e considerazioni sull'elaborazione (data mining)