Condividi tramite


Confronto delle stime per i modelli di previsione (esercitazione intermedia sul data mining)

Nei passaggi precedenti di questa esercitazione sono stati creati più modelli time series:

  • Stime per ogni combinazione di area e modello, in base solo ai dati per il singolo modello e l'area.

  • Stime per ogni area, in base ai dati aggiornati.

  • Stime per tutti i modelli su base mondiale, in base ai dati aggregati.

  • Stime per il modello M200 nell'area America del Nord, in base al modello aggregato.

Per riepilogare le funzionalità per le previsioni delle serie temporali, esaminerai le modifiche per vedere in che modo l'uso delle opzioni per estendere o sostituire i dati abbia influenzato i risultati delle previsioni.

EXTEND_MODEL_CASES

REPLACE_MODEL_CASES

Confronto dei risultati originali con risultati dopo l'aggiunta di dati

Verranno ora esaminati i dati solo per la linea di prodotti M200 nell'area Pacifico per vedere come l'aggiornamento del modello con nuovi dati influisce sui risultati. Tenere presente che la serie di dati originale è terminata nel giugno 2004 e sono stati ottenuti nuovi dati per luglio, agosto e settembre.

  • La prima colonna mostra i nuovi dati aggiunti.

  • La seconda colonna mostra la previsione per luglio e versioni successive in base alla serie di dati originale.

  • La terza colonna mostra la previsione in base ai dati estesi.

M200 Pacifico Dati di vendita reali aggiornati Previsione prima dell'aggiunta dei dati Stima estesa
7-25-2008 65 32 65
8-25-2008 54 37 54
9-25-2008 61 32 61
10-25-2008 Nessun dato 36 32
11-25-2008 Nessun dato 31 41
12-25-2008 Nessun dato 34 32

Si noterà che le previsioni che usano i dati estesi (illustrati qui in grassetto) ripetono esattamente i punti dati reali. La ripetizione è intenzionale. Se sono presenti punti dati reali da usare, la query di stima restituirà i valori effettivi e restituirà i nuovi valori di stima solo dopo l'uso dei nuovi punti dati effettivi.

In generale, l'algoritmo pondera le modifiche nei nuovi dati in modo più forte rispetto ai dati dall'inizio dei dati del modello. Tuttavia, in questo caso, i nuovi dati sulle vendite rappresentano un aumento solo del 20-30% nel periodo precedente, quindi si è verificato solo un lieve aumento delle vendite previste, dopo il quale le proiezioni di vendita sono di nuovo calate, più in linea con la tendenza nei mesi precedenti ai nuovi dati.

Confronto tra i risultati originali e quelli delle previsioni incrociate

Ricorda che il modello di data mining originale ha rivelato grandi differenze tra le aree e tra le linee di prodotto. Ad esempio, le vendite per il modello M200 erano molto forti, mentre le vendite per il modello T1000 erano piuttosto basse in tutte le aree. Inoltre, alcune serie non hanno molti dati. Le serie erano irregolari, il che significa che non avevano lo stesso punto di partenza.

Serie che stimano la quantità di serie M200 e T1000

In che modo le stime cambiano quando sono state effettuate proiezioni basate sul modello generale, basato sulle vendite a livello mondiale, anziché sui set di dati originali? Per assicurarsi di non aver perso informazioni o disimmetria delle stime, è possibile salvare i risultati in una tabella, unire la tabella delle stime alla tabella dei dati cronologici e quindi creare un grafico dei due set di dati cronologici e stime.

Il diagramma seguente si basa su una sola linea di prodotto, la M200. Il grafico confronta le stime del modello di data mining iniziale con le stime usando il modello di data mining aggregato.

Grafico di Excel che confronta le stime

Da questo diagramma è possibile notare che il modello di data mining aggregato mantiene l'intervallo complessivo e le tendenze nei valori riducendo al minimo le fluttuazioni delle singole serie di dati.

Conclusione

Si è appreso come creare e personalizzare un modello time series che può essere usato per la previsione.

Si è appreso come aggiornare i modelli time series senza doverli rielaborare, aggiungendo nuovi dati e creando stime usando il parametro EXTEND_MODEL_CASES.

Si è appreso come creare modelli che possono essere usati per la stima incrociata, usando il parametro REPLACE_MODEL_CASES e applicando il modello a una serie di dati diversa.

Vedere anche

Esercitazione intermedia sul Data Mining (Analysis Services - Data Mining)
Esempi di query sul modello Time Series