Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
In questa attività verrà creato un nuovo modello basato sui dati di vendita in tutto il mondo. Si creerà quindi una query di stima che applica il modello di vendita globale a una delle singole aree.
Creazione di un modello generale
Ricorda che la tua analisi dei risultati del modello di estrazione originale ha rivelato grandi differenze tra le regioni e tra le linee di prodotto. Ad esempio, le vendite del modello M200 sono state buone in Nord America, mentre quelle del modello T1000 non hanno fatto altrettanto bene. Tuttavia, l'analisi è complicata dal fatto che alcune serie non hanno molti dati o dati avviati in un momento diverso. Alcuni dati erano mancanti.
Per risolvere alcuni dei problemi di qualità dei dati, si decide di unire i dati delle vendite in tutto il mondo e di usare tale set di tendenze di vendita generali per creare un modello che può essere applicato per stimare le vendite future in qualsiasi area.
Quando si creano stime, si userà il modello generato dal training sui dati di vendita in tutto il mondo, ma si sostituiranno i punti dati cronologici con i dati di vendita per ogni singola area. In questo modo, la forma della tendenza viene mantenuta, ma i valori stimati sono allineati ai dati cronologici delle vendite per ogni area e modello.
Esecuzione di stime incrociate con un modello Time Series
Il processo di utilizzo dei dati di una serie per stimare le tendenze in un'altra serie è denominato cross-prediction. È possibile usare la stima incrociata in molti scenari: ad esempio, è possibile decidere che le vendite televisive sono un buon stimatore dell'attività economica complessiva e applicare un modello sottoposto a training sulle vendite televisive ai dati economici generali.
In SQL Server Data Mining si esegue la stima incrociata usando il parametro REPLACE_MODEL_CASES all'interno degli argomenti della funzione PredictTimeSeries (DMX).
Nell'attività successiva si apprenderà come usare REPLACE_MODEL_CASES. Si useranno i dati di vendita mondiali uniti per creare un modello e quindi creare una query di stima che esegue il mapping del modello generale ai dati di sostituzione.
Si presuppone che si abbia familiarità con la creazione di modelli di data mining e quindi le istruzioni per la compilazione del modello siano state semplificate.
Per costruire una struttura di data mining e un modello di data mining utilizzando i dati aggregati
In Esplora soluzioni fare clic con il pulsante destro del mouse su Strutture di data mining e quindi scegliere Nuova struttura di data mining per avviare la Creazione guidata modello di data mining.
Nella creazione guidata di data mining, effettuare le seguenti selezioni:
Algoritmo: Microsoft Time Series
Usare l'origine dati compilata in precedenza in questa lezione avanzata come origine per il modello. Vedere Advanced Time Series Predictions (Esercitazione intermedia sul data mining).
Vista origine dati:
AllRegionsScegliere le colonne seguenti per la chiave della serie e la chiave temporale:
Momento chiave: ReportingDate
Chiave: Regione
Scegliere le colonne seguenti per
InputePredict:SommaQuantità
SumAmt
AvgAmt
AvgQty
Per Nome struttura di data mining digitare:
All RegionsPer Nome modello di data mining digitare:
All Regions
Elaborare la nuova struttura e il nuovo modello.
Per creare la query di previsione e mappare i dati di sostituzione
Se il modello non è già aperto, fare doppio clic sulla struttura AllRegions e, in Progettazione modelli di data mining, fare clic sulla scheda Predizione modello di data mining.
Nel riquadro Modello di mining il modello AllRegions dovrebbe essere già selezionato. Se non è selezionata, fare clic su Seleziona modello e quindi selezionare il modello AllRegions.
Nel riquadro Seleziona Tabelle di Input fare clic su Seleziona Tabella Casi.
Nella finestra di dialogo Seleziona tabella modificare l'origine dati in T1000 Pacific Region e quindi fare clic su OK.
Fare clic con il pulsante destro del mouse sulla linea di join tra il modello di data mining e i dati di input e selezionare Modifica connessioni. Eseguire il mapping dei dati nella vista origine dati al modello come indicato di seguito:
Verificare che la colonna ReportingDate nel modello di data mining sia mappata alla colonna ReportingDate nei dati di input.
Nella finestra di dialogo Modifica mapping, nella riga relativa alla colonna del modello AvgQty, fare clic sotto Colonna tabella e quindi selezionare T1000 Pacific.Quantity. Fare clic su OK.
Questo passaggio mappa la colonna creata nel modello per stimare la quantità media ai dati effettivi della serie T1000 per la quantità venduta.
Non eseguire il mapping della colonna Regione nel modello a nessuna colonna di input.
Poiché il modello ha aggregato i dati in tutte le serie, non esiste alcuna corrispondenza per i valori della serie, ad esempio T1000 Pacific, e viene generato un errore quando viene eseguita la query di stima.
Adesso si compilerà la query di previsione.
Aggiungere prima di tutto una colonna ai risultati che restituisce l'etichetta AllRegions dal modello insieme alle stime. In questo modo si sa che i risultati sono basati sul modello generale.
Nella griglia, fare clic sulla prima riga vuota, sotto Origine, e quindi selezionare il modello di data mining AllRegions.
Per Campo selezionare Area.
Per Alias, digitare Modello usato.
Aggiungere quindi un'altra etichetta ai risultati, in modo da visualizzare la serie per cui si intende eseguire la stima.
Fare clic su una riga vuota e in Origine selezionare Espressione personalizzata.
Nella colonna Alias digitare ModelRegion.
Nella colonna Criteri/Argomento digitare
'T1000 Pacific'.
A questo momento si configurerà la funzione di stima incrociata.
Fare clic su una riga vuota e in Origine selezionare Funzione di stima.
Nella colonna Campo selezionare PredictTimeSeries.
Per Alias digitare Valori stimati.
Trascinare il campo AvgQty dal riquadro Modello di data mining nella colonna Criteri/Argomento trascinando e rilasciando.
Nella colonna Criteri/Argomento digitare il testo seguente dopo il nome del campo:
,5, REPLACE_MODEL_CASESIl testo completo della casella di testo Criteri/Argomento deve essere il seguente:
[AllRegions].[AvgQty],5,REPLACE_MODEL_CASES
Fare clic su Risultati.
Creazione della query di stima incrociata in DMX
È possibile che si sia notato un problema con la stima incrociata: vale a dire che applicare il modello generale a una serie di dati diversa, ad esempio il modello di prodotto T1000 nell'area America del Nord, è necessario creare una query diversa per ogni serie, in modo da poter eseguire il mapping di ogni set di input al modello.
Tuttavia, anziché compilare la query nella finestra di progettazione, è possibile passare alla visualizzazione DMX e modificare l'istruzione DMX creata. Ad esempio, l'istruzione DMX seguente rappresenta la query appena compilata:
SELECT
([All Regions].[Region]) as [Model Used],
('T-1000 Pacific') as [ModelRegion],
(PredictTimeSeries([All Regions].[Avg Qty],5, REPLACE_MODEL_CASES)) as [Predicted Quantity]
FROM [All Regions]
PREDICTION JOIN
OPENQUERY([Adventure Works DW2003R2], 'SELECT [ReportingDate] FROM
(
SELECT ReportingDate, ModelRegion, Quantity, Amount
FROM dbo.vTimeSeries
WHERE (ModelRegion = N''T1000 Pacific'')
) as [T1000 Pacific] ')
AS t
ON
[All Regions].[Reporting Date] = t.[ReportingDate]
AND
[All Regions].[Avg Qty] = t.[Quantity]
Per applicarlo a un modello diverso, è sufficiente modificare l'istruzione di query per sostituire la condizione di filtro e aggiornare le etichette associate a ogni risultato.
Ad esempio, se si modificano le condizioni di filtro e le etichette di colonna sostituendo "Pacific" con "America del Nord", si otterranno stime per il prodotto T1000 in America del Nord, in base ai modelli nel modello generale.
Attività successiva nella lezione
Confronto delle stime per i modelli di previsione (esercitazione intermedia sul data mining)
Vedere anche
Esempi di query sul modello Time Series
PredictTimeSeries (DMX)