Condividi tramite


Stime avanzate delle serie temporali (esercitazione intermedia sul data mining)

Si è visto dall'esplorazione del modello di previsione che, sebbene le vendite nella maggior parte delle aree seguano un modello simile, alcune aree e alcuni modelli, ad esempio il modello M200 nella regione Pacifico, presentano tendenze molto diverse. Ciò non sorprende, come sapete che le differenze tra le aree sono comuni e possono essere causate da molti fattori, tra cui promozioni di marketing, segnalazione imprecisa o eventi geopolitici.

Tuttavia, gli utenti chiedono un modello che può essere applicato in tutto il mondo. Pertanto, per ridurre al minimo l'effetto dei singoli fattori sulle proiezioni, si decide di creare un modello basato su misure aggregate di vendite in tutto il mondo. È quindi possibile usare questo modello per eseguire stime per ogni singola area.

In questa attività creerai tutte le origini dati necessarie per eseguire le attività di previsione avanzate. Verranno create due viste origine dati da usare come input per la query di stima e una vista origine dati da usare per la creazione di un nuovo modello.

Passi

  1. Preparare i dati delle vendite estese (per la stima)

  2. Preparare i dati aggregati (per la compilazione del modello)

  3. Preparare i dati delle serie (per la stima incrociata)

  4. Prevedere utilizzando EXTEND

  5. Creare il modello di stima incrociata

  6. Stimare con REPLACE

  7. Esaminare le nuove stime

Creazione dei nuovi dati di vendita estesi

Per aggiornare i dati sulle vendite, è necessario ottenere i dati di vendita più recenti. Di particolare interesse sono i dati provenienti dalla regione Del Pacifico, che ha lanciato una promozione regionale delle vendite per richiamare l'attenzione sui nuovi negozi e aumentare la consapevolezza dei loro prodotti.

Per questo scenario si presuppone che i dati siano stati importati da una cartella di lavoro di Excel contenente solo tre mesi di nuovi dati per un paio di aree. Si creerà una tabella per i dati usando uno script Transact-SQL e quindi si definirà una vista origine dati da usare per la stima.

Creare la tabella con nuovi dati di vendita

  1. In una finestra di query Transact-SQL eseguire l'istruzione seguente per aggiungere i dati di vendita al database AdventureWorksDW (o a qualsiasi altro database).

    USE [database name];  
    GO  
    IF OBJECT_ID ([dbo].[NewSalesData]) IS NOT NULL   
        DROP TABLE [dbo].[NewSalesData];  
    GO  
    CREATE TABLE [dbo].[NewSalesData]([Series] [nvarchar](255) NULL,  
    [NewDate] [datetime] NULL,  
    [NewQty] [float] NULL,  
    [NewAmount] [money] NULL) ON [PRIMARY]  
    
    GO  
    
  2. Inserire i nuovi valori usando lo script seguente.

    INSERT INTO [NewSalesData]  
    (Series,NewDate,NewQty,NewAmount)  
    VALUES('T1000 Pacific', '7/25/08', 55, '$130,170.22'),  
    ('T1000 Pacific', '8/25/08', 50, '$114,435.36 '),  
    ('T1000 Pacific', '9/25/08', 50, '$117,296.24 '),  
    ('T1000 Europe', '7/25/08', 37, '$88,210.00 '),  
    ('T1000 Europe', '8/25/08', 41, '$97,746.00 '),  
    ('T1000 Europe', '9/25/08', 37, '$88,210.00 '),  
    ('T1000 North America', '7/25/08', 69, '$164,500.00 '),  
    ('T1000 North America', '8/25/08', 66, '$157,348.00 '),  
    ('T1000 North America', '9/25/08', 58, '$138,276.00 '),  
    ('M200 Pacific', '7/25/08', 65, '$149,824.35'),  
    ('M200 Pacific', '8/25/08', 54,  '$124,619.46'),  
    ('M200 Pacific', '9/25/08', 61, '$141,143.39'),  
    ('M200 Europe', '7/25/08', 75, '$173,026.00'),  
    ('M200 Europe', '8/25/08', 76, '$175,212.00'),  
    ('M200 Europe', '9/25/08', 84, '$193,731.00'),  
    ('M200 North America', '7/25/08', 94, '$216,916.00'),  
    ('M200 North America', '8/25/08', 94, '$216,891.00'),  
    ('M200 North America', '9/25/08', 91,'$209,943.00');  
    

    Avvertimento

    Le virgolette vengono utilizzate con i valori di valuta per evitare problemi con il separatore virgola e il simbolo di valuta. È anche possibile passare i valori di valuta in questo formato: 130170.22

    Si noti che le date usate nel database di esempio sono state modificate per questa versione. Se si usa un'edizione precedente di AdventureWorks, potrebbe essere necessario modificare le date inserite di conseguenza.

Creare una vista origine dati usando i nuovi dati di vendita

  1. In Esplora soluzioni fare clic con il pulsante destro del mouse su Viste origine dati e quindi scegliere Nuova vista origine dati.

  2. Nella procedura guidata Vista origine dati effettuare le selezioni seguenti:

    Origine dati: Adventure Works DW Multidimensionale 2012

    Selezionare Tabelle e viste: selezionare la tabella appena creata, NewSalesData.

  3. Fare clic su Fine.

  4. Nell'area di Visualizzazione origine dati, fare clic con il pulsante destro del mouse su NewSalesData e quindi scegliere Esplora dati per verificare i dati.

Avvertimento

Questi dati verranno usati solo per la stima, quindi non è importante che i dati siano incompleti.

Creazione dei dati per il modello di stima incrociata

I dati usati nel modello di previsione originale erano già raggruppati in qualche modo in base alla visualizzazione vTimeSeries, che comprimeva diversi modelli di biciclette in un numero minore di categorie e univano i risultati dei singoli paesi in aree geografiche. Per creare un modello che può essere usato per le proiezioni a livello mondiale, si creeranno alcune aggregazioni semplici aggiuntive direttamente in Progettazione vista origine dati. La nuova vista origine dati conterrà solo una somma e una media delle vendite di tutti i prodotti per tutte le aree.

Dopo aver creato l'origine dati usata per il modello, è necessario creare una nuova vista origine dati da usare per la stima. Ad esempio, se si desidera stimare le vendite per l'Europa usando il nuovo modello mondiale, è necessario inserire dati solo per l'area Europa. Quindi configurerai una nuova vista origine dati che filtra i dati originali e modificherai la condizione di filtro per ogni set di query di previsione.

Per creare i dati del modello usando una vista origine dati personalizzata

  1. In Esplora soluzioni fare clic con il pulsante destro del mouse su Viste origine dati e quindi scegliere Nuova vista origine dati.

  2. Nella pagina iniziale della procedura guidata fare clic su Avanti.

  3. Nella pagina Selezione origine dati selezionare Adventure Works DW multidimensionale 2012 e quindi fare clic su Avanti.

  4. Nella pagina Seleziona tabelle e viste, non aggiungere tabelle, poi fai clic su Avanti.

  5. Nella pagina Completamento procedura guidata digitare il nome AllRegionse quindi fare clic su Fine.

  6. Fare quindi clic con il pulsante destro del mouse sull'area di progettazione della vista origine dati vuota e quindi scegliere Nuova query denominata.

  7. Nella finestra di dialogo Crea query denominata , per Nome, digitare AllRegionse per Descrizione digitare Somma e media delle vendite per tutti i modelli e le aree geografiche.

  8. Nel riquadro di testo SQL digitare l'istruzione seguente e quindi fare clic su OK:

    SELECT ReportingDate,   
    SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty,  
    SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt,  
    'All Regions' as [Region]  
    FROM dbo.vTimeSeries   
    GROUP BY ReportingDate  
    
  9. Fare clic con il pulsante destro del mouse sulla AllRegions tabella e quindi scegliere Esplora dati.

Per creare i dati delle serie per la stima incrociata

  1. In Esplora soluzioni fare clic con il pulsante destro del mouse su Viste origine dati e quindi scegliere Nuova vista origine dati.

  2. Nella procedura guidata Vista origine dati effettuare le selezioni seguenti:

    Origine Dati: Adventure Works DW Multidimensionale 2012

    Selezionare tabelle e viste: non selezionare alcuna tabella

    Nome: T1000 Pacific Region

  3. Fare clic su Fine.

  4. Fare clic con il pulsante destro del mouse sull'area di progettazione vuota di T1000 Pacific Region.dsv e quindi scegliere Nuova query denominata.

    Verrà visualizzata la finestra di dialogo Crea query denominata . Digitare di nuovo il nome e quindi aggiungere la descrizione seguente:

    Nome: T1000 Pacific Region

    Descrizione: Filtrare invTimeSeriesbase all'area e al modello

  5. Nel riquadro di testo digitare la query seguente e quindi fare clic su OK:

    SELECT ReportingDate, ModelRegion, Quantity, Amount  
    FROM dbo.vTimeSeries  
    WHERE (ModelRegion = N'T1000 Pacific')  
    

    Annotazioni

    Poiché sarà necessario creare stime per ogni serie separatamente, è possibile copiare il testo della query e salvarlo in un file di testo in modo da poterle riutilizzare per le altre serie di dati.

  6. Nell'area di progettazione Vista origine dati fare clic con il pulsante destro del mouse su T1000 Pacific e quindi scegliere Esplora dati per verificare che i dati siano filtrati correttamente.

    Questi dati verranno usati come input per il modello durante la creazione di query di stima incrociata.

Attività successiva nella lezione

Stime di serie temporali con dati aggiornati (esercitazione intermedia sul data mining)

Vedere anche

Microsoft Time Series Algoritmo
Riferimento tecnico per l'algoritmo Microsoft Time Series
Viste delle origini dati nei modelli multidimensionali