Condividi tramite


Lezione 1: Creazione di un modello di data mining Time Series e di una struttura di data mining

In questa lezione verrà creato un modello di data mining che consente di eseguire una stima di valori nel tempo in base a dati cronologici. Al momento della creazione del modello, la struttura sottostante verrà generata automaticamente e potrà essere utilizzata come base per nuovi modelli di data mining.

Questa lezione presuppone che l'utente abbia familiarità con i modelli di previsione e con i requisiti dell'algoritmo Microsoft Time Series. Per altre informazioni, vedere Algoritmo Microsoft Time Series.

Istruzione CREATE MINING MODEL

Per creare un modello di data mining direttamente e generare automaticamente la struttura di data mining sottostante, utilizzare l'istruzione CREATE MINING MODEL (DMX). Il codice nell'istruzione può essere suddiviso nelle parti seguenti:

  • Assegnazione di un nome al modello

  • Definizione del timestamp

  • Definizione della colonna chiave della serie facoltativa

  • Definizione di uno o più attributi stimabili

Di seguito è riportato un esempio generico dell'istruzione CREATE MINING MODEL:

CREATE MINING MODEL [<Mining Structure Name>]  
(  
   <key columns>,  
   <predictable attribute columns>  
)  
USING <algorithm name>([parameter list])  
WITH DRILLTHROUGH  

La prima riga del codice definisce il nome del modello di data mining:

CREATE MINING MODEL [Mining Model Name]  

Il nome della struttura sottostante viene generato automaticamente in Analysis Services aggiungendo il suffisso "_structure" al nome del modello, per assicurare l'utilizzo di un nome univoco derivato dal nome del modello. Per informazioni sulla denominazione di un oggetto in DMX, vedere Identificatori (DMX).

La riga successiva definisce la colonna chiave del modello di data mining, che nel caso di un modello Time Series identifica in modo univoco un intervallo temporale nei dati di origine. L'intervallo temporale è identificato dalle parole chiave KEY TIME dopo il nome di colonna e i tipi di dati. Se il modello Time Series dispone di una chiave della serie separata, questa viene identificata tramite la parola chiave KEY.

<key columns>  

La riga successiva del codice viene utilizzata per definire le colonne del modello di cui verrà eseguita la stima. Un modello di data mining può contenere più attributi stimabili. In tal caso, l'algoritmo Microsoft Time Series genererà un'analisi distinta per ogni serie:

<predictable attribute columns>  

Argomenti della lezione

In questa lezione verranno eseguite le attività seguenti:

  • Creazione di una nuova query vuota

  • Modifica della query per creare il modello di data mining

  • Esecuzione della query

Creazione della query

Il primo passaggio consiste nel connettersi a un'istanza di Analysis Services e creare una nuova query DMX in SQL Server Management Studio.

Per creare una nuova query DMX in SQL Server Management Studio

  1. Aprire SQL Server Management Studio.

  2. Nella finestra di dialogo Connetti al server selezionare Analysis Services per Tipo di server. In Nome server digitare LocalHosto il nome dell'istanza di Analysis Services a cui connettersi per questa lezione. Fare clic su Connetti.

  3. In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query e quindi fare clic su DMX.

    Verrà avviato l'editor di query con una nuova query vuota.

Modifica della query

Il passaggio successivo consiste nel modificare l'istruzione CREATE MINING MODEL per creare il modello di data mining utilizzato per la previsione, insieme alla struttura di data mining sottostante.

Per personalizzare l'istruzione CREATE MINING MODEL

  1. Nell'editor di query copiare l'esempio generico dell'istruzione CREATE MINING MODEL nella query vuota.

  2. Sostituire quanto segue:

    [mining model name]   
    

    con:

    [Forecasting_MIXED]  
    
  3. Sostituire quanto segue:

    <key columns>  
    

    con:

    [Reporting Date] DATE KEY TIME,  
    [Model Region] TEXT KEY  
    

    La parola chiave TIME KEY indica che la colonna ReportingDate contiene i valori dell'intervallo temporale utilizzati per ordinare i valori. Gli intervalli temporali possono essere date e ore, numeri interi o qualsiasi tipo di dati ordinati, purché i valori siano univoci e i dati vengano ordinati.

    Le parole chiave TEXT e KEY indicano che la colonna ModelRegion contiene una chiave della serie aggiuntiva. È consentita solo una chiave della serie e i valori della colonna devono essere distinti.

  4. Sostituire quanto segue:

    < predictable attribute columns> )  
    

    con:

    [Quantity] LONG CONTINUOUS PREDICT,  
    [Amount] DOUBLE CONTINUOUS PREDICT  
    )  
    
  5. Sostituire quanto segue:

    USING <algorithm name>([parameter list])  
    WITH DRILLTHROUGH  
    

    con:

    USING Microsoft_Time_Series(AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    

    Il parametro AUTO_DETECT_PERIODICITY = 0,8 dell'algoritmo indica che si desidera che l'algoritmo rilevi cicli nei dati. L'impostazione di questo parametro su un valore prossimo a 1 consente di individuare numerosi modelli, ma può rallentare l'elaborazione.

    Il parametro FORECAST_METHOD dell'algoritmo indica se si desidera che i dati vengano analizzati tramite ARTXP, ARIMA o una combinazione dei due algoritmi.

    La parola chiave WITH DRILLTHROUGH specifica che si desidera essere in grado di visualizzare statistiche dettagliate nei dati di origine dopo il completamento del modello. È necessario aggiungere questa clausola se si desidera esplorare il modello tramite il Visualizzatore Microsoft Time Series. Tale clausola non è necessaria per l'esecuzione di stime.

    L'istruzione completa dovrebbe risultare analoga alla seguente:

    CREATE MINING MODEL [Forecasting_MIXED]  
         (  
        [Reporting Date] DATE KEY TIME,  
        [Model Region] TEXT KEY,  
        [Quantity] LONG CONTINUOUS PREDICT,  
        [Amount] DOUBLE CONTINUOUS PREDICT  
        )  
    USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    
    
  6. Scegliere Salva DMXQuery1.dmx Con nome dal menu File.

  7. Nella finestra di dialogo Salva con nome passare alla cartella appropriata e assegnare al file Forecasting_MIXED.dmxil nome .

Esecuzione della query

Il passaggio conclusivo consiste nell'esecuzione della query. Dopo la creazione e il salvataggio di una query, è necessario eseguirla per creare il modello di data mining e la relativa struttura sul server. Per altre informazioni sull'esecuzione di query in Editor di query, vedere Editor di query del motore di database (SQL Server Management Studio).

Per eseguire la query

  • Nella barra degli strumenti di Editor di query fare clic su Esegui.

    Lo stato della query viene visualizzato nella scheda Messaggi nella parte inferiore di Editor di query al termine dell'esecuzione dell'istruzione. Dovrebbero essere visualizzati i messaggi seguenti:

    Executing the query   
    Execution complete  
    

    Nel server è ora presente una nuova struttura denominata Forecasting_MIXED_Structure , insieme al modello di data mining correlato Forecasting_MIXED.

Nella lezione successiva si aggiungerà un modello di data mining alla struttura di data mining Forecasting_MIXED appena creata.

Lezione successiva

Lezione 2: Aggiunta di modelli di data mining alla struttura di data mining Time Series

Vedere anche

Contenuto dei modelli di data mining per i modelli Time Series (Analysis Services - Data mining)
Riferimento tecnico per l'algoritmo Microsoft Time Series