Condividi tramite


Lezione 1: Creazione di un modello di mining dei dati su serie temporali e di una struttura di mining dei dati

In questa lezione verrà creato un modello di data mining che consente di stimare i valori nel tempo, in base ai dati cronologici. Quando si crea il modello, la struttura sottostante verrà generata automaticamente e può essere utilizzata come base per modelli di data mining aggiuntivi.

Questa lezione presuppone che l'utente abbia familiarità con i modelli di previsione e con i requisiti dell'algoritmo Microsoft Time Series. Per altre informazioni, vedere Algoritmo Microsoft Time Series.

Istruzione CREATE MINING MODEL

Per creare un modello di data mining direttamente e generare automaticamente la struttura di data mining sottostante, utilizzare l'istruzione CREATE MINING MODEL (DMX). Il codice nell'istruzione può essere suddiviso nelle parti seguenti:

  • Denominazione del modello

  • Definizione del timestamp

  • Definizione della colonna chiave della serie facoltativa

  • Definizione dell'attributo o degli attributi stimabili

Di seguito è riportato un esempio generico dell'istruzione CREATE MINING MODEL:

CREATE MINING MODEL [<Mining Structure Name>]  
(  
   <key columns>,  
   <predictable attribute columns>  
)  
USING <algorithm name>([parameter list])  
WITH DRILLTHROUGH  

La prima riga del codice definisce il nome del modello di mining.

CREATE MINING MODEL [Mining Model Name]  

Analysis Services genera automaticamente un nome per la struttura sottostante aggiungendo "_structure" al nome del modello, assicurando che il nome della struttura sia univoco dal nome del modello. Per informazioni sulla denominazione di un oggetto in DMX, vedere Identificatori (DMX).

La riga successiva del codice definisce la colonna chiave per il modello di data mining, che nel caso di un modello time series identifica in modo univoco un passaggio temporale nei dati di origine. Il passaggio temporale viene identificato con le KEY TIME parole chiave dopo il nome della colonna e i tipi di dati. Se il modello time series ha una chiave di serie separata, viene identificata usando la KEY parola chiave .

<key columns>  

La riga successiva del codice viene usata per definire le colonne nel modello che verranno stimate. È possibile avere più attributi stimabili in un singolo modello di data mining. Quando sono presenti più attributi stimabili, l'algoritmo Microsoft Time Series genera un'analisi separata per ogni serie:

<predictable attribute columns>  

Argomenti della lezione

In questa lezione verranno eseguite le attività seguenti:

  • Creare una nuova query vuota

  • Modificare la query per creare il modello di estrazione dati

  • Esecuzione della query

Creazione della query

Il primo passaggio consiste nel connettersi a un'istanza di Analysis Services e creare una nuova query DMX in SQL Server Management Studio.

Per creare una nuova query DMX in SQL Server Management Studio

  1. Aprire SQL Server Management Studio.

  2. Nella finestra di dialogo Connetti al server selezionare Analysis Services per Tipo di server. In Nome server digitare LocalHosto il nome dell'istanza di Analysis Services a cui connettersi per questa lezione. Fare clic su Connetti.

  3. In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query e quindi fare clic su DMX.

    L'editor di query viene aperto e contiene una nuova query vuota.

Modificando la query

Il passaggio successivo consiste nel modificare l'istruzione CREATE MINING MODEL per creare il modello di data mining utilizzato per la previsione, insieme alla relativa struttura di data mining sottostante.

Per personalizzare l'istruzione CREATE MINING MODEL

  1. Nell'editor di query copiare l'esempio generico dell'istruzione CREATE MINING MODEL nella query vuota.

  2. Sostituire quanto segue:

    [mining model name]   
    

    con:

    [Forecasting_MIXED]  
    
  3. Sostituire quanto segue:

    <key columns>  
    

    con:

    [Reporting Date] DATE KEY TIME,  
    [Model Region] TEXT KEY  
    

    La TIME KEY parola chiave indica che la colonna ReportingDate contiene i valori del passaggio temporale usati per ordinare i valori. I passaggi temporali possono essere date e ore, numeri interi o qualsiasi tipo di dati ordinato, purché i valori siano univoci e i dati siano ordinati.

    Le TEXT parole chiave e KEY indicano che la colonna ModelRegion contiene una chiave di serie aggiuntiva. È possibile avere una sola chiave di serie e i valori nella colonna devono essere distinti.

  4. Sostituire quanto segue:

    < predictable attribute columns> )  
    

    con:

    [Quantity] LONG CONTINUOUS PREDICT,  
    [Amount] DOUBLE CONTINUOUS PREDICT  
    )  
    
  5. Sostituire quanto segue:

    USING <algorithm name>([parameter list])  
    WITH DRILLTHROUGH  
    

    con:

    USING Microsoft_Time_Series(AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    

    Il parametro dell'algoritmo , AUTO_DETECT_PERIODICITY = 0.8, indica che si desidera che l'algoritmo rilevi i cicli nei dati. L'impostazione di questo valore più vicino a 1 favorisce l'individuazione di molti modelli, ma può rallentare l'elaborazione.

    Il parametro dell'algoritmo , FORECAST_METHOD, indica se si desidera analizzare i dati usando ARTXP, ARIMA o una combinazione di entrambi.

    La parola chiave , WITH DRILLTHROUGH, specificare che si vuole essere in grado di visualizzare statistiche dettagliate nei dati di origine al termine del modello. È necessario aggiungere questa clausola se si desidera esplorare il modello usando Microsoft Time Series Viewer. Non è necessario per la stima.

    L'istruzione completa dovrebbe ora essere la seguente:

    CREATE MINING MODEL [Forecasting_MIXED]  
         (  
        [Reporting Date] DATE KEY TIME,  
        [Model Region] TEXT KEY,  
        [Quantity] LONG CONTINUOUS PREDICT,  
        [Amount] DOUBLE CONTINUOUS PREDICT  
        )  
    USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    
    
  6. Scegliere Salva DMXQuery1.dmx con nome nel menu File.

  7. Nella finestra di dialogo Salva con nome passare alla cartella appropriata e assegnare al file Forecasting_MIXED.dmxil nome .

Esecuzione della query

Il passaggio finale consiste nell'eseguire la query. Dopo aver creato e salvato una query, è necessario eseguirla per creare il modello di data mining e la relativa struttura di data mining nel server. Per altre informazioni sull'esecuzione di query nell'editor di query, vedere Editor di query del motore di database (SQL Server Management Studio).

Per eseguire la query

  • Nella barra degli strumenti dell'editor di query fare clic su Esegui.

    Lo stato della query viene visualizzato nella scheda Messaggi nella parte inferiore dell'editor di query al termine dell'esecuzione dell'istruzione. I messaggi devono essere visualizzati:

    Executing the query   
    Execution complete  
    

    Esiste ora una nuova struttura denominata Forecasting_MIXED_Structure nel server, insieme al modello di data mining correlato Forecasting_MIXED.

Nella lezione successiva si aggiungerà un modello di data mining alla struttura di data mining Forecasting_MIXED appena creata.

Lezione successiva

Lezione 2: Aggiungere modelli di data mining alla struttura di mining delle serie temporali

Vedere anche

Contenuto del modello di data mining per i modelli Time Series (Analysis Services - Data mining)
Riferimento tecnico per l'algoritmo Microsoft Time Series