Condividi tramite


Lezione 1: Creazione di un modello di data mining Time Series e di una struttura di data mining

 

Si applica a: SQL Server 2016 Preview

In questa lezione verrà creato un modello di data mining che consente di eseguire una stima di valori nel tempo in base a dati cronologici. Al momento della creazione del modello, la struttura sottostante verrà generata automaticamente e potrà essere utilizzata come base per nuovi modelli di data mining.

Questa lezione presuppone che l'utente abbia familiarità con i modelli di previsione e con i requisiti dell'algoritmo Microsoft Time Series. Per altre informazioni, vedere Algoritmo Microsoft Time Series.

Istruzione CREATE MINING MODEL

Per creare direttamente un modello di data mining e generare automaticamente la struttura di data mining sottostante, utilizzare il DMX CREATE MINING MODEL ( ) istruzione. Il codice nell'istruzione può essere suddiviso nelle parti seguenti:

  • Assegnazione di un nome al modello

  • Definizione del timestamp

  • Definizione della colonna chiave della serie facoltativa

  • Definizione di uno o più attributi stimabili

Di seguito è riportato un esempio generico dell'istruzione CREATE MINING MODEL:

CREATE MINING MODEL [<Mining Structure Name>]  
(  
   <key columns>,  
   <predictable attribute columns>  
)  
USING <algorithm name>([parameter list])  
WITH DRILLTHROUGH  

La prima riga del codice definisce il nome del modello di data mining:

CREATE MINING MODEL [Mining Model Name]  

Il nome della struttura sottostante viene generato automaticamente in Analysis Services aggiungendo il suffisso "_structure" al nome del modello, per assicurare l'utilizzo di un nome univoco derivato dal nome del modello. Per informazioni sulla denominazione di un oggetto in DMX, vedere identificatori ( DMX ).

La riga successiva definisce la colonna chiave del modello di data mining, che nel caso di un modello Time Series identifica in modo univoco un intervallo temporale nei dati di origine. L'intervallo temporale è identificato con il KEY TIME parole chiave dopo i tipi di dati e nome di colonna. Se il modello time series dispone di una chiave della serie separata, questa viene identificata tramite il chiave (parola chiave).

<key columns>  

La riga successiva del codice viene utilizzata per definire le colonne del modello di cui verrà eseguita la stima. Un modello di data mining può contenere più attributi stimabili. In tal caso, l'algoritmo Microsoft Time Series genererà un'analisi distinta per ogni serie:

<predictable attribute columns>  

Argomenti della lezione

In questa lezione verranno eseguite le attività seguenti:

  • Creazione di una nuova query vuota

  • Modifica della query per creare il modello di data mining

  • Esecuzione della query

Creazione della query

Il primo passaggio consiste nella connessione a un'istanza di Analysis Services e nella creazione di una nuova query DMX in SQL Server Management Studio.

Per creare una nuova query DMX in SQL Server Management Studio

  1. Aprire SQL Server Management Studio.

  2. Nel Connetti al Server nella finestra di dialogo per tipo di Server, selezionare Analysis Services. In nome Server, tipo LocalHost, o il nome dell'istanza di Analysis Services che si desidera connettersi a fini di questa lezione. Fare clic su Connetti.

  3. In Esplora oggetti, fare doppio clic sull'istanza di Analysis Services, scegliere Nuova Query, quindi fare clic su DMX.

    Verrà avviato l'editor di query con una nuova query vuota.

Modifica della query

Il passaggio successivo consiste nel modificare l'istruzione CREATE MINING MODEL per creare il modello di data mining utilizzato per la previsione, insieme alla struttura di data mining sottostante.

Per personalizzare l'istruzione CREATE MINING MODEL

  1. Nell'editor di query copiare l'esempio generico dell'istruzione CREATE MINING MODEL nella query vuota.

  2. Sostituire quanto segue:

    [mining model name]   
    

    con:

    [Forecasting_MIXED]  
    
  3. Sostituire quanto segue:

    <key columns>  
    

    con:

    [Reporting Date] DATE KEY TIME,  
    [Model Region] TEXT KEY  
    

    Il chiave TEMPORALE parola chiave indica che la colonna ReportingDate contiene i valori di passaggio utilizzata per ordinare i valori. Gli intervalli temporali possono essere date e ore, numeri interi o qualsiasi tipo di dati ordinati, purché i valori siano univoci e i dati vengano ordinati.

    Il testo e chiave parole chiave indicano che la colonna ModelRegion contiene una chiave della serie aggiuntiva. È consentita solo una chiave della serie e i valori della colonna devono essere distinti.

  4. Sostituire quanto segue:

    < predictable attribute columns> )  
    

    con:

    [Quantity] LONG CONTINUOUS PREDICT,  
    [Amount] DOUBLE CONTINUOUS PREDICT  
    )  
    
  5. Sostituire quanto segue:

    USING <algorithm name>([parameter list])  
    WITH DRILLTHROUGH  
    

    con:

    USING Microsoft_Time_Series
    (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    

    Il parametro AUTO_DETECT_PERIODICITY = 0.8, indica che si desidera che l'algoritmo rilevi cicli nei dati. L'impostazione di questo parametro su un valore prossimo a 1 consente di individuare numerosi modelli, ma può rallentare l'elaborazione.

    Il parametro FORECAST_METHOD, indica se si desidera che i dati vengano analizzati tramite ARTXP, ARIMA o una combinazione di entrambi.

    La parola chiave, WITH DRILLTHROUGH, specificare che si desidera essere in grado di visualizzare statistiche dettagliate nei dati di origine una volta completato il modello. È necessario aggiungere questa clausola se si desidera esplorare il modello tramite il Visualizzatore Microsoft Time Series. Tale clausola non è necessaria per l'esecuzione di stime.

    L'istruzione completa dovrebbe risultare analoga alla seguente:

    CREATE MINING MODEL [Forecasting_MIXED]  
         (  
        [Reporting Date] DATE KEY TIME,  
        [Model Region] TEXT KEY,  
        [Quantity] LONG CONTINUOUS PREDICT,  
        [Amount] DOUBLE CONTINUOUS PREDICT  
        )  
    USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
    WITH DRILLTHROUGH  
    
  6. Nel File menu, fare clic su Salva Dmxquery1.

  7. Nel Salva con nome la finestra di dialogo, individuare la cartella appropriata e denominare il file forecasting_mixed.

Esecuzione della query

Il passaggio conclusivo consiste nell'esecuzione della query. Dopo la creazione e il salvataggio di una query, è necessario eseguirla per creare il modello di data mining e la relativa struttura sul server. Per ulteriori informazioni sull'esecuzione di query nell'Editor di Query, vedere Editor di Query del motore di Database ( SQL Server Management Studio ).

Per eseguire la query

  • Nell'Editor di Query, sulla barra degli strumenti, fare clic su Execute.

    Lo stato della query viene visualizzato nel messaggi scheda nella parte inferiore dell'Editor di Query al termine dell'esecuzione dell'istruzione. Dovrebbero essere visualizzati i messaggi seguenti:

    Executing the query   
    Execution complete  
    

    Una nuova struttura denominata Forecasting_MIXED_Structure ora esistente nel server, insieme al modello di data mining correlato Forecasting_MIXED.

Nella prossima lezione, si aggiungerà un modello di data mining per il Forecasting_MIXED struttura di data mining appena creato.

Lezione successiva

Lezione 2: Aggiunta di modelli di data mining alla struttura di data mining Time Series

Vedere anche

Contenuto dei modelli di data mining per i modelli Time Series (Analysis Services - Data mining)
Riferimento tecnico per l'algoritmo Microsoft Time Series