Condividi tramite


Creazione di stime (esercitazione di base sul data mining)

Dopo aver testato l'accuratezza dei modelli di data mining e aver deciso che i risultati sono soddisfacenti, è quindi possibile generare predizioni usando il Generatore di query di stima nella scheda Stima modello di data mining nella Progettazione modelli di data mining.

Il generatore di query predittive ha tre visualizzazioni. Con le viste Progettazione e Query è possibile compilare ed esaminare la query. È quindi possibile eseguire la query e visualizzare i risultati nella visualizzazione Risultato .

Tutte le query di previsione utilizzano DMX, abbreviazione di linguaggio di estensioni per il data mining (DMX). DMX ha una sintassi simile a quella di T-SQL, ma viene usata per le query sugli oggetti di data mining. Anche se la sintassi DMX non è complicata, l'uso di un generatore di query come questo, o quello in SQL Server Data Mining Add-Ins per Office, semplifica notevolmente la selezione degli input e delle espressioni di compilazione, pertanto è consigliabile apprendere le nozioni di base.

Creazione della query

Il primo passaggio per la creazione di una query di stima consiste nel selezionare un modello di data mining e una tabella di input.

Per selezionare un modello e una tabella di input

  1. Nella scheda Predizione del Modello di Mining di Data Mining Designer, nella casella Modello di Mining, fare clic su Seleziona Modello.

  2. Nella finestra di dialogo Seleziona modello di data mining passare attraverso l'albero alla struttura Mailing mirato , espandere la struttura, selezionare TM_Decision_Treee quindi fare clic su OK.

  3. Nella casella Seleziona tabelle di input, clicca su Seleziona tabella di casi.

  4. Nell'elenco Origine dati della finestra di dialogo Seleziona tabella selezionare la vista origine dati Adventure Works DW Multidimensional 2012.

  5. In Nome tabella/vista selezionare la tabella ProspectiveBuyer (dbo) e quindi fare clic su OK.

    La ProspectiveBuyer tabella assomiglia più da vicino alla tabella dei casi vTargetMail.

Mappatura delle colonne

Dopo aver selezionato la tabella di input, Generatore di query di predizione crea un mapping predefinito tra il modello di mining e la tabella di input, in base ai nomi delle colonne. Almeno una colonna della struttura deve corrispondere a una colonna nei dati esterni.

Importante

I dati usati per determinare l'accuratezza dei modelli devono contenere una colonna di cui è possibile eseguire il mapping alla colonna stimabile. Se tale colonna non esiste, è possibile crearne una con valori vuoti, ma deve avere lo stesso tipo di dati della colonna stimabile.

Per associare gli input al modello

  1. Fare clic con il pulsante destro del mouse sulle righe che collegano la finestra Modello di data mining alla finestra Seleziona tabella di input e scegliere Modifica connessioni.

    Si noti che non viene eseguito il mapping di tutte le colonne. Verranno aggiunte diverse mappature per le colonne della tabella. Verrà inoltre generata una nuova colonna data di nascita in base alla colonna data corrente, in modo che le colonne corrispondano meglio.

  2. In Colonna della tabella, fare clic sulla Bike Buyer cella, successivamente selezionare ProspectiveBuyer.Unknown dall'elenco a discesa.

    Esegue il mapping della colonna prevedibile, [Bike Buyer], in una colonna della tabella di input.

  3. Fare clic su OK.

  4. In Esplora soluzioni, fare clic con il pulsante destro del mouse sulla vista Mailing mirato e selezionare Visualizza Progettazione.

  5. Fare clic con il pulsante destro del mouse sulla tabella, ProspectiveBuyer e scegliere Nuovo calcolo denominato.

  6. Nella finestra di dialogo Crea calcolo denominato, per Nome colonna, digitare calcAge.

  7. Per Descrizione digitare Calcola età in base alla data di nascita.

  8. Nella casella Espressione digitare DATEDIFF(YYYY,[BirthDate],getdate()) e quindi fare clic su OK.

    Poiché la tabella di input non ha una colonna Age corrispondente a quella nel modello, è possibile usare questa espressione per calcolare l'età del cliente dalla colonna BirthDate nella tabella di input. Poiché Age è stata identificata come la colonna più influente per la stima dell'acquisto di biciclette, deve esistere sia nel modello che nella tabella di input.

  9. Nel Data Mining Designer, selezionare la scheda Modello di previsione di data mining e riaprire la finestra Modifica connessioni.

  10. Sotto Colonna tabella fare clic sulla cella Age e selezionare ProspectiveBuyer.calcAge nell'elenco a discesa.

    Avvertimento

    Se la colonna non viene visualizzata nell'elenco, potrebbe essere necessario aggiornare la definizione della vista origine dati caricata nella finestra di progettazione. A tale scopo, scegliere Salva tutto dal menu File e quindi chiudere e riaprire il progetto nella finestra di progettazione.

  11. Fare clic su OK.

Progettazione della query di predizione

  1. Il primo pulsante sulla barra degli strumenti della scheda Stima modello di data mining è il pulsante Passa alla visualizzazione progettazione/Passa alla visualizzazione dei risultati/Passa alla visualizzazione query . Fare clic sulla freccia giù su questo pulsante e selezionare Progetta.

  2. Nella griglia della scheda Stima modello di data mining fare clic sulla cella nella prima riga vuota nella colonna Origine e quindi selezionare Funzione di stima.

  3. Nella colonna Campo della riga Funzione di stima selezionare PredictProbability.

    Nella colonna Alias della stessa riga digitare Probabilità del risultato.

  4. Nella finestra Modello di data mining precedente selezionare e trascinare [Bike Buyer] nella cella Criteri/Argomento .

    Quando si lascia andare, [TM_Decision_Tree]. [Bike Buyer] viene visualizzato nella cella Criteri/Argomento .

    Specifica la colonna di destinazione per la PredictProbability funzione. Per altre informazioni sulle funzioni, vedere Informazioni di riferimento sulle funzioni DMX (Data Mining Extensions).

  5. Fare clic sulla riga vuota successiva nella colonna Origine e quindi selezionare TM_Decision_Tree modello di data mining.

  6. Nella riga TM_Decision_Tree, nella colonna Campo, selezionare Bike Buyer.

  7. Nella riga TM_Decision_Tree, nella colonna Criteri/Argomento, digitare =1.

  8. Fare clic sulla riga vuota successiva nella colonna Source e quindi selezionare La tabella ProspectiveBuyer.

  9. Nella riga ProspectiveBuyer, nella colonna Campo, selezionare ProspectiveBuyerKey.

    In questo modo viene aggiunto l'identificatore univoco alla query di stima in modo da poter identificare chi è e chi non è probabile che acquisti una bicicletta.

  10. Aggiungere altre cinque righe alla griglia. Per ogni riga, selezionare Prospettica-TabellaBuyer come Fonte e quindi aggiungere le colonne seguenti nelle celle Campo:

    • calcAge

    • Cognome

    • Nome di battesimo

    • AddressLine1

    • AddressLine2

Infine, eseguire la query e visualizzare i risultati.

Il Builder di Query Predittive comprende inoltre questi controlli:

  • Mostra casella di controllo

    Consente di rimuovere le clausole dalla query senza doverle eliminare dalla finestra di progettazione. Ciò può essere utile quando si lavora con query complesse e si vuole mantenere la sintassi senza dover copiare e incollare DMX nella finestra.

  • Gruppo

    Inserisce una parentesi aperta (sinistra) all'inizio della riga selezionata oppure inserisce una parentesi di chiusura (a destra) alla fine della riga corrente.

  • E/O

    Inserisce l'operatore AND o l'operatore OR immediatamente dopo la funzione o la colonna corrente.

Per eseguire la query e visualizzare i risultati

  1. Nella scheda Stima modello di data mining selezionare il pulsante Risultato .

  2. Dopo l'esecuzione della query e i risultati vengono visualizzati, è possibile esaminare i risultati.

    Nella scheda Stima modello di data mining vengono visualizzate le informazioni di contatto per i potenziali clienti che potrebbero essere acquirenti di biciclette. La colonna Probabilità di risultato indica la probabilità che la stima sia corretta. È possibile usare questi risultati per determinare i potenziali clienti a cui indirizzare la distribuzione.

  3. A questo punto, è possibile salvare i risultati. Si dispone di tre opzioni:

    • Fare clic con il pulsante destro del mouse su una riga di dati nei risultati e selezionare Copia per salvare solo tale valore (e l'intestazione di colonna) negli Appunti.

    • Fare clic con il pulsante destro del mouse su qualsiasi riga nei risultati e scegliere Copia tutto per copiare l'intero set di risultati, incluse le intestazioni di colonna, negli Appunti.

    • Fare clic su Salva risultato della query per salvare i risultati direttamente in un database come indicato di seguito:

      1. Nella finestra di dialogo Salva risultato query di data mining è possibile selezionare un'origine dati o definire una nuova origine dati.

      2. Digitare un nome per la tabella che conterrà i risultati della query.

      3. Utilizzare l'opzione Aggiungi alla DSV per creare la tabella e aggiungerla a una vista del'origine dati esistente. Ciò è utile se si desidera mantenere tutte le tabelle correlate per un modello, ad esempio dati di training, dati sorgente di previsione e risultati di query, nella stessa vista della fonte dati.

      4. Usare l'opzione Sovrascrivi se esistente per aggiornare una tabella esistente con i risultati più recenti.

        È necessario utilizzare l'opzione per sovrascrivere la tabella se sono state aggiunte colonne alla query di stima, sono stati modificati i nomi o i tipi di dati di qualsiasi colonna nella query di stima oppure se sono state eseguite istruzioni ALTER nella tabella di destinazione.

        Inoltre, se più colonne hanno lo stesso nome( ad esempio, espressione nome colonna predefinita), è necessario creare un alias per le colonne con nomi duplicati oppure verrà generato un errore quando la finestra di progettazione tenta di salvare i risultati in SQL Server. Il motivo è che SQL Server non consente a più colonne di avere lo stesso nome.

        Per ulteriori informazioni, vedere Finestra di dialogo Salva il Risultato della Query di Data Mining (Vista Predizione Modello di Data Mining).

Attività successiva nella lezione

Uso del drill-through su dati strutturati (Esercitazione di base sul Data Mining)

Vedere anche

Creare una query di predizione usando il Generatore di query di predizione