Creazione di stime (Esercitazione di base sul data mining)

Articolo
03/06/2017

Dopo aver testato l'accuratezza dei modelli di data mining e aver deciso di essere soddisfatti dei risultati, è quindi possibile generare stime usando Generatore query di stima nella scheda Stima modello di data mining nell'Designer di data mining.

Nel generatore delle query di stima sono disponibili tre viste. Con le viste Progettazione e Query è possibile compilare ed esaminare la query. È quindi possibile eseguire la query e visualizzare i risultati nella visualizzazione Risultato .

Tutte le query di stima utilizzano DMX, ovvero la forma abbreviata per il linguaggio Data Mining Extensions (DMX). La sintassi di DMX è simile a quella di T-SQL e viene utilizzata specificamente per le query sugli oggetti di data mining. Anche se la sintassi DMX non è complicata, l'uso di un generatore di query come questo o quello nel SQL Server data mining Add-Ins per Office, rende molto più semplice selezionare input ed espressioni di compilazione, quindi è consigliabile apprendere le nozioni di base.

Creazione della query

Il primo passaggio per creare una query di stima consiste nel selezionare un modello di data mining e una tabella di input.

Per selezionare un modello e una tabella di input

Nella scheda Stima modello di data mining di data mining Designer fare clic su Seleziona modello nella casella Modello di data mining.
Nella finestra di dialogo Seleziona modello di data mining passare attraverso l'albero alla struttura Mailing mirato , espandere la struttura, selezionare TM_Decision_Treee quindi fare clic su OK.
Nella casella Seleziona tabelle di input fare clic su Seleziona tabella case.
Nell'elenco Origine dati della finestra di dialogo Seleziona tabella selezionare la vista origine dati Adventure Works DW Multidimensional 2012.
In Nome tabella/vista selezionare la tabella ProspectBuyer (dbo) e quindi fare clic su OK.

La ProspectiveBuyer tabella è molto simile alla tabella del case vTargetMail .

Mapping delle colonne

Dopo aver selezionato la tabella di input, il generatore delle query di stima crea un mapping predefinito tra il modello di data mining e la tabella di input in base ai nomi delle colonne. Almeno una colonna della struttura deve corrispondere a una colonna dei dati esterni.

Importante

I dati utilizzati per determinare l'accuratezza dei modelli devono contenere una colonna della quale è possibile eseguire il mapping alla colonna stimabile. Se tale colonna non esiste, è possibile crearne una con valori vuoti, ma deve contenere lo stesso tipo di dati della colonna stimabile.

Per eseguire il mapping degli input al modello

Fare clic con il pulsante destro del mouse sulle righe che collegano la finestra Modello di data mining alla finestra Seleziona tabella di input e selezionare Modifica connessioni.

Si noti che non su tutte le colonne viene eseguito il mapping. Verranno aggiunti mapping per diverse colonne di tabella. Verrà inoltre generata una nuova colonna per la data di nascita in base alla colonna della data corrente in modo da ottenere una maggiore corrispondenza tra le colonne.
In Colonna tabella fare clic sulla Bike Buyer cella e selezionare ProspectBuyer.Unknown nell'elenco a discesa.

Verrà eseguito il mapping della colonna stimabile [Bike Buyer] a una colonna della tabella di input.
Fare clic su OK.
In Esplora soluzioni fare clic con il pulsante destro del mouse sulla vista origine dati Di destinazione e scegliere Visualizza Designer.
Fare clic con il pulsante destro del mouse sulla tabella, ProspectBuyer e scegliere Nuovo calcolo denominato.
Nella finestra di dialogo Crea calcolo denominato digitare per NomecalcAge colonna .
Per Descrizione digitare Calcola l'età in base alla data di nascita.
Nella casella Espressione digitare DATEDIFF(YYYY,[BirthDate],getdate()) e quindi fare clic su OK.

Poiché la tabella di input non ha una colonna Age corrispondente a quella nel modello, è possibile usare questa espressione per calcolare l'età del cliente dalla colonna BirthDate nella tabella di input. Poiché Age è stata identificata come la colonna più influente per la stima dell'acquisto di biciclette, deve esistere sia nel modello che nella tabella di input.
In Data mining Designer selezionare la scheda Stima modello di data mining e riaprire la finestra Modifica connessioni.
In Colonna tabella fare clic sulla cella Age e selezionare ProspectBuyer.calcAge nell'elenco a discesa.

Avviso

Se la colonna non viene visualizzata nell'elenco, potrebbe essere necessario aggiornare la definizione della vista origine dati caricata nella finestra di progettazione. A tale scopo, scegliere Salva tutto dal menu File e quindi chiudere e riaprire il progetto nella finestra di progettazione.
Fare clic su OK.

Progettazione della query di stima

Il primo pulsante sulla barra degli strumenti della scheda Stima modello di data mining è il pulsante Passa alla visualizzazione progettazione/Passa alla visualizzazione risultati/Passa alla visualizzazione query . Fare clic sulla freccia giù su questo pulsante e selezionare Progetta.
Nella griglia della scheda Stima modello di data mining fare clic sulla cella nella prima riga vuota nella colonna Origine e quindi selezionare Funzione di stima.
Nella colonna Campo della riga Funzione di stima selezionare PredictProbability.

Nella colonna Alias della stessa riga digitare Probabilità del risultato.
Nella finestra Modello di data mining precedente selezionare e trascinare [Bike Buyer] nella cella Criteri/Argomento .

Quando si lascia andare, [TM_Decision_Tree]. [Bike Buyer] viene visualizzato nella cella Criteri/Argomento .

In questo modo viene specificata la colonna di destinazione per la funzione PredictProbability. Per altre informazioni sulle funzioni, vedere Informazioni di riferimento sulle funzioni DMX (Data Mining Extensions).
Fare clic sulla riga vuota successiva nella colonna Origine e quindi selezionare TM_Decision_Tree modello di data mining.
TM_Decision_Tree Nella riga, nella colonna Campo selezionare Bike Buyer.
TM_Decision_Tree Nella riga digitare nella colonna =1Criteri/Argomento .
Fare clic sulla riga vuota successiva nella colonna Origine e quindi selezionare La tabella ProspectBuyer.
ProspectiveBuyer Nella riga, nella colonna Campo selezionare ProspectBuyerKey.

Verrà aggiunto un identificatore univoco alla query di stima che consente di identificare la probabilità di acquisto di una bicicletta da parte dei singoli clienti.
Aggiungere altre cinque righe alla griglia. Per ogni riga selezionare PotenzialeBuyer tabella come Origine e quindi aggiungere le colonne seguenti nelle celle Campo :
- calcAge
- LastName
- FirstName
- AddressLine1
- AddressLine2

Eseguire infine la query e visualizzare i risultati.

Il Generatore di query di stima include anche questi controlli:

Mostra casella di controllo

Consente di rimuovere le clausole dalla query senza doverle eliminare dalla finestra di progettazione. Questa operazione può risultare utile quando si utilizzano query complesse e si desidera mantenere la sintassi senza dover copiare e incollare il codice DMX nella finestra.
Gruppo

Inserisce una parentesi (sinistra) di apertura all'inizio della riga selezionata o inserisce una parentesi (destra) di chiusura alla fine della riga corrente.
O

Inserisce l'operatore o l'operatore ANDOR immediatamente dopo la funzione o la colonna corrente.

Per eseguire la query e visualizzare i risultati

Nella scheda Stima modello di data mining selezionare il pulsante Risultato .
Dopo l'esecuzione della query e la visualizzazione dei risultati, è possibile rivedere i risultati.

Nella scheda Stima modello di data mining vengono visualizzate le informazioni di contatto per i potenziali clienti che potrebbero essere acquirenti di biciclette. La colonna Probabilità di risultato indica la probabilità che la stima sia corretta. È possibile utilizzare questi risultati per determinare quali tra i clienti potenziali sono da considerare come potenziali destinatari di messaggi promozionali.
A questo punto, è possibile salvare i risultati. Sono disponibili tre opzioni:
- Fare clic con il pulsante destro del mouse su una riga di dati nei risultati e scegliere Copia per salvare solo tale valore (e l'intestazione di colonna) negli Appunti.
- Fare clic con il pulsante destro del mouse su qualsiasi riga nei risultati e scegliere Copia tutto per copiare l'intero set di risultati, incluse le intestazioni di colonna, negli Appunti.
- Fare clic su Salva risultato della query per salvare i risultati direttamente in un database come indicato di seguito:
  1. Nella finestra di dialogo Salva risultato query di data mining selezionare un'origine dati o definire una nuova origine dati.
  2. Digitare un nome per la tabella in cui saranno contenuti i risultati della query.
  3. Usare l'opzione Aggiungi a DSV per creare la tabella e aggiungerla a una vista origine dati esistente. Ciò è utile se si desidera mantenere tutte le tabelle correlate per un modello, ad esempio dati di training, dati di origine stima e risultati di query nella stessa vista origine dati.
  4. Usare l'opzione Sovrascrivi se esistente per aggiornare una tabella esistente con i risultati più recenti.
    
    È necessario utilizzare l'opzione per sovrascrivere la tabella se sono state aggiunte tutte le colonne alla query di stima, modificati i nomi o i tipi di dati di tutte le colonne nella query di stima o se sono state eseguite tutte le istruzioni ALTER sulla tabella di destinazione.
    
    Inoltre, se più colonne hanno lo stesso nome(ad esempio, l'espressione nome colonna predefinita) è necessario creare un alias per le colonne con nomi duplicati oppure verrà generato un errore quando la finestra di progettazione tenta di salvare i risultati in SQL Server. Il motivo è che SQL Server non consente più colonne con lo stesso nome.
    
    Per altre informazioni, vedere Finestra di dialogo Salva risultato query di data mining (vista stima modello di data mining).

Attività successiva della lezione

Utilizzo del drill-through sui dati della struttura (Esercitazione di base sul data mining)

Vedere anche

Creare una query di stima utilizzando Generatore query di stima

Condividi tramite