Creazione di stime (Esercitazione di base sul data mining)
Dopo aver verificato il grado di accuratezza dei modelli di data mining, è possibile creare query di stima utilizzando il generatore delle query di stima nella scheda Stima modello di data mining di Progettazione modelli di data mining. Questa interfaccia consente di compilare query in DMX o nel linguaggio DMX (Data Mining Extensions). La sintassi di DMX è simile a quella di T-SQL e viene utilizzata specificamente per le query sugli oggetti di data mining.
Nel generatore delle query di stima sono disponibili tre viste. È possibile compilare ed esaminare la query utilizzando le visualizzazioni Progettazione e Query. È quindi possibile eseguire la query e visualizzare i risultati nella visualizzazione Risultato.
Per ulteriori informazioni sull'utilizzo del generatore delle query di stima, vedere Interfacce di query di data mining.
Creazione della query
Il primo passaggio per creare una query di stima consiste nel selezionare un modello di data mining e una tabella di input.
Per selezionare un modello e una tabella di input
Nella scheda Stima modello di data mining di Progettazione modelli di data mining, nella casella Modello di data mining fare clic su Seleziona modello.
Nella finestra di dialogo Seleziona modello di data mining esplorare l'albero e individuare la struttura Targeted Mailing, espanderla, selezionare TM_Decision_Tree e quindi fare clic su OK.
Nella casella Seleziona tabella/e di input fare clic su Seleziona tabella del case.
Nella finestra di dialogo Seleziona tabella selezionare Adventure Works DW Multidimensional 2012 nell'elenco Origine dati.
In Nome tabella/vista selezionare la tabella ProspectiveBuyer (dbo) e quindi fare clic su OK.
La tabella ProspectiveBuyer è quella che assomiglia maggiormente alla tabella del case vTargetMail.
Mapping delle colonne
Dopo aver selezionato la tabella di input, il generatore delle query di stima crea un mapping predefinito tra il modello di data mining e la tabella di input in base ai nomi delle colonne. Almeno una colonna della struttura deve corrispondere a una colonna dei dati esterni.
Importante |
---|
I dati utilizzati per determinare l'accuratezza dei modelli devono contenere una colonna della quale è possibile eseguire il mapping alla colonna stimabile. Se tale colonna non esiste, è possibile crearne una con valori vuoti, ma deve contenere lo stesso tipo di dati della colonna stimabile. |
Per eseguire il mapping tra le colonne della struttura e le colonne della tabella di input
Fare clic con il pulsante destro del mouse sulle linee che connettono la finestra Modello di data mining alla finestra Seleziona tabella di input e scegliere Modifica connessioni.
Si noti che non su tutte le colonne viene eseguito il mapping. In questo esempio verrà eseguito il mapping di diverse colonne di Colonne tabella. Verrà inoltre generata una nuova colonna per la data di nascita in base alla colonna della data corrente in modo da ottenere una maggiore corrispondenza tra le colonne.
In Colonna tabella fare clic sulla cella Acquirente bicicletta e selezionare ProspectiveBuyer.Unknown nell'elenco a discesa.
Verrà eseguito il mapping della colonna stimabile [Bike Buyer] a una colonna della tabella di input.
Fare clic su OK.
In Esplora soluzioni fare clic con il pulsante destro del mouse sulla vista origine dati Mailing diretto, quindi scegliere Visualizza finestra di progettazione.
Fare clic con il pulsante destro del mouse sulla tabella ProspectiveBuyer e scegliere Nuovo calcolo denominato.
Nella finestra di dialogo Crea calcolo denominato digitare calcAge per Nome colonna.
Per Descrizione digitare Calcolare l'età in base alla data di nascita.
Nella casella Espressione digitare DATEDIFF(YYYY,[BirthDate],getdate()), quindi fare clic su OK.
Poiché la tabella di input non contiene una colonna Età che corrisponde a quella del modello, è possibile utilizzare questa espressione per calcolare l'età del cliente dalla colonna BirthDate della tabella di input. Poiché la colonna Età è stata identificata come la colonna più influente per la stima dell'acquisto di biciclette, deve esistere sia nel modello che nella tabella di input.
In Progettazione modelli di data mining selezionare la scheda Stima modello di data mining e aprire nuovamente la finestra Modifica connessioni.
In Colonna tabella fare clic sulla cella Età e selezionare ProspectiveBuyer.calcAge nell'elenco a discesa.
Attenzione Se la colonna non viene visualizzata nell'elenco, potrebbe essere necessario aggiornare la definizione della vista origine dati caricata nella finestra di progettazione. A tale scopo, scegliere Salva tutti dal menu File, quindi chiudere e riaprire il progetto nella finestra di progettazione.
Scegliere OK.
Progettazione della query di stima
Per progettare la query di stima
Il primo pulsante della barra degli strumenti della scheda Stima modello di data mining è il pulsante Passa alla visualizzazione della struttura della query / Passa alla visualizzazione dei risultati della query. Fare clic sulla freccia in giù di questo pulsante e selezionare Progettazione.
Nella griglia della scheda Stima modello di data mining fare clic sulla cella nella prima riga vuota della colonna Origine, quindi selezionare Funzione di stima.
Nella riga Funzione di stima selezionare PredictProbability nella colonna Campo.
Nella colonna Alias della stessa riga digitare Probabilità del risultato.
Nella finestra Modello di data mining selezionare e trascinare [Bike Buyer] nella cella Criteri/Argomento.
Rilasciando la selezione, nella cella Criteri/Argomento verrà visualizzato [TM_Decision_Tree].[Bike Buyer] .
In questo modo viene specificata la colonna di destinazione per la funzione PredictProbability. Per ulteriori informazioni sulle funzioni, vedere Guida di riferimento alle funzioni DMX (Data Mining Extensions).
Fare clic sulla riga vuota successiva nella colonna Origine, quindi selezionare TM_Decision_Tree mining model.
Nella riga TM_Decision_Tree della colonna Campo selezionare Bike Buyer.
Nella riga TM_Decision_Tree della colonna Criteri/Argomento digitare = 1.
Fare clic sulla riga vuota successiva nella colonna Origine, quindi selezionare la tabella ProspectiveBuyer.
Nella riga ProspectiveBuyer della colonna Campo selezionare ProspectiveBuyerKey.
Verrà aggiunto un identificatore univoco alla query di stima che consente di identificare la probabilità di acquisto di una bicicletta da parte dei singoli clienti.
Aggiungere altre cinque righe alla griglia. Per ogni riga selezionare la tabella ProspectiveBuyer come Origine, quindi aggiungere le colonne seguenti nelle celle Campo:
calcAge
LastName
FirstName
AddressLine1
AddressLine2
Eseguire infine la query e visualizzare i risultati.
Per eseguire la query e visualizzare i risultati
Nella scheda Stima modello di data mining selezionare il pulsante Risultato.
Dopo l'esecuzione della query e la visualizzazione dei risultati, è possibile rivedere i risultati.
Nella scheda Stima modello di data mining vengono visualizzate le informazioni di contatto dei potenziali clienti che saranno probabilmente acquirenti di biciclette. La colonna Probabilità del risultato indica la probabilità che la stima sia corretta. È possibile utilizzare questi risultati per determinare quali tra i clienti potenziali sono da considerare come potenziali destinatari di messaggi promozionali.
A questo punto, è possibile salvare i risultati. Sono disponibili tre opzioni:
Fare clic con il pulsante destro del mouse su una riga di dati nei risultati e selezionare Copia per salvare solo il valore (e l'intestazione della colonna) negli Appunti.
Fare clic con il pulsante destro del mouse su qualsiasi riga nei risultati e selezionare Copia tutto per copiare tutto il set di risultati, incluse le intestazioni delle colonne, negli Appunti.
Fare clic su Salva risultati query per salvare i risultati direttamente in un database come segue:
Nella finestra di dialogo Salva risultati query di data mining selezionare un'origine dati o definirne una nuova.
Digitare un nome per la tabella in cui saranno contenuti i risultati della query.
Utilizzare l'opzione Aggiungi a vista origine dati per creare la tabella e aggiungerla a una vista origine dati esistente. Questa opzione è utile se si desidera mantenere tutte le tabelle correlate per un modello, quali dati di training, dati di stima dell'origine e risultati query, nella stessa vista origine dati.
Utilizzare l'opzione Sovrascrivi se esistente per aggiornare una tabella esistente con i risultati più recenti.
È necessario utilizzare l'opzione per sovrascrivere la tabella se sono state aggiunte tutte le colonne alla query di stima, modificati i nomi o i tipi di dati di tutte le colonne nella query di stima o se sono state eseguite tutte le istruzioni ALTER sulla tabella di destinazione.
Inoltre, in caso di più colonne con lo stesso nome, ad esempio il nome predefinito della colonna Espressione, è necessario creare un alias per le colonne con nomi duplicati, altrimenti verrà generato un errore quando tramite la finestra di progettazione si tenta di salvare i risultati in SQL Server. Il motivo è che SQL Server non consente più colonne con lo stesso nome.
Per ulteriori informazioni, vedere Finestra di dialogo Salva risultati query di data mining (visualizzazione Stima modello di data mining).
Attività successiva nella lezione
Utilizzo del drill-through sui dati della struttura (Esercitazione di base sul data mining)
Vedere anche
Attivitá
Creare una query di stima utilizzando Generatore query di stima