Condividi tramite


Creazione di una struttura del modello di data mining Targeted Mailing (Esercitazione di base sul data mining)

Il primo passaggio nella creazione di uno scenario di distribuzione di destinazione consiste nell'usare la Creazione guidata data mining in SQL Server Data Tools (SSDT) per creare una nuova struttura di data mining e un nuovo modello di data mining ad albero delle decisioni.

In questa attività verrà configurata una nuova struttura di data mining e verrà aggiunto un modello di data mining iniziale basato sull'algoritmo Microsoft Decision Trees. Per creare la struttura, verranno innanzitutto selezionate le tabelle e le viste, quindi si identificheranno le colonne da utilizzare rispettivamente per il training e per il testing.

Per creare una struttura di data mining per lo scenario relativo al mailing diretto

  1. In Esplora soluzioni fare clic con il pulsante destro del mouse su Strutture di data mining e scegliere Nuova struttura di data mining per avviare la Creazione guidata data mining.

  2. Nella pagina iniziale Creazione guidata modello di data mining fare clic su Avanti.

  3. Nella pagina Selezionare il metodo di definizione verificare che dal database relazionale esistente o dal data warehouse sia selezionato e quindi fare clic su Avanti.

  4. Nella pagina Crea struttura di data mining , in Quale tecnica di data mining si vuole usare?, selezionare Microsoft Decision Trees.

    Nota

    Se viene visualizzato un avviso relativo al mancato rilevamento di algoritmi di data mining, è possibile che le proprietà del progetto non siano state configurate correttamente. Questo avviso si verifica quando il progetto tenta di recuperare un elenco di algoritmi di data mining dal server Analysis Services e non riesce a trovare il server. Per impostazione predefinita, SQL Server Data Tools userà localhost come server. Se si utilizza un'istanza diversa o un'istanza denominata, è necessario modificare le proprietà del progetto. Per altre informazioni, vedere Creazione di un progetto Analysis Services (esercitazione di base sul data mining).

  5. Fare clic su Avanti.

  6. Nella pagina Seleziona visualizzazione origine dati selezionareMailing di destinazione nel riquadro Visualizzazioni origine dati disponibili. È possibile fare clic su Sfoglia per visualizzare le tabelle nella visualizzazione origine dati e quindi fare clic su Chiudi per tornare alla procedura guidata.

  7. Fare clic su Avanti.

  8. Nella pagina Specifica tipi di tabella selezionare la casella di controllo nella colonna Case per vTargetMail da usare come tabella case e quindi fare clic su Avanti. La tabella ProspectiveBuyer verrà utilizzata in un secondo momento per il testing. Per il momento, ignorarla.

  9. Nella pagina Specificare i dati di training si identifica almeno una colonna stimabile, una colonna chiave e una colonna di input per il modello. Selezionare la casella di controllo nella colonna Stimabile nella riga BikeBuyer .

    Nota

    Si noti il messaggio di avviso nella parte inferiore della finestra. Non sarà possibile passare alla pagina successiva finché non si seleziona almeno un input e una colonna stimabile .

  10. Fare clic su Suggerisci per aprire la finestra di dialogo Suggerisci colonne correlate .

    Il pulsante Suggerisci è abilitato ogni volta che è stato selezionato almeno un attributo stimabile. La finestra di dialogo Suggerisci colonne correlate elenca le colonne più strettamente correlate alla colonna stimabile e ordina gli attributi in base alla correlazione con l'attributo stimabile. Le colonne che presentano una correlazione significativa (confidenza maggiore del 95%) vengono selezionate automaticamente per essere incluse nel modello.

    Esaminare i suggerimenti e quindi fare clic su Annulla perignore i suggerimenti.

    Nota

    Se si fa clic su OK, tutti i suggerimenti elencati verranno contrassegnati come colonne di input nella procedura guidata. Se si accetta solo una parte dei suggerimenti, è necessario modificare i valori manualmente.

  11. Verificare che la casella di controllo nella colonna Chiave sia selezionata nella riga CustomerKey .

    Nota

    Se la tabella di origine nella vista origine dati indica una chiave, Creazione guidata modello di data mining sceglierà automaticamente tale colonna come chiave per il modello.

  12. Selezionare le caselle di controllo nella colonna Input nelle righe seguenti. È possibile selezionare più colonne evidenziando un intervallo di celle e premendo CTRL mentre si seleziona una casella di controllo.

    • Age

    • CommuteDistance

    • EnglishEducation

    • EnglishOccupation

    • Gender

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NumberChildrenAtHome

    • Area

    • TotalChildren

    • YearlyIncome

  13. Nella colonna all'estrema sinistra della pagina selezionare le caselle di controllo relative alle righe seguenti.

    • AddressLine1

    • AddressLine2

    • DateFirstPurchase

    • EmailAddress

    • FirstName

    • LastName

    Assicurarsi che queste righe contengano segni di spunta solo nella colonna sinistra. Le colonne corrispondenti verranno aggiunte alla struttura ma non verranno incluse nel modello. Tuttavia, dopo la compilazione del modello, saranno disponibili per il drill-through e il testing. Per altre informazioni sul drill-through, vedere Query drill-through (data mining)

  14. Fare clic su Avanti.

Attività successiva della lezione

Impostazione del tipo di dati e contenuto (Esercitazione di base sul data mining)

Vedere anche

Impostazione tipi di tabelle (Creazione guidata modello di data mining)
Data Mining Designer
Algoritmo Microsoft Decision Trees