Condividi tramite


Creazione della struttura del modello di data mining per il mailing diretto Targeted Mailing (Esercitazione sul data mining)

Il primo passaggio nella creazione di uno scenario relativo al mailing diretto consiste nell'utilizzo di Creazione guidata modello di data mining in Business Intelligence Development Studio per creare una nuova struttura e un nuovo modello di data mining basato su una struttura decisionale.

Ulteriori informazioni

Creazione guidata modello di data mining, Progettazione modelli di data mining, Algoritmo Microsoft Decision Trees

Per creare una struttura di data mining per uno scenario relativo al mailing diretto

  1. In Esplora soluzioni fare clic con il pulsante destro del mouse su Strutture di data mining e scegliere Nuova struttura di data mining.

    Verrà avviata Creazione guidata modello di data mining.

  2. Nella pagina iniziale Creazione guidata modello di data mining fare clic su Avanti.

  3. Nella pagina Selezione metodo di definizione verificare che sia selezionato il pulsante di opzione Da database relazionale o data warehouse esistente e quindi fare clic su Avanti.

  4. Nella pagina Selezione tecnica di data mining in Selezionare la tecnica di data mining che si desidera utilizzare selezionare Microsoft Decision Trees.

    In questa esercitazione verranno creati numerosi modelli basati su questa struttura di data mining iniziale. Il primo modello sarà creato congiuntamente alla struttura al termine della procedura guidata e sarà basato sull'algoritmo Microsoft Decision Trees.

  5. Fare clic su Avanti.

  6. Nella pagina Selezione vista origine dati è possibile constatare che Adventure Works DW è selezionato per impostazione predefinita. Fare clic su Sfoglia per visualizzare le tabelle nella vista origine dati e quindi fare clic su Chiudi per tornare alla procedura guidata.

  7. Fare clic su Avanti.

  8. Nella pagina Impostazione tipi di tabelle selezionare la casella di controllo nella colonna Case accanto alla tabella vTargetMail e quindi fare clic su Avanti.

  9. Nella pagina Impostazione dati di training verificare che la casella di controllo nella colonna Chiave sia selezionata accanto alla colonna CustomerKey.

    Se la tabella di origine nella vista origine dati indica una chiave, Creazione guidata modello di data mining sceglierà automaticamente tale colonna come chiave per il modello.

  10. Selezionare Input e Stimabile accanto alla colonna BikeBuyer.

    Quando si specifica che una colonna è stimabile, il pulsante Suggerisci viene abilitato. Quando si fa clic su Suggerisci viene visualizzata la finestra di dialogo Suggerisci colonne correlate in cui sono elencate le colonne più strettamente correlate alla colonna stimabile.

    Nella finestra di dialogo Suggerisci colonne correlate gli attributi vengono ordinati in base alla correlazione con l'attributo stimabile. Le colonne con un valore maggiore di 0,05 vengono automaticamente selezionate per essere incluse nel modello. Se si accettano i suggerimenti, fare clic su OK per contrassegnare le colonne selezionate come colonne di input della procedura guidata. Ai fini di questa esercitazione, ignorare i suggerimenti facendo clic su Annulla.

  11. Selezionare le caselle di controllo Input accanto alle colonne seguenti:

    • Age
    • CommuteDistance
    • EnglishEducation
    • EnglishOccupation
    • FirstName
    • Gender
    • GeographyKey
    • HouseOwnerFlag
    • LastName
    • MaritalStatus
    • NumberCarsOwned
    • NumberChildrenAtHome
    • Region
    • TotalChildren
    • YearlyIncome

    È possibile selezionare più colonne tenendo premuto MAIUSC.

  12. Fare clic su Avanti.

  13. Nella pagina Impostazione tipo di contenuto e dati delle colonne fare clic su Rileva.

    Verrà eseguito un algoritmo che campiona i dati numerici e determina se le colonne numeriche contengono valori discreti o continui. Ad esempio, una colonna può contenere informazioni sugli stipendi come valori effettivi, quindi continui, o interi che rappresentano intervalli di retribuzione, ad esempio 1 = < $25.000; 2 = da $25.000 a $50.000, che sono valori discreti.

  14. Dopo aver fatto clic su Rileva, verificare che le voci nelle colonne Tipo contenuto e Tipo di dati contengano i valori elencati nella tabella seguente.

    Colonna Tipo contenuto Tipo di dati

    Age

    Continuous

    Long

    BikeBuyer

    Discrete

    Long

    CommuteDistance

    Discrete

    Text

    CustomerKey

    Key

    Long

    EnglishEducation

    Discrete

    Text

    EnglishOccupation

    Discrete

    Text

    FirstName

    Discrete

    Text

    Gender

    Discrete

    Text

    GeographyKey

    Discrete

    Text

    HouseOwnerFlag

    Discrete

    Text

    LastName

    Discrete

    Text

    MaritalStatus

    Discrete

    Text

    NumberCarsOwned

    Discrete

    Long

    NumberChildrenAtHome

    Discrete

    Long

    Region

    Discrete

    Text

    TotalChildren

    Discrete

    Long

    YearlyIncome

    Continuous

    Double

[!NOTA] Esclusivamente in base ai valori numerici, l'algoritmo di data mining indica che la colonna GeographyKey contiene numeri continui. I numeri come i codici postali, tuttavia, devono di norma essere considerati valori discreti, piuttosto che valori numerici continui, perché operazioni matematiche mediante questi numeri sono prive di significato.

  1. Fare clic su Avanti.
  2. Nella pagina Completamento procedura guidata in Nome struttura di data mining digitare Targeted Mailing.
  3. In Nome modello di data mining digitare TM_Decision_Tree.
  4. Selezionare la casella di controllo Consenti drill-through.
  5. Fare clic su Fine.

Attività successiva della lezione

Modifica del modello Targeted Mailing (Esercitazione sul data mining)