Condividi tramite


Creazione di una struttura del modello di data mining Sequence Clustering (Esercitazione intermedia sul data mining)

Il primo passaggio nella creazione di un modello di data mining Sequence Clustering consiste nell'utilizzo della Creazione guidata modello di data mining per la creazione di una nuova struttura di data mining e di un modello di data mining sulla base dell'algoritmo Microsoft Sequence Clustering.

Verrà utilizzata la stessa vista origine dati impiegata per l'analisi degli acquisti, ma si aggiungerà una colonna che contiene l'identificatore sequence. In questo scenario la sequenza indica l'ordine in cui il cliente ha incluso gli articoli tra gli acquisti.

Verranno anche aggiunte alcune colonne utilizzate in uno dei modelli per raggruppare i clienti in base ai dati demografici.

Per creare una struttura e un modello di data mining Sequence Clustering

  1. In Esplora soluzioni di SQL Server Data Tools (SSDT) fare clic con il pulsante destro del mouse su Strutture di data mining e scegliere Nuova struttura di data mining.

  2. Nella pagina iniziale di Creazione guidata modello di data mining scegliere Avanti.

  3. Nella pagina Selezione metodo di definizione verificare che sia selezionato il pulsante di opzione Da database relazionale o data warehouse esistente e quindi scegliere Avanti.

  4. Nella pagina Crea la struttura di data mining verificare che l'opzione Crea struttura di data mining con un modello di data mining sia selezionata. Selezionare quindi l'opzione Selezionare la tecnica di data mining che si desidera utilizzare nell'elenco a discesa, quindi fare clic su Microsoft Sequence Clustering. Scegliere Avanti.

    Verrà visualizzata la pagina Selezione vista origine dati. In Viste origine dati disponibili selezionare Orders.

    Orders è la stessa vista origine dati utilizzata per lo scenario di analisi degli acquisti. Se questa vista origine dati non è stata creata, vedere Aggiunta di una vista origine dati con tabelle nidificate (Esercitazione intermedia sul data mining).

  5. Fare clic su Avanti.

  6. Nella pagina Impostazione tipi di tabelle selezionare la casella di controllo Case accanto alla tabella vAssocSeqOrders, quindi selezionare la casella di controllo Nidificata accanto alla tabella vAssocSeqLineItems. Fare clic su Avanti.

    [!NOTA]

    Se si verifica un errore quando si selezionano le caselle di controllo Case o Nidificata, il join nella vista origine dati potrebbe non essere corretto. La tabella nidificata, vAssocSeqLineItems, deve essere connessa alla tabella del case, vAssocSeqOrders, tramite un join molti-a-uno. È possibile modificare la relazione facendo clic con il pulsante destro del mouse sulla linea di join e invertendo la direzione del join. Per ulteriori informazioni, vedere Finestra di dialogo Crea relazione o Modifica relazione (Analysis Services - Dati multidimensionali).

  7. Nella pagina Impostazione dati di training scegliere le colonne da utilizzare nel modello selezionando una casella di controllo come segue:

    • **IncomeGroup    **Selezionare la casella di controllo Input.

      Questa colonna contiene interessanti informazioni sui clienti che è possibile utilizzare per il clustering. Verranno utilizzate nel primo modello e ignorate nel secondo modello.

    • **OrderNumber    **Selezionare la casella di controllo Chiave.

      Questo campo sarà utilizzato come identificatore per la tabella del case o Key. In generale, è consigliabile non utilizzare mai il campo chiave della tabella del case come input, perché la chiave contiene valori univoci che non sono utili per il clustering.

    • **Region    **Selezionare la casella di controllo Input.

      Questa colonna contiene interessanti informazioni sui clienti che è possibile utilizzare per il clustering. Verranno utilizzate nel primo modello e ignorate nel secondo modello.

    • LineNumber Selezionare le caselle di controllo Chiave e Input.

      Il campo LineNumber sarà utilizzato come identificatore per la tabella nidificata o Sequence Key. La chiave di una tabella nidificata deve essere sempre utilizzata per l'input.

    • **Model   **Selezionare le caselle di controllo Input e Stimabile.

    Verificare che le selezioni siano corrette, quindi fare clic su Avanti.

  8. Nella pagina Impostazione tipo di contenuto e dati delle colonne verificare che la griglia contenga le colonne, i tipi di contenuto e i tipi di dati indicati nella tabella seguente, quindi fare clic su Avanti.

    Tabelle/Colonne

    Tipo di contenuto

    Tipo di dati

    IncomeGroup

    Discreto

    Text

    OrderNumber

    Key

    Text

    Region

    Discreto

    Text

    vAssocSeqLineItems

      

      

    Line Number

    Key Sequence

    Long

    Model

    Discreto

    Text

  9. Nella pagina Crea set di testing modificare il valore di Percentuale di dati per il testing impostandolo su 20, quindi scegliere Avanti.

  10. Nella pagina Completamento procedura guidata in Nome struttura di data mining digitare Sequence Clustering with Region.

  11. In Nome modello di data mining digitare Sequence Clustering with Region.

  12. Selezionare la casella Consenti drill-through, quindi scegliere Fine.

Attività successiva della lezione

Elaborazione del modello Sequence Clustering

Vedere anche

Concetti

Progettazione modelli di data mining

Algoritmo Microsoft Sequence Clustering