Creazione della struttura del modello di data mining di clusterizzazione di sequenze (esercitazione intermedia sul data mining)

Il primo passaggio nella creazione di un modello di clustering di sequenze consiste nell'usare la Creazione Guidata Modello di Data Mining per creare una nuova struttura di data mining e un modello di data mining basato sull'algoritmo Microsoft Sequence Clustering.

Si userà la stessa vista origine dati usata per l'analisi del carrello di mercato, ma si aggiungerà una colonna contenente l'identificatore sequence . In questo scenario, la sequenza indica l'ordine in cui il cliente ha aggiunto articoli al carrello acquisti.

Si aggiungeranno anche alcune colonne usate in uno dei modelli per raggruppare i clienti in base ai dati demografici.

Per creare una struttura e un modello di clustering di sequenze

In Esplora soluzioni in SQL Server Data Tools (SSDT), fare clic con il pulsante destro del mouse su Strutture di data mining e selezionare Nuova struttura di data mining.
Nella pagina Benvenuti nella creazione guidata per il data mining, fare clic su Avanti.
Nella pagina Selezionare il metodo di definizione verificare che sia selezionata l'opzione Da database relazionale o data warehouse esistente e quindi fare clic su Avanti.
Nella pagina Crea la Struttura di Data Mining, verificare che l'opzione Crea struttura di mining con un modello di mining sia selezionata. Fare quindi clic sull'elenco a discesa per l'opzione Quale tecnica di data mining si vuole usare? e selezionare Microsoft Sequence Clustering. Fare clic su Avanti.

La pagina Selezione vista origine dati verrà visualizzata. In Viste origine dati disponibili selezionare Orders.

Orders è la stessa visualizzazione della fonte dati che hai utilizzato per lo scenario cesto della spesa. Se questa vista origine dati non è stata creata, vedere Aggiunta di una vista origine dati con tabelle nidificate (esercitazione intermedia sul data mining).
Fare clic su Avanti.
Nella pagina Specifica tipi di tabella selezionare la casella di controllo Case accanto alla tabella vAssocSeqOrders e selezionare la casella di controllo Nidificata accanto alla tabella vAssocSeqLineItems . Fare clic su Avanti.

Annotazioni

Se si verifica un errore quando si selezionano le caselle di controllo Case o Nested , è possibile che il join nella vista origine dati non sia corretto. La tabella nidificata vAssocSeqLineItems deve essere connessa alla tabella di casi vAssocSeqOrders tramite un join da molti a uno. È possibile modificare la relazione facendo clic con il pulsante destro del mouse sulla linea di join e quindi ripristinando la direzione del join. Per altre informazioni, vedere Finestra di dialogo Crea o Modifica relazione (Analysis Services - Dati multidimensionali).
Nella pagina Specificare i dati di training scegliere le colonne da usare nel modello selezionando una casella di controllo come indicato di seguito:
- IncomeGroup Selezionare la casella di controllo Input .
  
  Questa colonna contiene informazioni interessanti sui clienti che è possibile usare per il clustering. Verrà usato nel primo modello e quindi ignorato nel secondo modello.
- OrderNumber Selezionare la Key casella di controllo.
  
  Questo campo verrà usato come identificatore per la tabella case oppure Key. In generale, è consigliabile non usare mai il campo chiave della tabella case come input, perché la chiave contiene valori univoci che non sono utili per il clustering.
- Regione Selezionare la casella di controllo Input .
  
  Questa colonna contiene informazioni interessanti sui clienti che è possibile usare per il clustering. Verrà usato nel primo modello e quindi ignorato nel secondo modello.
- LineNumber Selezionare le caselle di controllo Key e Input.
  
  Il campo LineNumber verrà utilizzato come identificatore per la tabella nidificata o Sequence Key. La chiave per una tabella nidificata deve essere sempre usata per l'input.
- Modello Selezionare le caselle di controllo Input e Prevedibile.
Verificare che le selezioni siano corrette e quindi fare clic su Avanti.

Nella pagina Specifica contenuto colonne e tipo di dati verificare che la griglia contenga le colonne, i tipi di contenuto e i tipi di dati mostrati nella tabella seguente, quindi fare clic su Avanti.

Tabelle/colonne	Tipo di contenuto	Tipo di dati
Gruppo di Reddito	Discreto	Testo
Numero Ordine	Chiave	Testo
Area geografica	Discreto	Testo
vAssocSeqLineItems
Numero di riga	Sequenza di tasti	Lungo
Modello	Discreto	Testo

Nella pagina Crea set di test modificare la percentuale di dati per i test su 20 e quindi fare clic su Avanti.
Nella pagina Completamento procedura guidata, digitare il nome Sequence Clustering with Region della struttura di data mining.
Per il nome del modello di data mining digitare Sequence Clustering with Region.
Selezionare la casella Consenti drill-through e quindi fare clic su Fine.

Attività successiva nella lezione

Elaborazione del modello Sequence Clustering

Vedere anche

Progettazione modelli di data mining
Algoritmo di Clusterizzazione Sequenziale di Microsoft

Last updated on 2017-03-06

Condividi tramite

Creazione della struttura del modello di data mining di clusterizzazione di sequenze (esercitazione intermedia sul data mining)

Per creare una struttura e un modello di clustering di sequenze

Attività successiva nella lezione

Vedere anche

Risorse aggiuntive