Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Il primo passaggio nella creazione di un modello di clustering di sequenze consiste nell'usare la Creazione Guidata Modello di Data Mining per creare una nuova struttura di data mining e un modello di data mining basato sull'algoritmo Microsoft Sequence Clustering.
Si userà la stessa vista origine dati usata per l'analisi del carrello di mercato, ma si aggiungerà una colonna contenente l'identificatore sequence . In questo scenario, la sequenza indica l'ordine in cui il cliente ha aggiunto articoli al carrello acquisti.
Si aggiungeranno anche alcune colonne usate in uno dei modelli per raggruppare i clienti in base ai dati demografici.
Per creare una struttura e un modello di clustering di sequenze
In Esplora soluzioni in SQL Server Data Tools (SSDT), fare clic con il pulsante destro del mouse su Strutture di data mining e selezionare Nuova struttura di data mining.
Nella pagina Benvenuti nella creazione guidata per il data mining, fare clic su Avanti.
Nella pagina Selezionare il metodo di definizione verificare che sia selezionata l'opzione Da database relazionale o data warehouse esistente e quindi fare clic su Avanti.
Nella pagina Crea la Struttura di Data Mining, verificare che l'opzione Crea struttura di mining con un modello di mining sia selezionata. Fare quindi clic sull'elenco a discesa per l'opzione Quale tecnica di data mining si vuole usare? e selezionare Microsoft Sequence Clustering. Fare clic su Avanti.
La pagina Selezione vista origine dati verrà visualizzata. In Viste origine dati disponibili selezionare
Orders.Orders è la stessa visualizzazione della fonte dati che hai utilizzato per lo scenario cesto della spesa. Se questa vista origine dati non è stata creata, vedere Aggiunta di una vista origine dati con tabelle nidificate (esercitazione intermedia sul data mining).
Fare clic su Avanti.
Nella pagina Specifica tipi di tabella selezionare la casella di controllo Case accanto alla tabella vAssocSeqOrders e selezionare la casella di controllo Nidificata accanto alla tabella vAssocSeqLineItems . Fare clic su Avanti.
Annotazioni
Se si verifica un errore quando si selezionano le caselle di controllo Case o Nested , è possibile che il join nella vista origine dati non sia corretto. La tabella nidificata vAssocSeqLineItems deve essere connessa alla tabella di casi vAssocSeqOrders tramite un join da molti a uno. È possibile modificare la relazione facendo clic con il pulsante destro del mouse sulla linea di join e quindi ripristinando la direzione del join. Per altre informazioni, vedere Finestra di dialogo Crea o Modifica relazione (Analysis Services - Dati multidimensionali).
Nella pagina Specificare i dati di training scegliere le colonne da usare nel modello selezionando una casella di controllo come indicato di seguito:
IncomeGroup Selezionare la casella di controllo Input .
Questa colonna contiene informazioni interessanti sui clienti che è possibile usare per il clustering. Verrà usato nel primo modello e quindi ignorato nel secondo modello.
OrderNumber Selezionare la
Keycasella di controllo.Questo campo verrà usato come identificatore per la tabella case oppure
Key. In generale, è consigliabile non usare mai il campo chiave della tabella case come input, perché la chiave contiene valori univoci che non sono utili per il clustering.Regione Selezionare la casella di controllo Input .
Questa colonna contiene informazioni interessanti sui clienti che è possibile usare per il clustering. Verrà usato nel primo modello e quindi ignorato nel secondo modello.
LineNumber Selezionare le caselle di controllo
Keye Input.Il campo LineNumber verrà utilizzato come identificatore per la tabella nidificata o
Sequence Key. La chiave per una tabella nidificata deve essere sempre usata per l'input.Modello Selezionare le caselle di controllo Input e Prevedibile.
Verificare che le selezioni siano corrette e quindi fare clic su Avanti.
Nella pagina Specifica contenuto colonne e tipo di dati verificare che la griglia contenga le colonne, i tipi di contenuto e i tipi di dati mostrati nella tabella seguente, quindi fare clic su Avanti.
Tabelle/colonne Tipo di contenuto Tipo di dati Gruppo di Reddito Discreto Testo Numero Ordine Chiave Testo Area geografica Discreto Testo vAssocSeqLineItems Numero di riga Sequenza di tasti Lungo Modello Discreto Testo Nella pagina Crea set di test modificare la percentuale di dati per i test su 20 e quindi fare clic su Avanti.
Nella pagina Completamento procedura guidata, digitare il nome
Sequence Clustering with Regiondella struttura di data mining.Per il nome del modello di data mining digitare
Sequence Clustering with Region.Selezionare la casella Consenti drill-through e quindi fare clic su Fine.
Attività successiva nella lezione
Elaborazione del modello Sequence Clustering
Vedere anche
Progettazione modelli di data mining
Algoritmo di Clusterizzazione Sequenziale di Microsoft