Lezione 1: Creazione della struttura di data mining Market Basket
In questa lezione verrà creata una struttura di data mining che consente di stimare quali prodotti di Adventure Works Cycles un cliente tende ad acquistare contemporaneamente. Se non si ha familiarità con le strutture di data mining e il loro ruolo nel data mining, vedere Strutture di data mining (Analysis Services – Data mining).
La struttura di data mining di associazione che si creerà in questa lezione supporta l'aggiunta di modelli di data mining basati sull'algoritmo Microsoft Association Rules. Nelle lezioni successive si utilizzeranno i modelli di data mining per stimare il tipo di prodotti che un cliente tende ad acquistare contemporaneamente, ovvero per un'analisi di mercato sugli acquisti. Ad esempio, è possibile individuare la tendenza ad acquistare contemporaneamente mountain bike, pneumatici per bicicletta e caschi.
In questa lezione, la struttura di data mining viene definita utilizzando le tabelle nidificate. L'utilizzo delle tabelle nidificate è determinato dal fatto che il dominio dei dati che verrà definito dalla struttura è contenuto in due diverse tabelle di origine. Per ulteriori informazioni sulle tabelle nidificate, vedere Tabelle nidificate (Analysis Services - Data mining).
Istruzione CREATE MINING STRUCTURE
Per creare una struttura di data mining contenente una tabella nidificata viene utilizzata l'istruzione CREATE MINING STRUCTURE (DMX). Il codice nell'istruzione può essere suddiviso nelle parti seguenti:
Denominazione della struttura
Definizione della colonna chiave
Definizione delle colonne di data mining
Definizione delle colonne della tabella nidificata
Di seguito è riportato un esempio generico dell'istruzione CREATE MINING STRUCTURE:
CREATE MINING STRUCTURE [<Mining Structure Name>]
(
<key column>,
<mining structure columns>,
<table columns>
( <nested key column>,
<nested mining structure columns> )
)
La prima riga del codice definisce il nome della struttura:
CREATE MINING STRUCTURE [Mining Structure Name]
Per informazioni sulla denominazione di un oggetto in DMX, vedere Identificatori (DMX).
La riga successiva del codice definisce la colonna chiave per la struttura di data mining, che identifica in modo univoco un'entità nei dati di origine:
<key column>
La riga successiva del codice è utilizzata per definire le colonne di data mining che verranno utilizzate dai modelli di data mining associati alla struttura di data mining:
<mining structure columns>
Le righe successive del codice definiscono le colonne delle tabelle nidificate:
<table columns>
( <nested key column>,
<nested mining structure columns> )
Per informazioni sui tipi di colonne della struttura di data mining che è possibile definire, vedere Colonne della struttura di data mining.
[!NOTA]
Per impostazione predefinita, SQL Server Data Tools (SSDT) crea un set di dati di controllo del 30% per ogni struttura di data mining; tuttavia, quando si utilizza DMX per creare una struttura di data mining, è necessario aggiungere manualmente il set di dati di controllo, se lo si desidera.
Argomenti della lezione
In questa lezione verranno eseguite le attività seguenti:
Creazione di una nuova query vuota
Modifica della query per creare la struttura di data mining
Esecuzione della query
Creazione della query
Il primo passaggio consiste nella connessione a un'istanza di Analysis Services e nella creazione di una nuova query DMX in SQL Server Management Studio.
Per creare una nuova query DMX in SQL Server Management Studio
Aprire SQL Server Management Studio.
Nella finestra di dialogo Connetti al server selezionare Analysis Services in Tipo server. In Nome server digitare LocalHost o il nome dell'istanza di Analysis Services a cui si desidera connettersi per la lezione. Fare clic su Connetti.
In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query e quindi DMX.
Verrà avviato l'editor di query con una nuova query vuota.
Modifica della query
Il passaggio successivo consiste nella modifica dell'istruzione CREATE MINING STRUCTURE descritta in precedenza per creare la struttura di data mining Market Basket.
Per personalizzare l'istruzione CREATE MINING STRUCTURE
Nell'editor di query copiare l'esempio generico dell'istruzione CREATE MINING STRUCTURE nella query vuota.
Sostituire quanto segue:
[mining structure name]
con:
[Market Basket]
Sostituire quanto segue:
<key column>
con:
OrderNumber TEXT KEY
Sostituire quanto segue:
<table columns> ( <nested key column>, <nested mining structure columns> )
con:
[Products] TABLE ( [Model] TEXT KEY )
Il linguaggio TEXT KEY specifica che la colonna Model è la colonna chiave per la tabella nidificata.
L'istruzione della struttura di data mining completa dovrebbe essere la seguente:
CREATE MINING STRUCTURE [Market Basket] ( OrderNumber TEXT KEY, [Products] TABLE ( [Model] TEXT KEY ) )
Scegliere Salva DMXQuery1.dmx con nome dal menu File.
Nella finestra di dialogo Salva con nome individuare la cartella appropriata e assegnare al file il nome Market Basket Structure.dmx.
Esecuzione della query
Il passaggio conclusivo consiste nell'esecuzione della query. Dopo la creazione e il salvataggio di una query, per creare la struttura di data mining sul server è necessario che la query (l'istruzione) venga eseguita. Per ulteriori informazioni sull'esecuzione di query nell'editor di query, vedere Editor di query del Motore di database (SQL Server Management Studio).
Per eseguire la query
Nell'editor di query fare clic su Esegui sulla barra degli strumenti.
Al termine dell'esecuzione dell'istruzione, lo stato della query viene visualizzato nella scheda Messaggi nella parte inferiore dell'editor di query. Dovrebbero essere visualizzati i messaggi seguenti:
Executing the query Execution complete
A questo punto sul server è presente una nuova struttura denominata Market Basket.
Nella lezione successiva verranno aggiunti modelli di data mining alla struttura di data mining Market Basket appena creata.
Lezione successiva
Lezione 2: Aggiunta di modelli di data mining alla struttura di data mining Market Basket