Lezione 1: Creazione della struttura di data mining Bike Buyer

Articolo
03/06/2017

In questa lezione si creerà una struttura di data mining che consente di prevedere se un potenziale cliente di Adventure Works Cycles acquisterà una bicicletta. Se non si ha familiarità con le strutture di data mining e il loro ruolo nel data mining, vedere Strutture di data mining (Analysis Services - Data Mining).

La struttura di data mining Bike Buyer creata in questa lezione supporta l'aggiunta di modelli di data mining basati sull'algoritmo Microsoft Clustering Microsoft Decision Trees. Nelle lezioni successive si utilizzeranno i modelli di data mining di clustering per esaminare le diverse modalità di raggruppamento dei clienti e si utilizzeranno modelli di data mining di albero delle decisioni per stimare se un potenziale cliente acquisterà una bicicletta.

Istruzione CREATE MINING STRUCTURE

Per creare una struttura di data mining, usare l'istruzione CREATE MINING STRUCTURE (DMX). Il codice nell'istruzione può essere suddiviso nelle parti seguenti:

Denominazione della struttura.
Definizione della colonna chiave.
Definizione delle colonne di data mining.
Definizione di un set di dati di testing facoltativo.

Di seguito è riportato un esempio generico dell'istruzione CREATE MINING STRUCTURE:

CREATE MINING STRUCTURE [<mining structure name>]  
(  
    <key column>,  
    <mining structure columns>  
)   
WITH HOLDOUT (<holdout specifier>)

La prima riga del codice definisce il nome della struttura:

CREATE MINING STRUCTURE [<mining structure name>]

Per informazioni sulla denominazione di un oggetto in Estensioni data mining (DMX), vedere Identificatori (DMX).

La riga successiva del codice definisce la colonna chiave per la struttura di data mining, che identifica in modo univoco un'entità nei dati di origine:

<key column>,

In questa struttura di data mining creata, l'identificatore del cliente, CustomerKey, definisce un'entità nei dati di origine.

La riga successiva del codice è utilizzata per definire le colonne di data mining che verranno utilizzate dai modelli di data mining associati alla struttura di data mining:

<mining structure columns>

È possibile usare la funzione DISCRETIZE all'interno <delle colonne> della struttura di data mining per discretizzare le colonne continue usando la sintassi seguente:

DISCRETIZE(<method>,<number of buckets>)

Per altre informazioni sulla discretizzazione delle colonne, vedere Metodi di discretizzazione (data mining). Per altre informazioni sui tipi di colonne della struttura di data mining che è possibile definire, vedere Colonne struttura di data mining.

L'ultima riga del codice definisce una partizione facoltativa nella struttura di data mining:

WITH HOLDOUT (<holdout specifier>)

Specificare alcuni dati da utilizzare per testare i modelli di data mining correlati alla struttura e i rimanenti dati da utilizzare per il training dei modelli. Per impostazione predefinita, Analysis Services crea un set di dati di test contenente il 30% di tutti i dati del caso. È necessario aggiungere la specifica che i set di dati di test devono contenere il 30% dei case fino a un massimo di 1000 case. Se il 30% dei case è minore di 1000, il set di dati di test conterrà la quantità inferiore.

Argomenti della lezione

In questa lezione verranno eseguite le attività seguenti:

Creazione di una nuova query vuota.
Modifica della query per creare la struttura di data mining.
Esecuzione della query.

Creazione della query

Il primo passaggio consiste nel connettersi a un'istanza di Analysis Services e creare una nuova query DMX in SQL Server Management Studio.

Per creare una nuova query DMX in SQL Server Management Studio

Aprire SQL Server Management Studio.
Nella finestra di dialogo Connetti al server selezionare Analysis Services per tipo di server. In Nome server digitare o digitare LocalHostil nome dell'istanza di Analysis Services a cui si vuole connettersi per questa lezione. Fare clic su Connetti.
In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query e quindi fare clic su DMX per aprire la Editor di query e una nuova query vuota.

Modifica della query

Il passaggio successivo consiste nella modifica dell'istruzione CREATE MINING STRUCTURE descritta in precedenza per creare la struttura di data mining Bike Buyer.

Per personalizzare l'istruzione CREATE MINING STRUCTURE

Nell'editor di query copiare l'esempio generico dell'istruzione CREATE MINING STRUCTURE nella query vuota.
Sostituire quanto segue:
```
[<mining structure>]   
```
con:
```
[Bike Buyer]  
```
Sostituire quanto segue:
```
<key column>   
```
con:
```
CustomerKey LONG KEY  
```

Sostituire quanto segue:

<mining structure columns>

con:

[Age] LONG DISCRETIZED(Automatic,10),  
[Bike Buyer] LONG DISCRETE,  
[Commute Distance] TEXT DISCRETE,  
[Education] TEXT DISCRETE,  
[Gender] TEXT DISCRETE,  
[House Owner Flag] TEXT DISCRETE,  
[Marital Status] TEXT DISCRETE,  
[Number Cars Owned] LONG DISCRETE,  
[Number Children At Home] LONG DISCRETE,  
[Occupation] TEXT DISCRETE,  
[Region] TEXT DISCRETE,  
[Total Children]LONG DISCRETE,  
[Yearly Income] DOUBLE CONTINUOUS

Sostituire quanto segue:

WITH HOLDOUT (holdout specifier>)

con:

WITH HOLDOUT (30 PERCENT or 1000 CASES)

L'istruzione della struttura di data mining completa dovrebbe essere la seguente:

CREATE MINING STRUCTURE [Bike Buyer]  
(  
   [Customer Key] LONG KEY,  
   [Age]LONG DISCRETIZED(Automatic,10),  
   [Bike Buyer] LONG DISCRETE,  
   [Commute Distance] TEXT DISCRETE,  
   [Education] TEXT DISCRETE,  
   [Gender] TEXT DISCRETE,  
   [House Owner Flag] TEXT DISCRETE,  
   [Marital Status] TEXT DISCRETE,  
   [Number Cars Owned]LONG DISCRETE,  
   [Number Children At Home]LONG DISCRETE,  
   [Occupation] TEXT DISCRETE,  
   [Region] TEXT DISCRETE,  
   [Total Children]LONG DISCRETE,  
   [Yearly Income] DOUBLE CONTINUOUS  
)  
WITH HOLDOUT (30 PERCENT or 1000 CASES)

Nel menu File fare clic su Salva DMXQuery1.dmx As.
Nella finestra di dialogo Salva con nome passare alla cartella appropriata e assegnare al file Bike Buyer Structure.dmxil nome .

Esecuzione della query

Il passaggio conclusivo consiste nell'esecuzione della query. Dopo la creazione e il salvataggio di una query, è necessario eseguirla. Ovvero, l'istruzione deve essere eseguita per creare la struttura di data mining nel server. Per altre informazioni sull'esecuzione di query in Editor di query, vedere Motore di database Editor di query (SQL Server Management Studio).

Per eseguire la query

In Editor di query, sulla barra degli strumenti fare clic su Esegui.

Lo stato della query viene visualizzato nella scheda Messaggi nella parte inferiore di Editor di query al termine dell'esecuzione dell'istruzione. Dovrebbero essere visualizzati i messaggi seguenti:
```
Executing the query   
Execution complete  
```
Una nuova struttura denominata Bike Buyer esiste ora nel server.

Nella lezione successiva verranno aggiunti modelli di data mining alla struttura appena creata.

Lezione successiva

Lezione 2: Aggiunta di modelli di data mining alla struttura di data mining Bike Buyer

Condividi tramite