Lezione 2: Aggiunta di modelli di data mining alla struttura di data mining Market Basket
In questa lezione verranno aggiunti due modelli di data mining alla struttura di data mining Market Basket creata in Lezione 1: Creazione della struttura di data mining Market Basket. Questi modelli di data mining consentiranno di creare stime.
Per stimare quali tipi di prodotti i clienti tendono ad acquistare contemporaneamente, verranno creati due modelli di data mining utilizzando l'Algoritmo Microsoft Association Rules e due valori diversi per il parametro MINIMUM_PROBABILTY.
MINIMUM_PROBABILTY è un parametro dell'algoritmo Microsoft Association che aiuta a determinare il numero di regole che un modello di data mining conterrà specificando la probabilità minima che una regola deve avere. Ad esempio, l'impostazione di questo valore su 0,4 specifica che una regola può essere generata solo se la combinazione di prodotti che la regola descrive ha una probabilità di realizzazione di almeno il 40%.
In una lezione successiva, verranno mostrati gli effetti della modifica del parametro MINIMUM_PROBABILTY.
Istruzione ALTER MINING STRUCTURE
Per aggiungere a una struttura di data mining un modello di data mining contenente una tabella nidificata, viene utilizzata l'istruzione ALTER MINING STRUCTURE (DMX). Il codice nell'istruzione può essere suddiviso nelle parti seguenti:
Identificazione della struttura di data mining
Denominazione del modello di data mining
Definizione della colonna chiave
Definizione della colonna di input e della colonna stimabile
Definizione delle colonne della tabella nidificata
Identificazione delle modifiche a livello di algoritmo e parametri
Gli elementi seguenti sono un esempio generico dell'istruzione ALTER MINING STRUCTURE, che consente di aggiungere un modello di data mining a una struttura che include colonne delle tabelle nidificate:
ALTER MINING STRUCTURE [<Mining Structure Name>]
ADD MINING MODEL [<Mining Model Name>]
(
[<key column>],
<mining model column> <usage>,
<table columns>
( [<nested key column>],
<nested mining model columns> )
) USING <algorithm>( <algorithm parameters> )
La prima riga del codice identifica la struttura di data mining esistente a cui verrà aggiunto il modello di data mining:
ALTER MINING STRUCTURE [<mining structure name>]
La riga successiva del codice indica il nome del modello di data mining che verrà aggiunto alla struttura di data mining:
ADD MINING MODEL [<mining model name>]
Per informazioni sulla denominazione di un oggetto in DMX (Data Mining Extensions), vedere Identificatori (DMX).
Le successive righe del codice definiscono le colonne della struttura di data mining che verranno utilizzate dal modello di data mining:
[<key column>],
<mining model columns> <usage>,
È possibile utilizzare solo colonne che esistono già nella struttura di data mining.
La prima colonna nell'elenco delle colonne del modello di data mining deve essere la colonna chiave nella struttura di data mining. Tuttavia, non è necessario digitare KEY dopo la colonna chiave per specificare l'utilizzo. Ciò avviene perché la colonna è già stata definita come colonna chiave al momento della creazione della struttura di data mining.
Le righe rimanenti specificano l'utilizzo delle colonne nel nuovo modello di data mining. Per specificare che una colonna nel modello di data mining verrà utilizzata per la stima, è possibile utilizzare la sintassi seguente:
<column name> PREDICT,
Se non viene specificato l'utilizzo, non è necessario includere una colonna della struttura di data mining nell'elenco. Tutte le colonne utilizzate dalla struttura di data mining di riferimento sono automaticamente disponibili per l'utilizzo da parte dei modelli di data mining basati su tale struttura. Tuttavia, il modello non utilizzerà le colonne per il training a meno che non venga specificato l'utilizzo.
L'ultima riga del codice definisce l'algoritmo e i parametri dell'algoritmo che verranno utilizzati per generare il modello di data mining.
) USING <algorithm>( <algorithm parameters> )
Argomenti della lezione
In questa lezione verranno eseguite le attività seguenti:
Aggiunta di un modello di data mining di associazione alla struttura utilizzando il valore di probabilità predefinito
Aggiunta di un modello di data mining di associazione alla struttura utilizzando un valore di probabilità modificato
Aggiunta di un modello di data mining di associazione alla struttura utilizzando il valore predefinito di MINIMUM_PROBABILITY
La prima attività consiste nell'aggiunta di un nuovo modello di data mining alla struttura di data mining Market Basket in base all'algoritmo Microsoft Association utilizzando il valore predefinito di MINIMUM_PROBABILITY.
Per aggiungere un modello di data mining di associazione
In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query e quindi DMX.
Verrà avviato l'editor di query con una nuova query vuota.
[!NOTA]
Per creare una query DMX su un database Analysis Services specifico, fare clic con il pulsante destro del mouse sul database anziché sull'istanza.
Copiare l'esempio generico dell'istruzione ALTER MINING STRUCTURE nella query vuota.
Sostituire quanto segue:
<mining structure name>
con:
[Market Basket]
Sostituire quanto segue:
<mining model name>
con:
[Default Association]
Sostituire quanto segue:
[<key column>], <mining model columns>, <table columns> ( [<nested key column>], <nested mining model columns> )
con:
OrderNumber, [Products] PREDICT ( [Model] )
In questo caso, la tabella [Products] è stata definita come colonna stimabile. Inoltre, la colonna [Model] è inclusa nell'elenco delle colonne della tabella nidificata, poiché è la colonna chiave della tabella nidificata.
[!NOTA]
Tenere presente che una chiave nidificata è diversa da una chiave del case. Una chiave del case è un identificatore univoco del case, mentre la chiave nidificata è un attributo che si desidera modellare.
Sostituire quanto segue:
USING <algorithm>( <algorithm parameters> )
con:
Using Microsoft_Association_Rules
L'istruzione risultante dovrebbe essere la seguente:
ALTER MINING STRUCTURE [Market Basket] ADD MINING MODEL [Default Association] ( OrderNumber, [Products] PREDICT ( [Model] ) ) Using Microsoft_Association_Rules
Scegliere Salva DMXQuery1.dmx con nome dal menu File.
Nella finestra di dialogo Salva con nome individuare la cartella appropriata e assegnare al file il nome Default_Association_Model.dmx.
Fare clic sul pulsante Esegui sulla barra degli strumenti.
Aggiunta di un modello di data mining di associazione alla struttura modificando il valore predefinito di MINIMUM_PROBABILITY
L'attività successiva consiste nell'aggiunta di un nuovo modello di data mining alla struttura di data mining Market Basket in base all'algoritmo Microsoft Association modificando il valore predefinito di MINIMUM_PROBABILITY in 0,01. La modifica del parametro determinerà la creazione di ulteriori regole da parte dell'algoritmo Microsoft Association.
Per aggiungere un modello di data mining di associazione
In Esplora oggetti fare clic con il pulsante destro del mouse sull'istanza di Analysis Services, scegliere Nuova query e quindi DMX.
Verrà avviato l'editor di query con una nuova query vuota.
Copiare l'esempio generico dell'istruzione ALTER MINING STRUCTURE nella query vuota.
Sostituire quanto segue:
<mining structure name>
con:
Market Basket
Sostituire quanto segue:
<mining model name>
con:
[Modified Association]
Sostituire quanto segue:
<mining model columns>, <table columns> ( [<nested key column>], <nested mining model columns> )
con:
OrderNumber, [Products] PREDICT ( [Model] )
In questo caso, la tabella [Products] è stata designata come colonna stimabile. Anche la colonna [MODEL] è inclusa nell'elenco perché è la colonna chiave nella tabella nidificata.
Sostituire quanto segue:
USING <algorithm>( <algorithm parameters> )
con:
USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
L'istruzione risultante dovrebbe essere la seguente:
ALTER MINING STRUCTURE [Market Basket] ADD MINING MODEL [Modified Assocation] ( OrderNumber, [Products] PREDICT ( [Model] ) ) USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
Scegliere Salva DMXQuery1.dmx con nome dal menu File.
Nella finestra di dialogo Salva con nome individuare la cartella appropriata e assegnare al file il nome Modified Association_Model.dmx.
Fare clic sul pulsante Esegui sulla barra degli strumenti.
Nella lezione successiva verranno elaborati la struttura di data mining Market Basket insieme ai relativi modelli di data mining associati.
Lezione successiva
Lezione 3: Elaborazione della struttura di data mining Market Basket