Lezione 3: Elaborazione della struttura di data mining Market Basket
Si applica a: SQL Server 2016 Preview
In questa lezione si utilizzerà il DMX INSERT INTO ( ) istruzione e vAssocSeqLineItems e vAssocSeqOrders il AdventureWorksDW2012 per elaborare le strutture di data mining e modelli di data mining creata nel database di esempio lezione 1: creazione della struttura di Data Mining Market Basket e Lezione 2: aggiunta di modelli di Data Mining alla struttura di Data Mining Market Basket.
Quando si elabora una struttura di data mining, Analysis Services legge i dati di origine e compila le strutture che supportano i modelli di data mining. Quando si elabora un modello di data mining, i dati definiti dalla struttura di data mining vengono elaborati tramite l'algoritmo di data mining selezionato. L'algoritmo ricerca tendenze e schemi e quindi archivia queste informazioni nel modello di data mining. Il modello di data mining non contiene pertanto i dati di origine effettivi, bensì le informazioni individuate dall'algoritmo. Per ulteriori informazioni sull'elaborazione dei modelli di data mining, vedere l'elaborazione di requisiti e considerazioni ( Data Mining ).
Una struttura di data mining deve essere rielaborata solo se si modifica una colonna della struttura o i dati di origine. Se si aggiunge un modello di data mining a una struttura di data mining che è già stata elaborata, è possibile utilizzare il INSERT INTO MINING MODEL istruzione per il training del nuovo modello di data mining sui dati esistenti.
Poiché la struttura di data mining acquisti contiene una tabella nidificata, è necessario definire le colonne di data mining per eseguire il training utilizzando la struttura della tabella nidificata e verrà utilizzato il forma comando per definire le query che recuperano i dati di training dalle tabelle di origine.
Istruzione INSERT INTO
Per eseguire il training della struttura di data mining Market Basket e i modelli di data mining associati, utilizzare il DMX INSERT INTO ( ) istruzione. Il codice nell'istruzione può essere suddiviso nelle parti seguenti.
Identificazione della struttura di data mining
Creazione di un elenco delle colonne nella struttura di data mining
Definizione dei dati di training mediante forma
Di seguito è riportato un esempio generico del INSERT INTO istruzione:
INSERT INTO MINING STRUCTURE [<mining structure name>]
(
<mining structure columns>
[<nested table>]
( SKIP, <skipped column> )
)
SHAPE {
OPENQUERY([<datasource>],'<SELECT statement>') }
APPEND
(
{OPENQUERY([<datasource>],'<nested SELECT statement>')
}
RELATE [<case key>] TO [<foreign key>]
) AS [<nested table>]
La prima riga del codice identifica la struttura di data mining di cui si eseguirà il training:
INSERT INTO MINING STRUCTURE [<mining structure name>]
Le successive righe del codice specificano le colonne definite dalla struttura di data mining. È necessario che siano elencate tutte le colonne nella struttura di data mining e ogni colonna deve essere associata a una colonna nei dati della query di origine. È possibile utilizzare SKIP per ignorare le colonne presenti nei dati di origine ma non esistono nella struttura di data mining. Per ulteriori informazioni su come usare SKIP, vedere DMX INSERT INTO ( ).
(
<mining structure columns>
[<nested table>]
( SKIP, <skipped column> )
)
Le ultime righe del codice definiscono i dati che verranno utilizzati per il training della struttura di data mining. Poiché i dati di origine sono contenuti due tabelle, si utilizzerà forma per correlare le tabelle.
SHAPE {
OPENQUERY([<datasource>],'<SELECT statement>') }
APPEND
(
{OPENQUERY([<datasource>],''<nested SELECT statement>'')
}
RELATE [<case key>] TO [<foreign key>]
) AS [<nested table>]
In questa lezione si utilizzerà OPENQUERY per definire i dati di origine. Per informazioni sugli altri metodi di definizione di una query sui dati di origine, vedere < query origine dati >.
Argomenti della lezione
In questa lezione verrà eseguita l'attività seguente:
- Elaborazione della struttura di data mining Market Basket
Elaborazione della struttura di data mining Market Basket
Per elaborare la struttura di data mining mediante INSERT INTO
In Esplora oggetti, fare doppio clic sull'istanza di Analysis Services, scegliere Nuova Query, quindi fare clic su DMX.
Verrà avviato l'editor di query con una nuova query vuota.
Copiare l'esempio generico dell'istruzione INSERT INTO nella query vuota.
Sostituire quanto segue:
[<mining structure>]
con:
Market Basket
Sostituire quanto segue:
<mining structure columns> [<nested table>] ( SKIP, <skipped column> )
con:
[OrderNumber], [Products] (SKIP, [Model])
Nell'istruzione prodotti fa riferimento alla tabella Products definita dall'istruzione SHAPE. SKIP viene utilizzato per ignorare la colonna Model presente nei dati di origine come chiave, ma non viene utilizzata dalla struttura di data mining.
Sostituire quanto segue:
SHAPE { OPENQUERY([<datasource>],'<SELECT statement>') } APPEND ( {OPENQUERY([<datasource>],'<nested SELECT statement>') } RELATE [<case key>] TO [<foreign key>] ) AS [<nested table>]
con:
SHAPE { OPENQUERY([Adventure Works DW],'SELECT OrderNumber FROM vAssocSeqOrders ORDER BY OrderNumber')} APPEND ( {OPENQUERY([Adventure Works DW],'SELECT OrderNumber, Model FROM dbo.vAssocSeqLineItems ORDER BY OrderNumber, Model') } RELATE OrderNumber to OrderNumber ) AS [Products]
La query di origine fa riferimento il AdventureWorksDW2012 origine dati definita nel AdventureWorksDW2012 progetto di esempio. Utilizza questa origine dei dati per accedere alle viste vAssocSeqLineItems e vAssocSeqOrders contenenti i dati origine che verranno utilizzati per il training del modello di data mining. Se non è stato creato il progetto o le viste, vedere base esercitazione sul Data Mining.
All'interno di forma comando, si utilizzerà OPENQUERY per definire due query. Nella prima query viene definita la tabella padre, mentre nella seconda viene definita la tabella nidificata. Le due tabelle vengono correlate mediante la colonna OrderNumber presente in entrambe.
L'istruzione completa dovrebbe risultare analoga alla seguente:
INSERT INTO MINING STRUCTURE [Market Basket] ( [OrderNumber],[Products] (SKIP, [Model]) ) SHAPE { OPENQUERY([Adventure Works DW],'SELECT OrderNumber FROM vAssocSeqOrders ORDER BY OrderNumber')} APPEND ( {OPENQUERY([Adventure Works DW],'SELECT OrderNumber, Model FROM dbo.vAssocSeqLineItems ORDER BY OrderNumber, Model') } RELATE OrderNumber to OrderNumber ) AS [Products]
Nel File menu, fare clic su Salva Dmxquery1.
Nel Salva con nome la finestra di dialogo, individuare la cartella appropriata e denominare il file processo Market basket.
Sulla barra degli strumenti, fare clic sui Execute pulsante.
Una volta terminata l'esecuzione della query, è possibile visualizzare i modelli e i set di elementi trovati, visualizzare le associazioni o filtrare per set di elementi, probabilità o importanza. Per visualizzare queste informazioni in SQL Server Management Studio, fare doppio clic sul nome del modello di dati e quindi fare clic su Sfoglia.
Nella lezione successiva verranno create diverse stime basate sui modelli di data mining aggiunti alla struttura Market Basket.