Creazione guidata modello di data mining
La Creazione guidata modello di data mining di Microsoft SQL Server 2005 Analysis Services (SSAS) viene avviata ogni volta che si aggiunge una nuova struttura di data mining a un progetto di data mining. La creazione guidata definisce nuove strutture e il modello di data mining iniziale per ogni struttura. La struttura del modello iniziale, che include tabelle e colonne, è basata su una vista origine dati o cubo esistente.
Tramite la Creazione guidata modello di data mining è possibile eseguire le operazioni seguenti:
- Specificare se la struttura e i modelli di data mining devono essere creati in base a un database relazionale o a un cubo esistente di un database OLAP.
- Specificare l'algoritmo da utilizzare per la definizione del modello iniziale.
- Specificare la vista origine dati o la dimensione del cubo che contiene i dati di training in base ai quali definire il modello.
- Definire il case set, specificando una tabella del case e le tabelle nidificate di un'origine dei dati relazionale, oppure le colonne chiave del case e le colonne del livello del case di un'origine dei dati OLAP.
- Definire la modalità di utilizzo delle colonne del case set.
- Identificare automaticamente e impostare il tipo di contenuto e di dati delle colonne.
- Sezionare il cubo nel caso di modelli di data mining basati su un'origine dei dati OLAP.
- Assegnare un nome alla nuova struttura di data mining e al modello di data mining iniziale.
- Creare una nuova dimensione di data mining nel caso di modelli di data mining basati su un'origine dei dati OLAP.
Dopo aver completato la Creazione guidata modello di data mining, tramite Progettazione modelli di data mining è possibile modificare la struttura e i modelli di data mining, nonché eseguire l'esplorazione e la stima in base ai modelli.
Per ulteriori informazioni, vedere Progettazione modelli di data mining.
Utilizzo della Creazione guidata modello di data mining
Per avviare la Creazione guidata modello di data mining, aggiungere una nuova struttura di data mining a un progetto di Analysis Services tramite Esplora soluzioni o il menu Progetto di Business Intelligence Development Studio.
La Creazione guidata modello di data mining viene eseguita in due modi diversi a seconda del tipo di origine dei dati:
- Modelli di data mining di tipo relazionale
- Modelli di data mining di tipo OLAP
Modelli di data mining di tipo relazionale
Quando in Analysis Services si definisce un modello di data mining in base a un'origine dei dati relazionale, nella Creazione guidata modello di data mining è necessario specificare innanzitutto che la definizione della struttura del modello deve essere basata su un database relazionale esistente. È quindi necessario specificare la tecnica di data mining da applicare selezionando l'algoritmo più appropriato al tipo di analisi di data mining desiderato.
Per ulteriori informazioni, vedere Algoritmi di data mining.
Impostazione della vista origine dati e dei tipi di tabella
Nei passaggi successivi della creazione guidata viene selezionata la vista origine dati desiderata per la definizione della struttura di data mining e viene specificata una tabella del case. Quest'ultima include i dati di training che verranno utilizzati per il training del modello di data mining. Se i dati si trovano in più tabelle, è inoltre possibile specificare le tabelle da nidificare all'interno della tabella del case.
Per ulteriori informazioni, vedere Tabelle nidificate.
Impostazione della modalità di utilizzo delle colonne
Dopo aver specificato la tabella del case e le tabelle nidificate, è necessario impostare la modalità di utilizzo delle varie colonne delle tabelle che verranno incluse nella struttura di data mining. Le colonne di cui non si specifica la modalità di utilizzo non vengono incluse nella struttura di data mining. Esistono quattro tipi di colonne di data mining, ovvero chiave, di input, stimabile e una combinazione di colonna di input e stimabile. Le colonne chiave contengono l'identificatore univoco di ogni riga di una tabella. Alcuni modelli di data mining, ad esempio i modelli clustering delle sequenze e serie temporali, possono includere più colonne chiave. Le colonne di input contengono informazioni per l'esecuzione di stime. Le colonne stimabili contengono le informazioni che vengono stimate nel modello di data mining.
Una serie di tabelle potrebbero contenere, ad esempio, gli ID dei clienti, informazioni di tipo demografico e la somma spesa da ogni cliente in un negozio specifico. L'ID del cliente identifica in modo univoco il cliente e mette in correlazione la tabella del case con le tabelle nidificate. Questa colonna viene pertanto utilizzata come colonna chiave. È possibile utilizzare alcune colonne contenenti dati demografici come colonne di input e la colonna relativa alla somma spesa da ogni cliente come colonna stimabile e definire quindi un modello di data mining che mette in relazione i dati demografici con la somma spesa da ogni cliente in un negozio specifico. Questo modello può essere utilizzato come base per marketing diretto.
Nella Creazione guidata modello di data mining è disponibile la funzionalità Suggerisci, che risulta abilitata quando si seleziona una colonna stimabile. I set di dati includono spesso un numero di colonne maggiore rispetto a quello desiderato per la definizione di un modello di data mining. La funzionalità Suggerisci calcola un valore numerico compreso tra 0 e 1 che descrive la relazione tra ogni colonna del set di dati e la colonna stimabile. In base a questo valore vengono indicate le colonne da utilizzare come input per il modello. Se si utilizza la funzionalità Suggerisci, è possibile utilizzare la selezione di colonne indicate, modificare la selezione in base alle specifiche esigenze o ignorare la selezione di colonne suggerita.
Impostazione del tipo di contenuto e di dati
Dopo aver selezionato una o più colonne stimabili e colonne di input, è possibile specificare il tipo di contenuto e di dati per ogni colonna.
Per ulteriori informazioni, vedere Tipi di dati (data mining) e Tipi di contenuto del data mining
Completamento della creazione guidata
Nell'ultimo passaggio della creazione guidata viene assegnato un nome alla struttura di data mining e al modello di data mining associato. Se si seleziona Consenti drill-through, per il modello viene abilitata la funzionalità drill-through che consente di esplorare i dati di origine utilizzati per definire il modello.
Torna all'inizio
Modelli di data mining di tipo OLAP
Quando in Analysis Services si crea un modello di data mining multidimensionale in base a un'origine dei dati OLAP, nella Creazione guidata modello di data mining è necessario specificare innanzitutto che si desidera basare la definizione della struttura del modello su un cubo esistente. È quindi necessario specificare la tecnica di data mining da applicare selezionando l'algoritmo più appropriato al tipo di analisi di data mining desiderato.
Per ulteriori informazioni, vedere Algoritmi di data mining.
Impostazione di origine dei dati e chiave del case
Nel passaggio successivo vengono selezionati la dimensione del cubo da utilizzare come origine dei dati per la definizione della struttura di data mining e l'attributo da utilizzare come chiave, o chiave del case, del modello di data mining.
[!NOTA] Il modello di data mining OLAP che si sta definendo e il cubo di origine utilizzato devono essere presenti entrambi nello stesso database di Analysis Services.
Impostazione delle colonne del livello del case e della modalità di utilizzo delle colonne
Dopo aver selezionato una chiave del case, le misure e gli attributi ad essa associati vengono visualizzati in una visualizzazione Struttura nel passaggio successivo della creazione guidata. Nell'elenco selezionare gli attributi e le misure da utilizzare come colonne della struttura. Queste colonne sono denominate colonne del livello del case. In modo analogo al modello di tipo relazione, è necessario specificare anche la modalità di utilizzo di ogni colonna all'interno della struttura, operazione eseguita nel passaggio successivo della creazione guidata. Le colonne possono essere colonne chiave, di input, stimabili e di input stimabili. È possibile non selezionare alcun tipo di colonna.
Aggiunta di tabelle nidificate
Nella Creazione guidata modello di data mining per la creazione di un modello OLAP è possibile aggiungere tabelle nidificate alla struttura del modello di data mining. Nel passaggio Impostazione utilizzo colonne modello di data mining fare clic su Aggiungi tabelle nidificate. Verrà visualizzata una finestra di dialogo distinta per l'aggiunta di tabelle nidificate. Sono visualizzati solo i gruppi di misure validi per la dimensione specifica. Selezionare un gruppo di misure contenente la chiave esterna della dimensione del case. Specificare quindi la modalità di utilizzo di ogni colonna nel gruppo di misure, ovvero di input o stimabile. La tabella nidificata verrà quindi aggiunta alla tabella del case automaticamente. Il nome predefinito della tabella nidificata corrisponde al nome della dimensione nidificata. È tuttavia possibile rinominare sia la tabella nidificata che le colonne corrispondenti. Per ulteriori informazioni, vedere Tabelle nidificate.
Impostazione del tipo di contenuto e di dati
Dopo aver selezionato una o più colonne stimabili e colonne di input, è possibile specificare il tipo di contenuto e di dati per ogni colonna.
Per ulteriori informazioni, vedere Tipi di dati (data mining) e Tipi di contenuto del data mining.
Sezionamento del cubo di origine
Nella creazione guidata specifica per OLAP, è possibile limitare l'ambito del modello di data mining sezionando il cubo di origine prima di eseguire il training del modello. L'operazione di sezionamento del cubo è simile all'aggiunta di una clausola WHERE in un'istruzione SQL. Se, ad esempio, un cubo contiene informazioni sull'acquisto di prodotti, è possibile impostare l'età su oltre 30, il genere su solo donne e la data di acquisto su successiva al marzo 2000. In tal modo l'ambito del modello risulta limitato alle sole donne che hanno più di 30 anni e che hanno acquistato un prodotto dopo il marzo 2000.
Completamento della creazione guidata
Nell'ultimo passaggio della creazione guidata viene assegnato un nome alla struttura di data mining e al modello di data mining associato. Se si seleziona Consenti drill-through, per il modello viene abilitata la funzionalità drill-through che consente di esplorare i dati di origine utilizzati per definire il modello. A seconda del modello di data mining, è inoltre possibile specificare se aggiungere una nuova dimensione al cubo di origine o creare un nuovo cubo in base al modello.
Torna all'inizio
Vedere anche
Concetti
Creazione di una nuova struttura di data mining
Gestione dei modelli di data mining in Progettazione modelli di data mining
Concetti di base sul data mining
Utilizzo degli strumenti di data mining
Utilizzo del data mining
Altre risorse
Procedure per la scheda Struttura di data mining