Modelli di data mining (Analysis Services - Data mining)
In questa sezione viene illustrata l'architettura di base di un modello di data mining, vengono fornite informazioni generali sulle proprietà di un modello di data mining e vengono descritti i modi in cui è possibile creare e utilizzare un modello di data mining.
Mining Model Architecture
Defining Mining Models
Mining Model Properties
Mining Model Columns
Processing Mining Models
Viewing and Querying Mining Models
Architettura del modello di data mining
Un modello di data mining ottiene i dati da una struttura di data mining e li analizza tramite un algoritmo di data mining. La struttura di data mining e il modello di data mining sono oggetti separati. In una struttura di data mining sono archiviate le informazioni che definiscono l'origine dati. In un modello di data mining sono archiviate le informazioni derivate dall'elaborazione statistica dei dati, ad esempio gli schemi ottenuti come risultato di un'analisi.
Un modello di data mining rimane vuoto finché i dati forniti dalla struttura di data mining non vengono elaborati e analizzati. Dopo essere stato elaborato, un modello di data mining contiene metadati, risultati e associazioni alla struttura di data mining.
I metadati specificano il nome del modello e il server in cui è archiviato, oltre a una definizione del modello che include un elenco delle colonne della struttura di data mining utilizzate per la creazione del modello, le definizioni di filtri facoltativi applicati durante l'elaborazione del modello e l'algoritmo utilizzato per analizzare i dati. La scelta delle colonne, dei filtri e dell'algoritmo influisce notevolmente sui risultati dell'analisi. Ad esempio, se si creano un modello di clustering e un modello di albero delle decisioni utilizzando gli stessi dati, il contenuto del modello potrebbe essere molto diverso, poiché tali modelli utilizzano algoritmi e filtri diversi. Per ulteriori informazioni, vedere Contenuto del modello di data mining (Analysis Services - Data mining).
I risultati archiviati nel modello variano a seconda dell'algoritmo, ma possono includere schemi, set di elementi, regole e formule. Questi risultati possono essere utilizzati per l'esecuzione di stime.
Le associazioni archiviate nel modello si riferiscono ai dati memorizzati nella cache della struttura di data mining. Se i dati sono stati memorizzati nella cache della struttura e non sono stati cancellati dopo l'elaborazione, queste associazioni consentono di eseguire il drill-through dai risultati ai case che supportano i risultati. Tuttavia, i dati effettivi vengono archiviati nella cache della struttura, non nel modello.
[Torna all'inizio]
Definizione dei modelli di data mining
È possibile creare un modello di data mining eseguendo i passaggi seguenti:
Creare la struttura di data mining sottostante.
Selezionare un algoritmo.
Specificare le colonne e l'utilizzo del modello.
Facoltativamente, impostare i parametri per ottimizzare l'elaborazione attraverso l'algoritmo.
Elaborare il modello.
Per semplificare la gestione dei modelli di data mining, in Analysis Services sono disponibili gli strumenti seguenti:
La Creazione guidata modello di data mining consente di creare una struttura e un modello di data mining correlato. Si tratta del metodo più semplice da utilizzare. La procedura guidata crea automaticamente la struttura di data mining richiesta e semplifica la configurazione delle impostazioni importanti.
È possibile utilizzare un'istruzione DMX CREATE MODEL per definire un modello. La struttura richiesta viene creata automaticamente come parte del processo; pertanto, con questo metodo non è possibile riutilizzare una struttura esistente. Utilizzare questo metodo se si conosce con esattezza il modello che si desidera creare.
È possibile utilizzare un'istruzione DMX ALTER STRUCTURE ADD MODEL per aggiungere un nuovo modello di data mining a una struttura esistente. Utilizzare questo metodo per provare a utilizzare modelli diversi basati sullo stesso set di dati.
È possibile creare modelli di data mining anche a livello di codice, tramite AMO o XML/A o tramite altri client quali Client di data mining per Excel. Per ulteriori informazioni, vedere gli argomenti seguenti:
Libreria AMO (Analysis Management Objects)
[Torna all'inizio]
Proprietà dei modelli di data mining
Ogni modello di data mining dispone di proprietà che definiscono il modello e i relativi metadati. Tali proprietà possono includere il nome, la descrizione, la data dell'ultima elaborazione del modello, le autorizzazioni per il modello e qualsiasi filtro sui dati utilizzato per il training.
Ogni modello di data mining dispone anche di proprietà derivate dalla struttura di data mining che descrivono le colonne di dati utilizzate dal modello. Se la colonna è una tabella nidificata, è anche possibile applicarvi un filtro separato.
Inoltre, ogni modello di data mining contiene due proprietà speciali: Algorithm e Usage.
Proprietà dell'algoritmo Specifica l'algoritmo utilizzato per creare il modello. Gli algoritmi disponibili dipendono dal provider utilizzato. Per un elenco degli algoritmi inclusi in SQL ServerAnalysis Services, vedere Algoritmi di data mining (Analysis Services - Data mining). La proprietà Algorithm si applica al modello di data mining e può essere impostata solo una volta per ogni modello. È possibile modificare l'algoritmo in un secondo momento, ma alcune colonne nel modello di data mining potrebbero diventare non valide se non sono supportate dall'algoritmo scelto. È inoltre necessario rielaborare sempre il modello dopo le modifiche.
**proprietà Usage **Definisce il modo in cui ogni colonna viene utilizzata dal modello. È possibile definire l'utilizzo della colonna come Input, Predict, Predict Onlyo Key. La proprietà Usage si applica alle singole colonne del modello di data mining e deve essere impostata singolarmente per ogni colonna inclusa in un modello. Se la struttura contiene una colonna che non si utilizza nel modello, l'utilizzo viene impostato su Ignore.
È possibile modificare il valore delle proprietà del modello di data mining dopo avere creato un modello. Tuttavia, qualsiasi modifica, anche al nome del modello di data mining, richiede la rielaborazione del modello. Dopo avere rielaborato il modello, è possibile visualizzare risultati diversi.
[Torna all'inizio]
Colonne del modello di data mining
Analogamente alla struttura, il modello di data mining contiene colonne. È possibile scegliere le colonne della struttura di data mining da utilizzare nel modello. Oltre a utilizzare le colonne presenti nella struttura di data mining sottostante, è possibile creare copie delle colonne della struttura di data mining e rinominarle o modificarne l'utilizzo.
In base all'algoritmo scelto, alcune colonne della struttura di data mining potrebbero essere incompatibili con il modello o condurre a risultati insufficienti. È necessario rivedere attentamente i dati nella struttura e includere nel modello solo le colonne pertinenti per l'analisi. Se si ritiene che una colonna non debba essere utilizzata, non è necessario eliminarla dalla struttura o dal modello di data mining: è sufficiente impostare un flag sulla colonna affinché venga ignorata durante la creazione del modello. Ciò significa che la colonna, pur rimanendo nella struttura di data mining, non sarà utilizzata nel modello di data mining. Se il drill-through dal modello alla struttura di data mining è abilitato, sarà possibile recuperare in un secondo momento le informazioni dalla colonna.
Dopo avere creato il modello, è possibile apportare modifiche, ad esempio aggiungere o rimuovere colonne oppure modificare il nome del modello. Tuttavia, qualsiasi modifica, anche soltanto ai metadati del modello, richiede la rielaborazione del modello.
Per ulteriori informazioni, vedere Colonne della struttura di data mining e Colonne del modello di data mining.
[Top]
Elaborazione dei modelli di data mining
Un modello di data mining è un oggetto vuoto finché non viene elaborato. Quando si elabora un modello, i dati memorizzati nella cache della struttura vengono filtrati, se è stato definito un filtro nel modello, e quindi analizzati dall'algoritmo. Quest'ultimo identifica regole e schemi all'interno dei dati e successivamente utilizza tali elementi per popolare il modello. Per ulteriori informazioni sull'utilizzo degli algoritmi per la creazione dei modelli di data mining, vedere Algoritmi di data mining (Analysis Services - Data mining).
Dopo l'elaborazione, nel modello di data mining vengono archiviate le informazioni sui risultati dell'analisi. Per ulteriori informazioni sul tipo di dati archiviati in un modello di data mining, vedere Contenuto del modello di data mining (Analysis Services - Data mining).
[Torna all'inizio]
Visualizzazione ed esecuzione di query sui modelli di data mining
Dopo avere elaborato un modello, è possibile esaminarlo tramite i visualizzatori personalizzati disponibili in Business Intelligence Development Studio e in SQL Server Management Studio. Per ulteriori informazioni sui visualizzatori personalizzati disponibili in Analysis Services, vedere Visualizzazione di un modello di data mining.
È inoltre possibile creare query sul modello di data mining per eseguire stime oppure recuperare i metadati o gli schemi creati dal modello. Le query vengono create tramite DMX (Data Mining Extensions). Per informazioni sui diversi tipi di query che è possibile utilizzare rispetto a un modello di data mining, vedere Esecuzione di query sui modelli di data mining (Analysis Services - Data mining).
Vedere anche