Elaborazione di strutture e modelli (Analysis Services - Data mining)
Un oggetto di data mining è soltanto un contenitore vuoto finché non viene elaborato. L'elaborazione di un modello di data mining viene anche definita training.
Elaborazione di strutture di data mining: una struttura di data mining ottiene i dati da un'origine dati esterna, secondo quanto definito dalle associazioni delle colonne e dai metadati di utilizzo, dopodiché li legge. Questi dati vengono letti completamente e successivamente analizzati per estrarre diverse statistiche. In Analysis Services una rappresentazione compressa dei dati, ideale per l'analisi basata sugli algoritmi di data mining, viene archiviata in una cache locale. È possibile conservare questa cache oppure eliminarla dopo l'elaborazione dei modelli. Per impostazione predefinita, la cache viene archiviata. Per ulteriori informazioni, vedere Procedura: Elaborazione di una struttura di data mining.
Elaborazione di modelli di data mining: un modello di data mining contiene solo definizioni finché non viene elaborato. Per elaborare un modello di data mining, è necessario elaborare la struttura di data mining sulla quale è basato. Il modello di data mining ottiene i dati dalla cache della struttura di data mining, applica i filtri eventualmente creati sul modello, dopodiché passa il set di dati attraverso l'algoritmo per rilevare gli schemi. Al termine dell'elaborazione, il modello archivia solo i risultati dell'elaborazione, non i dati stessi. Per ulteriori informazioni, vedere Procedura: Elaborazione di un modello di data mining.
Nel diagramma seguente viene illustrato il flusso di dati al momento dell'elaborazione di una struttura di data mining e al momento dell'elaborazione di un modello di data mining.
Query sull'archivio relazionale durante l'elaborazione
L'elaborazione prevede tre fasi: esecuzione di query sui dati di origine, determinazione di statistiche non elaborate e utilizzo della definizione e dell'algoritmo del modello per eseguire il training del modello di data mining.
Il server Analysis Services esegue query sul database che fornisce i dati non elaborati. Tale database può essere un'istanza di SQL Server 2008 o una versione precedente del Motore di database di SQL Server. Quando si elabora una struttura di data mining, i dati presenti nell'origine vengono trasferiti nella struttura di data mining e resi persistenti su disco in un nuovo formato compresso. Non tutte le colonne dell'origine dati vengono elaborate, ma solo quelle incluse nella struttura di data mining, come definito dalle associazioni.
Con questi dati, in Analysis Services viene creato un indice di tutti i dati e le colonne discretizzate e viene creato un indice separato per le colonne continue. Per ogni tabella nidificata, viene eseguita una query per creare l'indice e viene generata una query aggiuntiva per elaborare le relazioni tra ogni coppia di tabella nidificata e tabella del case. La creazione di più query è necessaria per elaborare uno speciale cubo OLAP (Online Analytical Processing) interno. È possibile limitare il numero di query inviate da Analysis Services all'archivio relazionale impostando la proprietà del server DatabaseConnectionPoolMax. Per ulteriori informazioni, vedere Proprietà OLAP.
Quando si elabora il modello, quest'ultimo non legge nuovamente i dati dall'origine dati, ma ne ottiene il riepilogo dalla struttura di data mining. Utilizzando il cubo creato e i dati dell'indice e del case memorizzati nella cache, nel server vengono creati thread indipendenti per eseguire il training dei modelli.
In SQL Server Enterprise Edition tutte le operazioni di elaborazione vengono eseguite in parallelo, mentre in SQL Server Standard Edition le operazioni di elaborazione sono serializzate.
Visualizzazione dei risultati dell'elaborazione
Dopo essere stata elaborata, una struttura di data mining contiene una rappresentazione compressa dei dati per l'utilizzo nell'analisi statistica. Se la cache non è stata cancellata, è possibile accedere ai dati in essa contenuti nelle modalità seguenti:
Creazione di una query DMX (Data Mining Extensions) sul modello ed esecuzione del drill-through nella struttura. Per ulteriori informazioni, vedere SELECT FROM <model>.CASES (DMX).
Esplorazione di un modello basato sulla struttura e utilizzo di una delle opzioni nell'interfaccia utente per eseguire il drill-through nei case della struttura. Per ulteriori informazioni, vedere Visualizzazione di un modello di data mining oppure Procedura: Esecuzione del drill-through sui dati del case da un modello di data mining.
Creazione di una query DMX nei case della struttura. Per ulteriori informazioni, vedere SELECT FROM <structure>.CASES.
Dopo essere stato elaborato, un modello di data mining contiene solo gli schemi derivati dall'analisi e i mapping dei risultati del modello ai dati di training memorizzati nella cache. È possibile esplorare o eseguire una query sui risultati del modello, definiti contenuto del modello, oppure è possibile eseguire una query sui case del modello e della struttura, purché siano stati memorizzati nella cache.
Il contenuto di ciascun modello di data mining dipende dall'algoritmo utilizzato per creare il modello stesso. Ad esempio, se un modello è un modello di clustering e un altro è un modello di albero delle decisioni, il contenuto del modello è molto diverso anche se i modelli utilizzano esattamente gli stessi dati. Per ulteriori informazioni, vedere Contenuto del modello di data mining (Analysis Services - Data mining).
Vedere anche