Requisiti e considerazioni sull'elaborazione (data mining)

Articolo
07/30/2013

In questo argomento vengono illustrate alcune considerazioni tecniche da tenere presenti quando si elaborano oggetti di data mining. Per una spiegazione generale dell'elaborazione e della modalità di applicazione al data mining, vedere Elaborazione di oggetti di data mining.

Query sull'archivio relazionale

Elaborazione di strutture di data mining

Elaborazione di modelli di data mining

Query sull'archivio relazionale durante l'elaborazione

Per il data mining, l'elaborazione prevede tre fasi: esecuzione di query sui dati di origine, determinazione di statistiche non elaborate e utilizzo della definizione e dell'algoritmo del modello per eseguire il training del modello di data mining.

Il server Analysis Services esegue query sul database che fornisce i dati non elaborati. Tale database può essere un'istanza di SQL Server 2012 o una versione precedente del Motore di database di SQL Server. Quando si elabora una struttura di data mining, i dati presenti nell'origine vengono trasferiti nella struttura di data mining e resi persistenti su disco in un nuovo formato compresso. Non tutte le colonne dell'origine dati vengono elaborate, ma solo quelle incluse nella struttura di data mining, come definito dalle associazioni.

Con questi dati, in Analysis Services viene compilato un indice di tutti i dati e le colonne discretizzate e viene creato un indice separato per le colonne continue. Per ogni tabella nidificata, viene eseguita una query per creare l'indice e viene generata una query aggiuntiva per elaborare le relazioni tra ogni coppia di tabella nidificata e tabella del case. La creazione di più query è necessaria per elaborare uno speciale archivio dati multidimensionale interno. È possibile limitare il numero di query inviate da Analysis Services all'archivio relazionale impostando la proprietà del server, DatabaseConnectionPoolMax. Per ulteriori informazioni, vedere Proprietà OLAP.

Quando si elabora il modello, quest'ultimo non legge nuovamente i dati dall'origine dati, ma ne ottiene il riepilogo dalla struttura di data mining. Utilizzando il cubo creato e i dati dell'indice e del case memorizzati nella cache, nel server vengono creati thread indipendenti per eseguire il training dei modelli.

Per ulteriori informazioni sulle edizioni di SQL Server che supportano l'elaborazione parallela dei modelli, vedere Funzionalità supportate dalle edizioni di SQL Server 2012 (https://go.microsoft.com/fwlink/?linkid=232473).

Elaborazione di strutture di data mining

È possibile elaborare una struttura di data mining insieme a tutti i modelli dipendenti o separatamente. L'elaborazione di una struttura di data mining separatamente dai modelli può essere utile quando si prevede che l'elaborazione di alcuni modelli richieda molto tempo e si desidera rinviare tale operazione.

Per ulteriori informazioni, vedere Elaborare una struttura di data mining.

Se si desidera risparmiare spazio su disco, ricordarsi che in Analysis Services i dati delle strutture di data mining memorizzati nella cache vengono conservati localmente. Ciò significa che tutti i dati di training vengono scritti nel disco rigido locale. Se non si desidera memorizzare i dati nella cache, è possibile modificare il comportamento predefinito impostando la proprietà MiningStructureCacheMode nella struttura di data mining su ClearAfterProcessing. La cache verrà eliminata dopo l'elaborazione dei modelli; tuttavia, verrà anche disabilitato il drill-through sulla struttura di data mining. Per ulteriori informazioni, vedere Query drill-through (Data mining).

Inoltre, se si cancella la cache, non sarà possibile utilizzare il set di test di controllo eventualmente specificato e la definizione della partizione del set di test andrà persa. Per ulteriori informazioni sui set di test di controllo, vedere Set di dati di training e di testing.

Elaborazione di modelli di data mining

È possibile elaborare un modello di data mining separatamente dalla struttura di data mining associata oppure elaborare tutti i modelli basati sulla struttura insieme alla struttura stessa.

Per ulteriori informazioni, vedere Elaborare un modello di data mining.

Tuttavia, in SQL Server Data Tools (SSDT) e SQL Server Management Studio, non è possibile selezionare più modelli di data mining da elaborare con la struttura. Se è necessario controllare quali modelli vengono elaborati, è necessario selezionarli singolarmente o utilizzare XMLA o DMX per elaborarli in serie.

Necessità di rielaborazione

È necessario elaborare i modelli di Analysis Services definiti prima di poter iniziare a utilizzarli. È inoltre necessario rielaborare i modelli di data mining ogni volta che si modifica la struttura del modello di data mining, si aggiornano i dati di training, si modifica un modello di data mining esistente oppure si aggiunge un nuovo modello di data mining alla struttura.

I modelli di data mining vengono inoltre elaborati in questi scenari:

Distribuzione di un progetto: in base alle impostazioni e allo stato corrente del progetto, i modelli di data mining in esso contenuti sono in genere elaborati completamente al momento della distribuzione del progetto.

Quando si inizia la distribuzione, l'elaborazione viene avviata automaticamente, a meno che nel server di Analysis Services vi sia una versione elaborata in precedenza e non siano state apportate modifiche strutturali. È possibile distribuire un progetto selezionando Distribuisci soluzione nell'elenco a discesa oppure premendo F5. È possibile:

Per ulteriori informazioni sull'impostazione delle proprietà di distribuzione di Analysis Services che consentono di controllare la modalità di distribuzione dei modelli di data mining, vedere Distribuzione di soluzioni di data mining.

Spostamento di un modello di data mining: quando si sposta un modello di data mining tramite il comando EXPORT, viene esportata solo la definizione del modello, incluso il nome della struttura di data mining che si prevede fornisca i dati al modello.

Requisiti di rielaborazione per gli scenari seguenti utilizzando i comandi EXPORT e IMPORT:

La struttura di data mining esiste nell'istanza di destinazione e la struttura di data mining è in uno stato non elaborato.

È necessario rielaborare sia la struttura sia il modello.
La struttura di data mining esiste nell'istanza di destinazione ed è stata elaborata. È stato esportato solo il modello di data mining.

Il modello può essere utilizzato senza elaborazione.
È inoltre stata esportata la definizione della struttura di data mining tramite la parola chiave WITH DEPENDENCIES.

È necessario rielaborare sia la struttura sia il modello.

Per ulteriori informazioni, vedere Esportare e importare gli oggetti di data mining.

Vedere anche

Concetti

Strutture di data mining (Analysis Services – Data mining)

Elaborazione di oggetti del modello multidimensionale

Condividi tramite

Requisiti e considerazioni sull'elaborazione (data mining)

Query sull'archivio relazionale durante l'elaborazione

Elaborazione di strutture di data mining

Elaborazione di modelli di data mining

Necessità di rielaborazione

Vedere anche

Concetti

Risorse aggiuntive