Requisiti e aspetti da considerare sull'elaborazione (Data Mining)

In questo argomento vengono descritte alcune considerazioni tecniche da tenere presenti durante l'elaborazione di oggetti di data mining. Per una spiegazione generale dell'elaborazione e di come si applica al data mining, vedere Elaborazione di oggetti di data mining.

Query sui database relazionali

Elaborazione di Strutture di Mining

Elaborazione di modelli di mining

Query nella memoria relazionale in fase di elaborazione

Nel data mining ci sono tre fasi per l'elaborazione: esecuzione di query sui dati di origine, calcolo delle statistiche grezze e utilizzo della definizione del modello e dell'algoritmo per addestrare il modello di data mining.

Il server Analysis Services genera query sul database che fornisce i dati non elaborati. Questo database potrebbe essere un'istanza di SQL Server 2014 o una versione precedente del motore di database di SQL Server. Quando si elabora una struttura di data mining, i dati nell'origine vengono trasferiti alla struttura di data mining e salvati in modo permanente su disco in un nuovo formato compresso. Non tutte le colonne nell'origine dati vengono analizzate: solo le colonne incluse nella struttura di data mining, come definito dai vincoli.

Usando questi dati, Analysis Services compila un indice di tutti i dati e le colonne discretizzate e crea un indice separato per le colonne continue. Viene eseguita una query per ogni tabella nidificata per creare l'indice e viene generata una query aggiuntiva per ogni tabella nidificata per elaborare le relazioni tra ogni coppia di una tabella nidificata e una tabella dei casi. Il motivo della creazione di più query consiste nell'elaborare un archivio dati multidimensionale interno speciale. È possibile limitare il numero di query inviate da Analysis Services all'archivio relazionale impostando la proprietà del server , DatabaseConnectionPoolMax. Per altre informazioni, vedere Proprietà OLAP.

Quando si elabora il modello, questo non rilegge i dati dall'origine, ma ottiene il riepilogo di dati dalla struttura di mining. Usando il cubo creato, insieme all'indice memorizzato nella cache e ai dati del case che sono stati memorizzati nella cache, il server crea thread indipendenti per addestrare i modelli.

Per altre informazioni sulle edizioni di SQL Server che supportano l'elaborazione di modelli paralleli, vedere Funzionalità supportate dalle edizioni di SQL Server 2012 (https://go.microsoft.com/fwlink/?linkid=232473).

Elaborazione di strutture di data mining

Una struttura di data mining può essere elaborata insieme a tutti i modelli dipendenti o separatamente. L'elaborazione di una struttura di data mining separatamente dai modelli può essere utile quando alcuni modelli richiedono molto tempo per l'elaborazione e si desidera rinviare l'operazione.

Per altre informazioni, vedere Elaborare una struttura di data mining.

Se si è interessati a conservare lo spazio su disco rigido, si noti che Analysis Services mantiene le cache della struttura di data mining in locale. Ovvero, scrive tutti i dati di training nel disco rigido locale. Se non si desidera che i dati vengano memorizzati nella cache, è possibile modificare l'impostazione predefinita impostando la MiningStructureCacheMode proprietà nella struttura di data mining su ClearAfterProcessing. Questa operazione eliminerà la cache dopo l'elaborazione dei modelli; tuttavia, disabiliterà anche il drill-through nella struttura di data mining. Per ulteriori informazioni, vedere Drillthrough Queries (Data Mining).

Inoltre, se si cancella la cache, non sarà possibile usare il set di test di controllo, se ne è stato definito uno e la definizione della partizione del set di test andrà persa. Per altre informazioni sui set di test di controllo, vedere Set di dati di training e test.

Elaborazione di modelli di data mining

È possibile elaborare un modello di data mining separatamente dalla struttura di data mining associata oppure elaborare tutti i modelli basati sulla struttura, insieme alla struttura.

Per altre informazioni, vedere Elaborare un modello di mining.

Tuttavia, in SQL Server Data Tools (SSDT) e SQL Server Management Studio non è possibile selezionare più modelli di data mining da elaborare con la struttura. Se è necessario controllare quali modelli vengono elaborati, è necessario selezionarli singolarmente oppure usare XMLA o DMX per elaborare i modelli in modo seriale.

Quando la rielaborazione è obbligatoria

È necessario elaborare i modelli di Analysis Services definiti prima di iniziare a usarli. È inoltre necessario rielaborare i modelli di data mining ogni volta che si modifica la struttura del modello di data mining, si aggiornano i dati di training, si modifica un modello di data mining esistente o si aggiunge un nuovo modello di data mining alla struttura.

I modelli di estrazione dei dati vengono elaborati anche in questi scenari:

Distribuzione di un progetto: a seconda delle impostazioni del progetto e dello stato corrente del progetto, i modelli di data mining nel progetto vengono in genere elaborati completamente quando il progetto viene distribuito.

Quando si avvia la distribuzione, l'elaborazione viene avviata automaticamente, a meno che non sia presente una versione elaborata in precedenza nel server Analysis Services e non siano state apportate modifiche strutturali. È possibile distribuire un progetto selezionando Distribuisci soluzione dall'elenco a discesa o premendo F5. È possibile

Per altre informazioni su come impostare le proprietà di distribuzione di Analysis Services che controllano la modalità di distribuzione dei modelli di data mining, vedere Distribuzione di soluzioni di data mining.

Spostamento di un modello di data mining: quando si sposta un modello di data mining usando il comando EXPORT, viene esportata solo la definizione del modello, che include il nome della struttura di data mining prevista per fornire dati al modello.

Rielaborare i requisiti per gli scenari seguenti usando i comandi EXPORT e IMPORT:

La struttura di data mining è presente nell'istanza di destinazione e la struttura di data mining si trova in uno stato non elaborato.

Sia la struttura che il modello devono essere rielaborati.
La struttura di data mining esiste nell'istanza di destinazione e la struttura di data mining è stata elaborata. Solo il modello di data mining è stato esportato.

Il modello può essere usato senza elaborazione.
La definizione della struttura di data mining è stata esportata anche usando la parola chiave WITH DEENDENCIES.

Sia la struttura che il modello devono essere rielaborati.

Per altre informazioni, vedere Esportare e importare oggetti di data mining.

Vedere anche

Strutture di estrazione dati (Analysis Services - Estrazione dati)
Strutture di Data Mining (Analysis Services - Data Mining)
Elaborazione di oggetti del modello multidimensionale

Last updated on 2017-06-13

Condividi tramite