Requisiti e considerazioni sull'elaborazione (data mining)

Articolo
10/31/2023

Si applica a: SQL Server 2019 e versioni precedenti di Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

Il data mining è stato deprecato in SQL Server 2017 Analysis Services e ora è stato interrotto in SQL Server 2022 Analysis Services. La documentazione non viene aggiornata per le funzionalità deprecate e non più disponibili. Per altre informazioni, vedere Compatibilità con le versioni precedenti di Analysis Services.

In questo argomento vengono illustrate alcune considerazioni tecniche da tenere presenti quando si elaborano oggetti di data mining. Per una spiegazione generale dell'elaborazione e della modalità di applicazione al data mining, vedere Elaborazione di oggetti di data mining.

Query sull'archivio relazionale

Elaborazione di strutture di data mining

Elaborazione di modelli di data mining

Query sull'archivio relazionale durante l'elaborazione

Per il data mining, l'elaborazione prevede tre fasi: esecuzione di query sui dati di origine, determinazione di statistiche non elaborate e utilizzo della definizione e dell'algoritmo del modello per eseguire il training del modello di data mining.

Il server SQL Server Analysis Services genera query al database che fornisce i dati non elaborati. Questo database potrebbe essere un'istanza di SQL Server 2017 o una versione precedente del motore di database SQL Server. Quando si elabora una struttura di data mining, i dati presenti nell'origine vengono trasferiti nella struttura di data mining e resi persistenti su disco in un nuovo formato compresso. Non tutte le colonne dell'origine dati vengono elaborate, ma solo quelle incluse nella struttura di data mining, come definito dalle associazioni.

Usando questi dati, SQL Server Analysis Services compila un indice di tutti i dati e colonne discretizzate e crea un indice separato per le colonne continue. Per ogni tabella nidificata, viene eseguita una query per creare l'indice e viene generata una query aggiuntiva per elaborare le relazioni tra ogni coppia di tabella nidificata e tabella del case. La creazione di più query è necessaria per elaborare uno speciale archivio dati multidimensionale interno. È possibile limitare il numero di query inviate SQL Server Analysis Services all'archivio relazionale impostando la proprietà del server DatabaseConnectionPoolMax. Per altre informazioni, vedere Proprietà OLAP.

Quando si elabora il modello, quest'ultimo non legge nuovamente i dati dall'origine dati, ma ne ottiene il riepilogo dalla struttura di data mining. Utilizzando il cubo creato e i dati dell'indice e del case memorizzati nella cache, nel server vengono creati thread indipendenti per eseguire il training dei modelli.

Per altre informazioni sulle edizioni di SQL Server che supportano l'elaborazione di modelli paralleli, vedere Funzionalità supportate dalle edizioni di SQL Server 2012 (https://go.microsoft.com/fwlink/?linkid=232473).

Elaborazione di strutture di data mining

È possibile elaborare una struttura di data mining insieme a tutti i modelli dipendenti o separatamente. L'elaborazione di una struttura di data mining separatamente dai modelli può essere utile quando si prevede che l'elaborazione di alcuni modelli richieda molto tempo e si desidera rinviare tale operazione.

Per altre informazioni, vedere Elaborare una struttura di data mining.

Se si è interessati a conservare lo spazio su disco rigido, si noti che SQL Server Analysis Services mantiene le cache della struttura di data mining in locale. Ciò significa che tutti i dati di training vengono scritti nel disco rigido locale. Se si preferisce non memorizzare i dati nella cache, è possibile modificare il valore predefinito impostando la proprietà MiningStructureCacheMode nella struttura di data mining su ClearAfterProcessing. La cache verrà eliminata dopo l'elaborazione dei modelli; tuttavia, verrà anche disabilitato il drill-through sulla struttura di data mining. Per altre informazioni, vedere Query drill-through (data mining).

Inoltre, se si cancella la cache, non sarà possibile utilizzare il set di test di controllo eventualmente specificato e la definizione della partizione del set di test andrà persa. Per altre informazioni sui set di test di controllo, vedere Set di dati di training e test.

Elaborazione di modelli di data mining

È possibile elaborare un modello di data mining separatamente dalla struttura di data mining associata oppure elaborare tutti i modelli basati sulla struttura insieme alla struttura stessa.

Per altre informazioni, vedere Elaborare un modello di data mining.

Tuttavia, in SQL Server Data Tools e SQL Server Management Studio, non è possibile selezionare più modelli di data mining da elaborare con la struttura. Se è necessario controllare quali modelli vengono elaborati, è necessario selezionarli singolarmente o utilizzare XMLA o DMX per elaborarli in serie.

Necessità di rielaborazione

È necessario elaborare i modelli di SQL Server Analysis Services definiti prima di iniziare a usarli. È inoltre necessario rielaborare i modelli di data mining ogni volta che si modifica la struttura del modello di data mining, si aggiornano i dati di training, si modifica un modello di data mining esistente oppure si aggiunge un nuovo modello di data mining alla struttura.

I modelli di data mining vengono inoltre elaborati in questi scenari:

Distribuzione di un progetto: in base alle impostazioni e allo stato corrente del progetto, i modelli di data mining in esso contenuti sono in genere elaborati completamente al momento della distribuzione del progetto.

Quando si avvia la distribuzione, l'elaborazione viene avviata automaticamente, a meno che non sia presente una versione elaborata in precedenza nel server SQL Server Analysis Services e non siano state apportate modifiche strutturali. È possibile distribuire un progetto selezionando Distribuisci soluzione nell'elenco a discesa o premendo F5. È possibile

Per altre informazioni su come impostare SQL Server Analysis Services proprietà di distribuzione che controllano la modalità di distribuzione dei modelli di data mining, vedere Distribuzione di soluzioni di data mining.

Spostamento di un modello di data mining: quando si sposta un modello di data mining tramite il comando EXPORT, viene esportata solo la definizione del modello, incluso il nome della struttura di data mining che si prevede fornisca i dati al modello.

Requisiti di rielaborazione per gli scenari seguenti utilizzando i comandi EXPORT e IMPORT:

La struttura di data mining esiste nell'istanza di destinazione e la struttura di data mining è in uno stato non elaborato.

È necessario rielaborare sia la struttura sia il modello.
La struttura di data mining esiste nell'istanza di destinazione ed è stata elaborata. È stato esportato solo il modello di data mining.

Il modello può essere utilizzato senza elaborazione.
È inoltre stata esportata la definizione della struttura di data mining tramite la parola chiave WITH DEPENDENCIES.

È necessario rielaborare sia la struttura sia il modello.

Per altre informazioni, vedere Esportare e importare gli oggetti di data mining.

Vedere anche

Strutture di data mining (Analysis Services – Data mining)
Strutture di data mining (Analysis Services – Data mining)
Elaborazione di un modello multidimensionale (Analysis Services)

Requisiti e considerazioni sull'elaborazione (data mining)

Query sull'archivio relazionale durante l'elaborazione

Elaborazione di strutture di data mining

Elaborazione di modelli di data mining

Necessità di rielaborazione

Vedere anche

Commenti e suggerimenti

Commenti e suggerimenti

Risorse aggiuntive