Condividi tramite


Query di estrazione dei dati

Le query di data mining sono utili per molti scopi. È possibile:

  • Applicare il modello ai nuovi dati per eseguire stime singole o multiple. È possibile specificare valori di input come parametri o in un batch.

  • Ottenere un riepilogo statistico dei dati usati per il training.

  • Estrarre modelli e regole oppure generare un profilo del caso tipico che rappresenta un modello nel modello.

  • Estrarre formule di regressione e altri calcoli che illustrano i modelli.

  • Trova i casi che si adattano a un modello specifico.

  • Recuperare i dettagli sui singoli casi usati nel modello, inclusi i dati non usati nell'analisi.

  • Riallenare un modello aggiungendo nuovi dati o eseguendo una previsione incrociata.

Questa sezione offre una panoramica delle informazioni necessarie per iniziare a usare le query di data mining. Descrive i tipi di query che è possibile creare su oggetti di data mining, introduce gli strumenti di query e i linguaggi di query e fornisce collegamenti ad esempi di query che è possibile creare su modelli compilati usando gli algoritmi forniti in SQL Server Data Mining.

Informazioni sulle query di data mining

Strumenti e interfacce di query

Query per tipi di modello diversi

Requisiti

Comprendere le query di data mining

Il data mining di Analysis Services supporta i tipi di query seguenti:

Prima di creare query, è consigliabile acquisire familiarità con le differenze tra i modelli creati con ognuno degli algoritmi di data mining forniti da SQL Server.

Strumenti e interfacce di query

È possibile compilare query di data mining in modo interattivo usando uno degli strumenti di query forniti da SQL Server. Il generatore di query di stima grafico è disponibile sia in SQL Server Data Tools (SSDT) che in SQL Server Management Studio. Se non hai utilizzato il Generatore di query di previsione prima d'ora, ti consigliamo di seguire i passaggi nell'Esercitazione di base sul data mining per acquisire familiarità con l'interfaccia. Per una rapida panoramica dei passaggi, vedere Creare una Query usando il Generatore di Query di Predizione.

Il generatore di query di stima è utile per avviare query che verranno personalizzate in un secondo momento. È possibile aggiungere facilmente origini dati ed eseguirne il mapping alle colonne, quindi passare alla visualizzazione DMX e personalizzare la query aggiungendo una clausola WHERE o altre funzioni.

Dopo aver acquisito familiarità con i modelli di data mining e come compilare query, è anche possibile scrivere query direttamente usando DMX (Data Mining Extensions). DMX è un linguaggio di query simile a Transact-SQL e che è possibile usare da molti client diversi. DMX è lo strumento preferito per la creazione di stime personalizzate e query complesse. Per un'introduzione a DMX, vedere Creazione ed esecuzione di query su modelli di data mining con DMX: Esercitazioni (Analysis Services - Data mining).

Gli editor DMX sono disponibili sia in SQL Server Data Tools (SSDT) che in SQL Server Management Studio. È anche possibile usare il Generatore di query di previsione per avviare le query, quindi modificare la visualizzazione dell'editor di testo e copiare l'istruzione DMX in un altro client. Per altre informazioni, vedere Interfacce di query di data mining.

È possibile comporre istruzioni DMX a livello di codice e inviarle dal client al server Analysis Services usando AMO o XMLA. DMX è tuttavia il linguaggio che è necessario usare per creare query su un modello di data mining.

È anche possibile eseguire query sui metadati, le statistiche e il contenuto del modello usando dmv (Dynamic Management Views) basati sui set di righe dello schema di data mining. Queste DMV semplificano il recupero di informazioni sul modello digitando istruzioni SELECT; Tuttavia, non è possibile creare stime. Per altre informazioni sulle DMV supportate da Analysis Services, vedere Usare dmv (Dynamic Management Views) per monitorare Analysis Services.

Infine, è possibile creare query di data mining da utilizzare nei pacchetti di Integration Services, usando l'attività Query di data mining o la trasformazione Query di data mining. L'attività del flusso di controllo supporta più tipi di query DMX, mentre la trasformazione del flusso di dati supporta solo query che lavorano con i dati nel flusso di dati, ovvero query che utilizzano la sintassi PREDICTION JOIN.

Query per tipi di modello diversi

L'algoritmo utilizzato quando il modello è stato creato influisce notevolmente sul tipo di informazioni che è possibile ottenere da una query di data mining. Il motivo delle differenze è che ogni algoritmo elabora i dati in modo diverso e archivia diversi tipi di modelli. Ad esempio, alcuni algoritmi creano cluster; altri creano alberi. Potrebbe pertanto essere necessario usare funzioni di stima e query specializzate, a seconda del tipo di modello usato.

L'elenco seguente fornisce un riepilogo delle funzioni che è possibile usare nelle query:

  • Funzioni di stima generali: La Predict funzione è polimorfica, ovvero funziona con tutti i tipi di modello. Questa funzione rileverà automaticamente il tipo di modello che si sta usando e richiederà parametri aggiuntivi. Per altre informazioni, vedere Predict (DMX).

    Avvertimento

    Non tutti i modelli vengono usati per eseguire stime. Ad esempio, è possibile creare un modello di clustering che non dispone di un attributo stimabile. Tuttavia, anche se un modello non dispone di un attributo stimabile, è possibile creare query di stima che restituiscono altri tipi di informazioni utili dal modello.

  • Funzioni di stima personalizzate: Ogni tipo di modello fornisce un set di funzioni di stima progettate per l'uso dei modelli creati da tale algoritmo.

    Ad esempio, la Lag funzione viene fornita per i modelli time series, per consentire di visualizzare i dati cronologici usati per il modello. Per i modelli di clustering, le funzioni come ClusterDistance sono più significative.

    Per altre informazioni sulle funzioni supportate per ogni tipo di modello, vedere i collegamenti seguenti:

    Esempi di query del modello di associazione Algoritmo Microsoft Naive Bayes
    Esempi di query del modello di clustering Esempi di query sul modello di rete neurale
    Esempi di query sul modello Decision Trees Esempi di query del modello sequence clustering
    Esempi di query del modello di regressione lineare Esempi di query sul modello Time Series
    Esempi di query sul modello di regressione logistica

    È anche possibile chiamare funzioni VBA o creare funzioni personalizzate. Per altre informazioni, vedere Funzioni (DMX).

  • Statistiche generali: Esistono diverse funzioni che possono essere usate con quasi qualsiasi tipo di modello, che restituiscono un set standard di statistiche descrittive, ad esempio la deviazione standard.

    Ad esempio, la PredictHistogram funzione restituisce una tabella che elenca tutti gli stati della colonna specificata.

    Per altre informazioni, vedere Funzioni di stima generale (DMX).

  • Statistiche personalizzate: Sono disponibili funzioni di supporto aggiuntive per ogni tipo di modello, per generare statistiche rilevanti per l'attività analitica specifica.

    Ad esempio, quando si usa un modello di clustering, è possibile usare la funzione , PredictCaseLikelihoodper restituire il punteggio di probabilità associato a un determinato case e cluster. Tuttavia, se è stato creato un modello di regressione lineare, si sarebbe più interessati a recuperare il coefficiente e l'intercettazione, che è possibile eseguire usando una query sul contenuto.

  • Funzioni del contenuto del modello: Il contenuto di tutti i modelli è rappresentato in un formato standardizzato che consente di recuperare informazioni con una query semplice. Per creare query sul contenuto del modello, usare DMX. È anche possibile ottenere un tipo di contenuto del modello usando i set di righe dello schema di data mining.

    Nel contenuto del modello il significato di ogni riga o nodo della tabella restituita varia a seconda del tipo di algoritmo usato per compilare il modello, nonché del tipo di dati della colonna. Per altre informazioni, vedere Query sul contenuto (estrazione di dati).

Requisiti

Prima di poter creare una query su un modello, è necessario che il modello di data mining sia stato elaborato. L'elaborazione di oggetti Analysis Services richiede autorizzazioni speciali. Per altre informazioni sull'elaborazione dei modelli di data mining, vedere Requisiti e considerazioni sull'elaborazione (data mining).

Per eseguire query su un modello di data mining sono necessari diversi livelli di autorizzazioni, a seconda del tipo di query eseguito. Ad esempio, il drill-through sui dati del caso o della struttura richiede in genere autorizzazioni aggiuntive che possono essere impostate sull'oggetto struttura di mining o sull'oggetto modello di mining.

Tuttavia, se la query usa dati esterni e include istruzioni come OPENROWSET o OPENQUERY, il database su cui si sta eseguendo una query deve abilitare queste istruzioni ed è necessario disporre dell'autorizzazione per gli oggetti di database sottostanti.

Per altre informazioni sui contesti di sicurezza necessari per eseguire query di data mining, vedere Panoramica della sicurezza (data mining)

In questa sezione

Negli argomenti di questa sezione vengono presentati in modo più dettagliato ogni tipo di query di data mining e vengono forniti collegamenti ad esempi dettagliati di come creare query sui modelli di data mingin.

Query di stima (data mining)

Query sul contenuto (data mining)

Query drillthrough (Data Mining)

Query di definizione dei dati (data mining)

Interfacce di data mining per query

Usare questi collegamenti per informazioni su come creare e usare query di data mining.

Attività Collegamenti
Visualizzare esercitazioni e procedure dettagliate sulle query di data mining Lezione 6: Creazione e utilizzo di stime (Esercitazione di base sul data mining)

Esercitazione su DMX per la stima di serie temporali
Utilizzare gli strumenti di interrogazione di data mining in SQL Server Management Studio e SQL Server Data Tools (SSDT) Creare una query DMX in SQL Server Management Studio

Creare una query di predizione usando il Generatore di query di predizione

Applicare funzioni di stima a un modello

Modificare manualmente una query di previsione
Utilizzare dati esterni utilizzati nelle query di previsione Scegliere e mappare i dati di input per una query di stima

Scegliere e mappare i dati di input per una query di stima
Lavorare con i risultati delle query Visualizzare e salvare i risultati di una query di stima
Usare modelli di query DMX e XMLA forniti in Management Studio Creare una Singleton Prediction Query da un modello

Creare una query di data mining utilizzando XMLA

Usare modelli di Analysis Services in SQL Server Management Studio
Scopri di più sulle query sui contenuti e scopri esempi Creare una query sui contenuti in un modello di mining

Eseguire una query sui parametri usati per creare un modello di data mining

Query sul contenuto (data mining)
Impostare le opzioni di query e risolvere i problemi e le autorizzazioni delle query Modificare il valore di timeout per le query di data mining
Usare i componenti di estrazione dati nei servizi di integrazione Attività Query di data mining

Trasformazione della Query di Data Mining

Vedere anche

Algoritmi di data mining (Analysis Services - Data mining)
Contenuto del modello di Data Mining (Analysis Services - Data Mining)