Utilizzo di Integration Services con il data mining

Il data mining viene spesso descritto come il processo di estrazione di informazioni valide e utilizzabili da database di grandi dimensioni. In altre parole, il data mining consente di individuare schemi e tendenze esistenti nei dati. In Microsoft SQL ServerAnalysis Services sono inclusi potenti strumenti e funzionalità per l'estrazione e l'analisi di tali schemi. In particolare, Integration Services offre una varietà di componenti utili per la gestione e l'esecuzione di query su modelli di data mining.

Per ulteriori informazioni sulle funzionalità di data mining in SQL ServerAnalysis Services, vedere Panoramica (Analysis Services - Data mining) e Progetti di data mining (Analysis Services - Data mining).

[!NOTA]

Alcuni dei componenti di Integration Services descritti in questo argomento sono disponibili solo nelle edizioni Enterprise e Developer di SQL Server.

Gestioni connessioni

Una gestione connessione è una rappresentazione logica di una connessione a un'origine dei dati. È possibile utilizzare la gestione connessione Analysis Services per eseguire la connessione a un database di Analysis Services in cui sono archiviati i modelli e le strutture di data mining. Tutti i componenti del flusso di dati e le attività descritti in questo argomento richiedono una gestione connessione Analysis Services.

Gestione connessione Analysis Services

La gestione connessione Analysis Services consente di collegare un pacchetto a un server che esegue un database di Analysis Services oppure a un progetto di Analysis Services che consente di accedere ai modelli e alle strutture di data mining. È possibile connettersi a un progetto di Analysis Services solo durante lo sviluppo di pacchetti in Business Intelligence Development Studio. In fase di esecuzione i pacchetti si connettono al server e al database in cui è stato distribuito il progetto di Analysis Services.

Per ulteriori informazioni, vedere Gestione connessione Analysis Services.

Attività

Le attività sono elementi del flusso di controllo che definiscono le unità di lavoro eseguite in un pacchetto. È possibile utilizzare le attività descritte di seguito per creare o modificare un modello o una struttura di data mining, nonché per elaborare un modello o eseguire query su di esso.

Attività Esegui DDL Analysis Services

L'attività Esegui DDL Analysis Services esegue istruzioni DDL (Data Definition Language) in grado di creare, eliminare o modificare modelli e strutture di data mining. Le istruzioni DDL sono rappresentate come istruzioni in ASSL (Analysis Services Scripting Language) e inserite nell'ambito di un comando XMLA (XML for Analysis).

Per ulteriori informazioni su questa attività, vedere Attività Esegui DDL Analysis Services. Per ulteriori informazioni sulla creazione e la modifica di oggetti di Analysis Services tramite XMLA, vedere Creazione e modifica di oggetti (XMLA).

Attività Elaborazione Analysis Services

L'attività Elaborazione Analysis Services automatizza il processo di elaborazione di oggetti di Analysis Services quali i modelli di data mining.

Per ulteriori informazioni su questa attività, vedere Attività Elaborazione Analysis Services. Per ulteriori informazioni sull'elaborazione degli oggetti di Analysis Services, vedere Elaborazione di oggetti di Analysis Services.

Attività Query di data mining

L'attività Query di data mining consente di eseguire query di stima basate sui modelli di data mining predefiniti di Analysis Services. Una query di stima genera una stima per nuovi dati utilizzando modelli di data mining e ne salva l'output in una o più tabelle.

Per ulteriori informazioni su questa attività, vedere Attività Query di data mining. Per ulteriori informazioni sull'esecuzione di query su un modello di data mining mediante DMX, vedere Creazione di query di stima DMX.

Trasformazioni del flusso di dati

Le trasformazioni sono i componenti del flusso di dati di un pacchetto che aggregano, uniscono, distribuiscono e modificano i dati.

Trasformazione Query di data mining

La trasformazione Query di data mining esegue query di stima basate su modelli di data mining. Questa trasformazione contiene un generatore di query per la creazione di query DMX (Data Mining Extensions). Il generatore di query consente di creare istruzioni personalizzate per la valutazione dei dati di input della trasformazione in base a un modello di data mining esistente, utilizzando il linguaggio DMX. Diversamente dall'attività Query di data mining, che salva l'output direttamente in una o più tabelle, la trasformazione Query di data mining rende l'output disponibile ai componenti a valle nel flusso di dati del pacchetto.

Per ulteriori informazioni su questa trasformazione, vedere Trasformazione Query di data mining. Per ulteriori informazioni sull'esecuzione di query su un modello di data mining mediante DMX, vedere Creazione di query di stima DMX.

Destinazioni del flusso di dati

Le destinazioni sono componenti del flusso di dati che consentono il caricamento dell'output di un flusso di dati in diversi tipi di origini dei dati oppure la creazione di un set di dati in memoria.

Destinazione Training modello di data mining

La destinazione Training modello di data mining consente di eseguire il training dei modelli di data mining passando i dati ricevuti dalla destinazione agli algoritmi dei modelli di data mining. Durante il processo di training, gli algoritmi calcolano gli schemi e le relazioni tra gli elementi dei dati. Dopo il completamento del training di un nuovo modello di data mining, è possibile utilizzare tale modello per eseguire query di stima.

Per ulteriori informazioni, vedere Destinazione Training modello di data mining.

Altri componenti di Integration Services per il data mining

In Integration Services sono disponibili numerosi altri componenti che possono rivelarsi utili nelle soluzioni di data mining.

  • Per eseguire operazioni di training o test dei modelli di data mining con un subset dei dati, è possibile utilizzare le trasformazioni seguenti:

    • **Trasformazione Campionamento righe.   **Copia un solo subset di righe in base al numero specificato. Per ulteriori informazioni, vedere Trasformazione Campionamento righe.

    • **Trasformazione Campionamento percentuale.   **Copia un solo subset di righe in base alla percentuale specificata. Per ulteriori informazioni, vedere Trasformazione Campionamento percentuale.

  • Per la pulitura dei dati tramite la rimozione dei duplicati e la standardizzazione dei valori, è possibile utilizzare le trasformazioni seguenti:

  • Per eseguire operazioni di text mining, è possibile utilizzare le trasformazioni seguenti:

    • **Trasformazione Estrazione termini.   **Crea una tabella dei termini individuati nell'origine, dopo avere escluso tramite un filtro le parole non significative standard e definite dall'utente. Per ulteriori informazioni, vedere Trasformazione Estrazione termini.

    • **Trasformazione Ricerca termini.   **Ricerca corrispondenze tra i termini inclusi nell'input e i termini inclusi in una tabella di riferimento. Per ulteriori informazioni, vedere Trasformazione Ricerca termini.

Icona di Integration Services (piccola) Rimanere aggiornati con Integration Services

Per informazioni sui download, gli articoli, gli esempi e i video Microsoft più recenti, nonché sulle soluzioni selezionate dalla community, visitare la pagina Integration Services su MSDN o Technet:

Per ricevere notifiche automatiche su questi aggiornamenti, sottoscrivere i feed RSS disponibili nella pagina.