Personalizzazione di un modello di data mining (Analysis Services - Data mining)
Dopo avere selezionato un algoritmo adatto alle esigenze aziendali, è possibile personalizzare il modello di data mining nei modi seguenti per migliorarne potenzialmente i risultati.
Utilizzare colonne di dati diverse nel modello o modificare i tipi di utilizzo o di contenuto delle colonne.
Creare filtri per il modello di data mining per limitare i dati utilizzati per il training del modello.
Impostare i parametri dell'algoritmo per determinare soglie, divisioni dell'albero e altre condizioni.
Modificare l'algoritmo predefinito utilizzato per analizzare dati o eseguire stime.
Modifica dei dati utilizzati dal modello
Le decisioni adottate sulle colonne di dati da utilizzare nel modello e sulle modalità di utilizzo e di elaborazione dei dati possono influire significativamente sui risultati dell'analisi. Negli argomenti seguenti vengono fornite informazioni che semplificano la comprensione di tali scelte.
Modelli di data mining (Analysis Services - Data mining)
Viene fornita una panoramica dell'architettura di un modello di data mining, incluse la struttura di data mining sottostante e la scelta delle colonne di data mining.
Creazione di filtri per i modelli di data mining (Analysis Services - Data mining)
Viene illustrato come creare filtri da applicare a un modello di data mining per creare modelli basati su un subset dei dati della struttura di data mining.
Funzionalità di selezione degli attributi nel data mining.
Viene descritto il modo in cui Analysis Services utilizza un processo denominato selezione di funzionalità per selezionare solo gli attributi più utili da aggiungere a un modello. La riduzione del numero di colonne e di attributi può migliorare le prestazione e la qualità del modello. I metodi disponibili per la selezione delle funzionalità differiscono a seconda dell'algoritmo scelto.
Se si utilizza la Creazione guidata modello di data mining, è inoltre possibile fare in modo che i dati più utili per la creazione di un modello specifico vengano selezionati automaticamente da Analysis Services.
Personalizzazione delle impostazioni dell'algoritmo
La scelta dell'algoritmo determina il tipo di risultati ottenuto. Per informazioni generali sul funzionamento di un algoritmo specifico o gli scenari aziendali in cui l'utilizzo di un determinato algoritmo può rivelarsi utile, vedere Algoritmi di data mining (Analysis Services - Data mining).
Gli algoritmi di data mining disponibili in Analysis Services possono inoltre essere personalizzati in modo esteso. È possibile determinare il comportamento dell'algoritmo e la relativa modalità di elaborazione dei dati impostando i parametri dell'algoritmo. Negli argomenti seguenti vengono fornite informazioni dettagliate sui parametri supportati da ciascun algoritmo.
Riferimento tecnico per l'algoritmo Microsoft Decision Trees
Riferimento tecnico per l'algoritmo Microsoft Clustering
Riferimento tecnico per l'algoritmo Microsoft Naive Bayes
Riferimento tecnico per l'algoritmo Microsoft Association Rules
Riferimento tecnico per l'algoritmo Microsoft Sequence Clustering
Riferimento tecnico per l'algoritmo Microsoft Neural Network
Riferimento tecnico per l'algoritmo Microsoft Logistic Regression
Riferimento tecnico per l'algoritmo Microsoft Linear Regression
Riferimento tecnico per l'algoritmo Microsoft Time Series
L'argomento per ogni tipo di algoritmo include inoltre le funzioni di stima che possono essere utilizzate con i modelli basati sull'algoritmo specifico.
Elenco di parametri dell'algoritmo
Ogni algoritmo supporta parametri che è possibile utilizzare per personalizzare il comportamento dell'algoritmo e ottimizzare i risultati del modello. Per una descrizione di come utilizzare ciascun parametro, vedere gli argomenti seguenti:
Requisiti aggiuntivi
La scelta e la preparazione dei dati costituiscono una parte importante del processo di data mining. Gli algoritmi forniti da Microsoft, ad esempio, non consentono chiavi duplicate. Il tipo di dati necessario per ogni modello differisce a seconda dell'algoritmo. Per ulteriori informazioni, vedere la sezione relativa ai requisiti degli argomenti seguenti:
|
Personalizzazione dei risultati tramite query e funzioni di stima
Al termine della creazione e dell'elaborazione del modello, è possibile visualizzare le informazioni utilizzando uno dei visualizzatori specifici per ciascun tipo di modello. In alternativa, è possibile scrivere query personalizzate utilizzando DMX (Data Mining Extensions) per ottenere informazioni più avanzate o dettagliate sui modelli individuati nei dati.
Per informazioni su come creare query che restituiscono contenuto di modelli, vedere Esecuzione di query sui modelli di data mining (Analysis Services - Data mining).
È possibile utilizzare le funzioni per estendere i risultati restituiti da un modello di data mining. Alcune funzioni, inoltre, restituiscono statistiche che rappresentano la probabilità di un risultato o altri punteggi. Singoli algoritmi, inoltre, supportano funzioni aggiuntive. Se, ad esempio, un modello di data mining utilizza il clustering, è possibile utilizzare funzioni speciali per trovare informazioni sui cluster. Se, tuttavia, il modello è basato sull'algoritmo Time Series, è disponibile un set di funzioni diverso per eseguire stime e query sul contenuto del modello. Per ulteriori informazioni, vedere l'argomento Riferimento tecnico per ciascun algoritmo.
Per esempi su come eseguire una query su un modello di data mining e utilizzare le funzioni di stima progettate per tipi di modello specifici, vedere Esecuzione di query sui modelli di data mining (Analysis Services - Data mining).
Per un elenco delle funzioni di stima comuni supportate per tutti i tipi di algoritmo, vedere Mapping di funzioni a tipi di query (DMX).
Valutazione delle modifiche in un modello
Quando si sperimentano diversi modelli per risolvere un problema aziendale o si creano varianti in un modello, è necessario misurare l'accuratezza di ogni modello e valutarne l'efficacia nel rispondere al problema aziendale. Per informazioni generali sulla valutazione dei modelli di data mining, vedere Convalida di modelli di data mining (Analysis Services - Data mining). Per ulteriori informazioni su come rappresentare in un grafico l'accuratezza dei vari modelli di data mining, vedere Strumenti per la creazione di grafici di accuratezza dei modelli (Analysis Services - Data mining).