Condividi tramite


Personalizzazione di un modello di data mining (Analysis Services - Data mining)

Dopo avere selezionato un algoritmo adatto alle esigenze aziendali, è possibile personalizzare il modello di data mining nei modi seguenti per migliorarne potenzialmente i risultati.

  • Utilizzare colonne di dati diverse nel modello o modificare i tipi di utilizzo o di contenuto delle colonne.

  • Creare filtri per il modello di data mining per limitare i dati utilizzati per il training del modello.

  • Impostare i parametri dell'algoritmo per determinare soglie, divisioni dell'albero e altre condizioni.

  • Modificare l'algoritmo predefinito utilizzato per analizzare dati o eseguire stime.

Modifica dei dati utilizzati dal modello

Le decisioni adottate sulle colonne di dati da utilizzare nel modello e sulle modalità di utilizzo e di elaborazione dei dati possono influire significativamente sui risultati dell'analisi. Negli argomenti seguenti vengono fornite informazioni che semplificano la comprensione di tali scelte.

Se si utilizza la Creazione guidata modello di data mining, è inoltre possibile fare in modo che i dati più utili per la creazione di un modello specifico vengano selezionati automaticamente da Analysis Services.

Personalizzazione delle impostazioni dell'algoritmo

La scelta dell'algoritmo determina il tipo di risultati ottenuto. Per informazioni generali sul funzionamento di un algoritmo specifico o gli scenari aziendali in cui l'utilizzo di un determinato algoritmo può rivelarsi utile, vedere Algoritmi di data mining (Analysis Services - Data mining).

Gli algoritmi di data mining disponibili in Analysis Services possono inoltre essere personalizzati in modo esteso. È possibile determinare il comportamento dell'algoritmo e la relativa modalità di elaborazione dei dati impostando i parametri dell'algoritmo. Negli argomenti seguenti vengono fornite informazioni dettagliate sui parametri supportati da ciascun algoritmo.

Riferimento tecnico per l'algoritmo Microsoft Decision Trees

Riferimento tecnico per l'algoritmo Microsoft Clustering

Riferimento tecnico per l'algoritmo Microsoft Naive Bayes

Riferimento tecnico per l'algoritmo Microsoft Association Rules

Riferimento tecnico per l'algoritmo Microsoft Sequence Clustering

Riferimento tecnico per l'algoritmo Microsoft Neural Network

Riferimento tecnico per l'algoritmo Microsoft Logistic Regression

Riferimento tecnico per l'algoritmo Microsoft Linear Regression

Riferimento tecnico per l'algoritmo Microsoft Time Series

L'argomento per ogni tipo di algoritmo include inoltre le funzioni di stima che possono essere utilizzate con i modelli basati sull'algoritmo specifico.

Elenco di parametri dell'algoritmo

Ogni algoritmo supporta parametri che è possibile utilizzare per personalizzare il comportamento dell'algoritmo e ottimizzare i risultati del modello. Per una descrizione di come utilizzare ciascun parametro, vedere gli argomenti seguenti:

Nome proprietà

Si applica a

AUTO_DETECT_PERIODICITY

Riferimento tecnico per l'algoritmo Microsoft Time Series

CLUSTER_COUNT

Riferimento tecnico per l'algoritmo Microsoft Clustering

Riferimento tecnico per l'algoritmo Microsoft Sequence Clustering

CLUSTER_SEED

Riferimento tecnico per l'algoritmo Microsoft Clustering

CLUSTERING_METHOD

Riferimento tecnico per l'algoritmo Microsoft Clustering

COMPLEXITY_PENALTY

Riferimento tecnico per l'algoritmo Microsoft Decision Trees

Riferimento tecnico per l'algoritmo Microsoft Time Series

FORCED_REGRESSOR

Riferimento tecnico per l'algoritmo Microsoft Decision Trees

Riferimento tecnico per l'algoritmo Microsoft Linear Regression

FORECAST_METHOD

Riferimento tecnico per l'algoritmo Microsoft Time Series

HIDDEN_NODE_RATIO

Riferimento tecnico per l'algoritmo Microsoft Neural Network

HISTORIC_MODEL_COUNT

Riferimento tecnico per l'algoritmo Microsoft Time Series

HISTORICAL_MODEL_GAP

Riferimento tecnico per l'algoritmo Microsoft Time Series

HOLDOUT_PERCENTAGE

Riferimento tecnico per l'algoritmo Microsoft Logistic Regression

Riferimento tecnico per l'algoritmo Microsoft Neural Network

NotaNota
Questo parametro è diverso dal valore della percentuale dei dati di controllo che si applica a una struttura di data mining.

HOLDOUT_SEED

Riferimento tecnico per l'algoritmo Microsoft Logistic Regression

Riferimento tecnico per l'algoritmo Microsoft Neural Network

NotaNota
Questo parametro è diverso dal valore di inizializzazione dei dati di controllo che si applica a una struttura di data mining.

INSTABILITY_SENSITIVITY

Riferimento tecnico per l'algoritmo Microsoft Time Series

MAXIMUM_INPUT_ATTRIBUTES

Riferimento tecnico per l'algoritmo Microsoft Clustering

Riferimento tecnico per l'algoritmo Microsoft Decision Trees

Riferimento tecnico per l'algoritmo Microsoft Linear Regression

Riferimento tecnico per l'algoritmo Microsoft Naive Bayes

Riferimento tecnico per l'algoritmo Microsoft Neural Network

Riferimento tecnico per l'algoritmo Microsoft Logistic Regression

MAXIMUM_ITEMSET_COUNT

Riferimento tecnico per l'algoritmo Microsoft Association Rules

MAXIMUM_ITEMSET_SIZE

Riferimento tecnico per l'algoritmo Microsoft Association Rules

MAXIMUM_OUTPUT_ATTRIBUTES

Riferimento tecnico per l'algoritmo Microsoft Decision Trees

Riferimento tecnico per l'algoritmo Microsoft Linear Regression

Riferimento tecnico per l'algoritmo Microsoft Logistic Regression

Riferimento tecnico per l'algoritmo Microsoft Naive Bayes

Riferimento tecnico per l'algoritmo Microsoft Neural Network

MAXIMUM_SEQUENCE_STATES

Riferimento tecnico per l'algoritmo Microsoft Sequence Clustering

MAXIMUM_SERIES_VALUE

Riferimento tecnico per l'algoritmo Microsoft Time Series

MAXIMUM_STATES

Riferimento tecnico per l'algoritmo Microsoft Clustering

Riferimento tecnico per l'algoritmo Microsoft Neural Network

Riferimento tecnico per l'algoritmo Microsoft Sequence Clustering

MAXIMUM_SUPPORT

Riferimento tecnico per l'algoritmo Microsoft Association Rules

MINIMUM_IMPORTANCE

Riferimento tecnico per l'algoritmo Microsoft Association Rules

MINIMUM_ITEMSET_SIZE

Riferimento tecnico per l'algoritmo Microsoft Association Rules

MINIMUM_DEPENDENCY_PROBABILITY

Riferimento tecnico per l'algoritmo Microsoft Naive Bayes

MINIMUM_PROBABILITY

Riferimento tecnico per l'algoritmo Microsoft Association Rules

MINIMUM_SERIES_VALUE

Riferimento tecnico per l'algoritmo Microsoft Time Series

MINIMUM_SUPPORT

Riferimento tecnico per l'algoritmo Microsoft Association Rules

Riferimento tecnico per l'algoritmo Microsoft Clustering

Riferimento tecnico per l'algoritmo Microsoft Decision Trees

Riferimento tecnico per l'algoritmo Microsoft Sequence Clustering

Riferimento tecnico per l'algoritmo Microsoft Time Series

MISSING_VALUE_SUBSTITUTION

Riferimento tecnico per l'algoritmo Microsoft Time Series

MODELLING_CARDINALITY

Riferimento tecnico per l'algoritmo Microsoft Clustering

PERIODICITY_HINT

Riferimento tecnico per l'algoritmo Microsoft Time Series

PREDICTION_SMOOTHING

Riferimento tecnico per l'algoritmo Microsoft Time Series

SAMPLE_SIZE

Riferimento tecnico per l'algoritmo Microsoft Clustering

Riferimento tecnico per l'algoritmo Microsoft Logistic Regression

Riferimento tecnico per l'algoritmo Microsoft Neural Network

SCORE_METHOD

Riferimento tecnico per l'algoritmo Microsoft Decision Trees

SPLIT_METHOD

Riferimento tecnico per l'algoritmo Microsoft Decision Trees

STOPPING_TOLERANCE

Riferimento tecnico per l'algoritmo Microsoft Clustering

Requisiti aggiuntivi

La scelta e la preparazione dei dati costituiscono una parte importante del processo di data mining. Gli algoritmi forniti da Microsoft, ad esempio, non consentono chiavi duplicate. Il tipo di dati necessario per ogni modello differisce a seconda dell'algoritmo. Per ulteriori informazioni, vedere la sezione relativa ai requisiti degli argomenti seguenti:

Personalizzazione dei risultati tramite query e funzioni di stima

Al termine della creazione e dell'elaborazione del modello, è possibile visualizzare le informazioni utilizzando uno dei visualizzatori specifici per ciascun tipo di modello. In alternativa, è possibile scrivere query personalizzate utilizzando DMX (Data Mining Extensions) per ottenere informazioni più avanzate o dettagliate sui modelli individuati nei dati.

Per informazioni su come creare query che restituiscono contenuto di modelli, vedere Esecuzione di query sui modelli di data mining (Analysis Services - Data mining).

È possibile utilizzare le funzioni per estendere i risultati restituiti da un modello di data mining. Alcune funzioni, inoltre, restituiscono statistiche che rappresentano la probabilità di un risultato o altri punteggi. Singoli algoritmi, inoltre, supportano funzioni aggiuntive. Se, ad esempio, un modello di data mining utilizza il clustering, è possibile utilizzare funzioni speciali per trovare informazioni sui cluster. Se, tuttavia, il modello è basato sull'algoritmo Time Series, è disponibile un set di funzioni diverso per eseguire stime e query sul contenuto del modello. Per ulteriori informazioni, vedere l'argomento Riferimento tecnico per ciascun algoritmo.

Per esempi su come eseguire una query su un modello di data mining e utilizzare le funzioni di stima progettate per tipi di modello specifici, vedere Esecuzione di query sui modelli di data mining (Analysis Services - Data mining).

Per un elenco delle funzioni di stima comuni supportate per tutti i tipi di algoritmo, vedere Mapping di funzioni a tipi di query (DMX).

Valutazione delle modifiche in un modello

Quando si sperimentano diversi modelli per risolvere un problema aziendale o si creano varianti in un modello, è necessario misurare l'accuratezza di ogni modello e valutarne l'efficacia nel rispondere al problema aziendale. Per informazioni generali sulla valutazione dei modelli di data mining, vedere Convalida di modelli di data mining (Analysis Services - Data mining). Per ulteriori informazioni su come rappresentare in un grafico l'accuratezza dei vari modelli di data mining, vedere Strumenti per la creazione di grafici di accuratezza dei modelli (Analysis Services - Data mining).