Condividi tramite


Algoritmi di data mining

L'algoritmo di data mining è il meccanismo che consente di creare i modelli di data mining. Per creare un modello, tramite un algoritmo viene innanzitutto analizzato un set di dati, per cercare tendenze e schemi specifici. I risultati dell'analisi vengono quindi utilizzati dall'algoritmo per definire i parametri del modello di data mining.

Il modello di data mining creato da un algoritmo può avere forme diverse, tra cui:

  • Set di regole che descrive in che modo i prodotti vengono raggruppati in una transazione.
  • Struttura decisionale che consente di stimare se un cliente specifico acquisterà un prodotto.
  • Modello matematico per la previsione delle vendite.
  • Set di cluster che descrive in che modo i case di un set di dati sono correlati.

Microsoft SQL Server 2005 Analysis Services (SSAS) include diversi algoritmi che è possibile utilizzare nelle soluzioni di data mining. Questi algoritmi costituiscono un subset di tutti gli algoritmi che è possibile utilizzare per il data mining. È inoltre possibile utilizzare algoritmi di terze parti conformi con la specifica OLE DB per il data mining. Per ulteriori informazioni sugli algoritmi di terze parti, vedere Algoritmi plug-in.

Esame degli algoritmi

Analysis Services include i tipi di algoritmi seguenti:

  • Algoritmi di classificazione che consentono di stimare una o più variabili discrete, in base agli altri attributi del set di dati. Un esempio di algoritmo di classificazione è quello illustrato in Algoritmo Microsoft Decision Trees.
  • Algoritmi di regressione che consentono di stimare una o più variabili continue, ad esempio profitto o perdita, in base ad altri attributi nel set di dati. Un esempio di algoritmo di regressione è quello illustrato in Algoritmo Microsoft Time Series.
  • Algoritmi di segmentazione che consentono di dividere i dati in gruppi, o cluster, di elementi con proprietà simili. Un esempio di algoritmo di segmentazione è quello illustrato in Algoritmo Microsoft Clustering.
  • Algoritmi di associazione che consentono di trovare le correlazioni tra attributi diversi in un set di dati. L'applicazione più comune di questo tipo di algoritmo è costituita dall'utilizzo per la creazione di regole di associazione, che è possibile utilizzare in un'analisi di mercato sugli acquisti. Un esempio di algoritmo di associazione è quello illustrato in Algoritmo Microsoft Association Rules.
  • Algoritmi di analisi delle sequenze che consentono di riepilogare le sequenze o gli episodi frequenti nei dati, ad esempio un flusso di percorso Web. Un esempio di algoritmo di analisi delle sequenze è quello illustrato in Algoritmo Microsoft Sequence Clustering.

Applicazione degli algoritmi

La scelta dell'algoritmo appropriato da utilizzare per un'attività aziendale specifica può rivelarsi complessa. Sebbene sia possibile utilizzare algoritmi diversi per eseguire la stessa attività aziendale, ogni algoritmo produce un risultato diverso e alcuni algoritmi possono produrre più di un tipo di risultato. È ad esempio possibile utilizzare l'algoritmo Microsoft Decision Trees non solo per le stime ma anche per ridurre il numero di colonne in un set di dati, in quanto la struttura decisionale può consentire di identificare colonne che non hanno effetto sul modello di data mining finale.

Non è inoltre necessario utilizzare gli algoritmi in modo indipendente, ma in un'unica soluzione di data mining è possibile utilizzare alcuni algoritmi per esplorare i dati e altri per stimare un risultato specifico in base ai dati. È ad esempio possibile utilizzare un algoritmo di clustering, che consente di riconoscere gli schemi, per suddividere i dati in gruppi più o meno omogenei e quindi utilizzare i risultati per creare un modello di struttura decisionale migliore. È possibile utilizzare più algoritmi in una soluzione per eseguire attività separate, ad esempio utilizzando un algoritmo di struttura di regressione per ottenere informazioni sulle previsioni finanziarie e un algoritmo basato su una regola per eseguire un'analisi di mercato sugli acquisti.

I modelli di data mining consentono di stimare valori, produrre riepiloghi di dati e trovare correlazioni nascoste. Nella tabella seguente sono inclusi suggerimenti sugli algoritmi da utilizzare per attività specifiche, che offrono un aiuto per la selezione degli algoritmi per la soluzione di data mining.

Attività Algoritmo Microsoft da utilizzare

Stima di un attributo discreto. Per stimare, ad esempio, se il destinatario di una campagna di mailing diretto acquisterà un prodotto.

Algoritmo Microsoft Decision Trees

Algoritmo Microsoft Naive Bayes

Algoritmo Microsoft Clustering

Algoritmo Microsoft Neural Network (SSAS)

Stima di un attributo continuo. Per prevedere, ad esempio, le vendite dell'anno successivo.

Algoritmo Microsoft Decision Trees

Algoritmo Microsoft Time Series

Stima di una sequenza. Per eseguire, ad esempio, un'analisi di tipo clickstream del sito Web di una società.

Algoritmo Microsoft Sequence Clustering

Ricerca di gruppi di elementi comuni nelle transazioni. Per utilizzare, ad esempio, analisi di mercato sugli acquisti per suggerire a un cliente ulteriori prodotti da acquistare.

Algoritmo Microsoft Association Rules

Algoritmo Microsoft Decision Trees

Ricerca di gruppi di elementi simili. Per segmentare, ad esempio, i dati demografici in gruppi, per comprendere meglio le relazioni tra gli attributi.

Algoritmo Microsoft Clustering

Algoritmo Microsoft Sequence Clustering

Poiché ogni modello restituisce un tipo diverso di risultati, in Analysis Services è disponibile un visualizzatore separato per ogni algoritmo. Per la visualizzazione di un modello di data mining in Analysis Services viene utilizzato il visualizzatore appropriato nella scheda Visualizzatore modello di data mining di Progettazione modelli di data mining. Per ulteriori informazioni, vedere Visualizzazione di un modello di data mining.

Informazioni sugli algoritmi

È possibile utilizzare funzioni per estendere i risultati restituiti da un modello di data mining. Nella tabella seguente vengono elencate le funzioni supportate da tutti gli algoritmi di Analysis Services.

BottomCount

RangeMin

BottomPercent

TopCount

Predict

TopPercent

RangeMax

TopSum

RangeMid

I singoli algoritmi possono supportare funzioni aggiuntive. Nessuno degli algoritmi di Microsoft consente le chiavi duplicate.

Vedere anche

Concetti

Concetti di base sul data mining
Strutture di data mining (Analysis Services)
Algoritmo Microsoft Association Rules
Algoritmo Microsoft Clustering
Algoritmo Microsoft Decision Trees
Algoritmo Microsoft Naive Bayes
Algoritmo Microsoft Neural Network (SSAS)
Algoritmo Microsoft Sequence Clustering
Algoritmo Microsoft Time Series
Algoritmo Microsoft Linear Regression
Algoritmo Microsoft Logistic Regression
Algoritmi plug-in
Utilizzo degli strumenti di data mining

Altre risorse

Guida di riferimento a DMX (Data Mining Extensions)

Guida in linea e informazioni

Assistenza su SQL Server 2005