Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
L'algoritmo Microsoft Naive Bayes è un algoritmo di classificazione fornito da Microsoft SQL Server Analysis Services per l'uso nella modellazione predittiva. L'algoritmo calcola la probabilità condizionale tra le colonne di input e stimabili e presuppone che le colonne siano indipendenti. Questo presupposto di indipendenza porta al nome Naive Bayes.
Implementazione dell'algoritmo Microsoft Naive Bayes
Questo algoritmo è meno intenso dal calcolo rispetto ad altri algoritmi Microsoft e pertanto è utile per generare rapidamente modelli di data mining per individuare le relazioni tra colonne di input e colonne stimabili. L'algoritmo considera ogni coppia di valori dell'attributo di input e valori degli attributi di output.
Una descrizione delle proprietà matematiche del Teorema Bayes esula dall'ambito di questa documentazione; Per altre informazioni, vedere il documento di Microsoft Research intitolato Learning Bayesian Networks: The Combination of Knowledge and Statistical Data.For more information, see the paper by Microsoft Research titled Learning Bayesian Networks: The Combination of Knowledge and Statistical Data.
Per una descrizione del modo in cui le probabilità in tutti i modelli vengono modificate in base ai possibili valori mancanti, vedere Valori mancanti (Analysis Services - Data mining).
Selezione funzionalità
L'algoritmo Microsoft Naive Bayes esegue la selezione automatica delle funzionalità per limitare il numero di valori considerati durante la compilazione del modello. Per altre informazioni, vedere Selezione delle funzionalità (data mining).
| Algoritmo | Metodo di analisi | Commenti |
|---|---|---|
| Bayes ingenuo | Entropia di Shannon Bayesian con K2 Prior Bayesian Dirichlet con precedente uniforme (impostazione predefinita) |
Naive Bayes accetta solo attributi discreti o discretizzati; pertanto, non può usare il punteggio di interesse. |
L'algoritmo è progettato per ridurre al minimo il tempo di elaborazione e selezionare in modo efficiente gli attributi che hanno la massima importanza; Tuttavia, è possibile controllare i dati usati dall'algoritmo impostando i parametri come indicato di seguito:
Per limitare i valori usati come input, ridurre il valore di MAXIMUM_INPUT_ATTRIBUTES.
Per limitare il numero di attributi analizzati dal modello, ridurre il valore di MAXIMUM_OUTPUT_ATTRIBUTES.
Per limitare il numero di valori che possono essere considerati per qualsiasi attributo, ridurre il valore di MINIMUM_STATES.
Personalizzazione dell'algoritmo Naive Bayes
L'algoritmo Microsoft Naive Bayes supporta diversi parametri che influiscono sul comportamento, sulle prestazioni e sull'accuratezza del modello di data mining risultante. È anche possibile impostare flag di modellazione nelle colonne del modello per controllare la modalità di elaborazione dei dati o impostare flag nella struttura di data mining per specificare la modalità di gestione dei valori mancanti o dei valori Null.
Impostazione dei parametri dell'algoritmo
L'algoritmo Microsoft Naive Bayes supporta diversi parametri che influiscono sulle prestazioni e sull'accuratezza del modello di data mining risultante. Nella tabella seguente viene descritto ogni parametro.
MAXIMUM_INPUT_ATTRIBUTES
Specifica il numero massimo di attributi di input che l'algoritmo può gestire prima di richiamare la selezione delle funzionalità. L'impostazione di questo valore su 0 disabilita la selezione delle funzionalità per gli attributi di input.
Il valore predefinito è 255.
MAXIMUM_OUTPUT_ATTRIBUTES
Specifica il numero massimo di attributi di output che l'algoritmo può gestire prima di richiamare la selezione delle funzionalità. L'impostazione di questo valore su 0 disabilita la selezione delle funzionalità per gli attributi di output.
Il valore predefinito è 255.
PROBABILITÀ_MINIMA_DI_DIPENDENZA
Specifica la probabilità minima di dipendenza tra gli attributi di input e di output. Questo valore viene usato per limitare le dimensioni del contenuto generato dall'algoritmo. Questa proprietà può essere impostata da 0 a 1. I valori più grandi riducono il numero di attributi nel contenuto del modello.
Il valore predefinito è 0,5.
MAXIMUM_STATES
Specifica il numero massimo di stati dell'attributo supportati dall'algoritmo. Se il numero di stati di un attributo è maggiore del numero massimo di stati, l'algoritmo usa gli stati più diffusi dell'attributo e considera mancanti gli stati rimanenti.
L'impostazione predefinita è 100.
Bandiere di modellazione
L'algoritmo Microsoft Decision Trees supporta i flag di modellazione seguenti. Quando si crea la struttura di data mining o il modello di data mining, si definiscono indicatori di modellazione per specificare il modo in cui vengono gestiti i valori in ogni colonna durante l'analisi. Per ulteriori informazioni, vedere Indicatori di modellazione (Data Mining).
| Indicatore di modellazione | Descrizione |
|---|---|
| SOLO_ESISTENZA_MODELLO | Significa che la colonna verrà considerata come con due possibili stati: Missing e Existing. Un valore Null è un valore mancante. Si applica alla colonna del modello di mining. |
| NON NULLO | Indica che la colonna non può contenere un valore Null. Se Analysis Services rileva un valore Null durante il training del modello, verrà generato un errore. Si applica alla colonna della struttura di mining. |
Requisiti
Un modello di albero Naive Bayes deve contenere una colonna chiave, almeno un attributo stimabile e almeno un attributo di input. Nessun attributo può essere continuo; se i dati contengono dati numerici continui, verranno ignorati o discretizzati.
Colonne di input e prevedibili
L'algoritmo Microsoft Naive Bayes supporta le colonne di input specifiche e le colonne stimabili elencate nella tabella seguente. Per altre informazioni sui tipi di contenuto usati in un modello di data mining, vedere Tipi di contenuto (data mining).
| colonna | Tipi di contenuto |
|---|---|
| Attributo di input | Ciclico, Discreto, Discretizzato, Chiave, Tabella e Ordinato |
| Attributo prevedibile | Ciclico, discreto, discretizzato, tabella e ordinato |
Annotazioni
I tipi di contenuto ciclici e ordinati sono supportati, ma l'algoritmo li considera come valori discreti e non esegue un'elaborazione speciale.
Vedere anche
Algoritmo Microsoft Naive Bayes
Esempi di query sul modello Naive Bayes
Contenuto del modello di data mining per i modelli Naive Bayes (Analysis Services - Data mining)