Microsoft Naive Bayes algoritması teknik başvurusu
The Microsoft Naive Bayes algorithm is a classification algorithm provided by Microsoft SQL Server Analysis Services for use in predictive modeling.Algoritma, giriş ve öngörülebilir sütunlar arasındaki koşullu olasılığınızı hesaplar ve sütunları bağımsız olduğunu varsayar.Bu bağımsızlığı, varsayım, müşteri adayı Naive Bayes adı.
Microsoft Naive Bayes algoritma uygulaması
Bu algoritma dışında hesaplama daha yoğun olur. Microsoft algoritmaları ve bu nedenle hızlı giriş sütunlar ve öngörülebilir sütunlar arasındaki ilişkileri bulmaya madenciliği modelleri oluşturmak için yararlıdır. Algoritma, iki giriş öznitelik değerleri ve çıktı öznitelik değerleri dikkate alır.
Matematiksel Bayes teoremi özelliklerini bu belgelerde; daha fazla bilgi için kapsam dışında kalan açıklamasıdır, tarafından Microsoft Research'başlıklı belgeye bakın Bayesian ağları öğrenme:.
Tüm modellerinde değerler için olası değerleri eksik hesabına nasıl düzeltilir bir açıklaması için bkz: Değerleri eksik (Analysis Services - veri madenciliği).
Özellik Seçimi
The Microsoft Naive Bayes algorithm performs automatic feature selection to limit the number of values that are considered when building the model.Daha fazla bilgi için bkz:Içinde veri madenciliği özellik seçimi.
Algoritma |
Analiz yöntem |
Açıklamalar |
---|---|---|
Naive Bayes |
Shannon'ın Entropisi Bayesian K2 önceki ile Bayesian Dirichlet ile Tekdüzen önceki (varsayılan) |
Naive Bayes ayrı veya discretized öznitelikleri yalnızca kabul eder; bu nedenle, interestingness Skor kullanamazsınız. |
Algoritma işlem süresini en aza indirmek ve verimli bir şekilde en yüksek önem olan öznitelikleri tasarlanmıştır; ancak, aşağıdaki parametreleri ayarlayarak algoritması tarafından kullanılan veri denetleyebilirsiniz:
Girdileri kullanılan değerleri sınırlamak için , MAXIMUM_INPUT_ATTRIBUTES değerini azaltın.
Modeli tarafından çözümlenen bir öznitelik sayısını sınırlamak için , MAXIMUM_OUTPUT_ATTRIBUTES değerini azaltın.
Herhangi bir öznitelik için kabul değerlerin sayısını sınırlamak için , MINIMUM_STATES değerini azaltın.
Naive Bayes algoritması'nı özelleştirme
The Microsoft Naive Bayes algorithm supports several parameters that affect the behavior, performance, and accuracy of the resulting araştırma modeli. Verileri nasıl işleneceğini denetlemek için model sütunlarda bayraklarını modelleme de ayarlayabilir veya üzerinde küme flags araştırma yapısı belirtmek için nasıl eksik veya değerleri nulls ele alınmalıdır.
Algoritma parametreleri ayarlama
The Microsoft Naive Bayes algorithm supports several parameters that affect the performance and accuracy of the resulting araştırma modeli. Aşağıdaki tabloda her parametre açıklar.
MAXIMUM_INPUT_ATTRIBUTES
En fazla girdi sayısını özniteliklere belirtir, özellik seçimi çağırır önce algoritma işleyebilir.Bu değeri 0 olarak ayarlandığında özellik seçimi giriş öznitelikleri için devre dışı bırakır.Varsayılan değer 255'dir.
MAXIMUM_OUTPUT_ATTRIBUTES
Önce bu özellik seçimi çağırır algoritma işleyebileceği en yüksek çıktı öznitelikleri belirtir.Bu değeri 0 olarak ayarlandığında özellik seçimi çıkış öznitelikleri için devre dışı bırakır.Varsayılan değer 255'dir.
MINIMUM_DEPENDENCY_PROBABILITY
Giriş ve çıkış öznitelikleri arasında en az bir bağımlılığı olasılığını belirtir.Bu değer algoritması tarafından oluşturulan içeriği boyutunu sınırlamak için kullanılır.Bu özellik olabilir küme 0, 1.Daha büyük değerler, öznitelikler, içerik modelinin sayısını azaltın.Varsayılan değer 0,5'dir.
MAXIMUM_STATES
Sayısı üst sınırını belirtir öznitelik durumları algoritmasını destekler.Bir öznitelik olan durumları sayısı en fazla durum sayısından büyükse, algoritma özniteliği çubuğundaki en popüler durumlarını kullanır ve kalan durumları eksik olarak nitelendirir.Varsayılan değer 100'dir.
Flags model oluşturma
The Microsoft Decision Trees algorithm supports the following modeling flags.araştırma yapısı veya araştırma modeli oluşturduğunuzda, modelleme bayraklarını belirtmek için tanımladığınız nasıl değerleri her sütun çözümlemesi sırasında işlenir.Daha fazla bilgi için bkz:Flags (veri madenciliği) model oluşturma.
Bayrak model oluşturma |
Açıklama |
---|---|
model_existence_only |
Sütun iki olası durumlar sahip olarak değerlendirilmez olduðu anlamýna gelir: Eksik ve varolan. null BIR eksik bir değerdir. araştırma modeline geçerli sütun. |
null DEĞİL |
Sütun null içeremez gösterir.Analysis Services null karşılaşırsa modeli eğitim sırasında bir hata neden olur. araştırma yapısı sütuna uygulanır. |
Gereksinimler
Bir Naive Bayes ağaç modeli, bir anahtar sütun, tahmin edilebilir olan en az bir öznitelik ve en az bir giriş özniteliği içermelidir.Özniteliği yok, sürekli olabilir; bu verileri sürekli bir sayısal veri içeriyorsa, onu göz ardı discretized veya başlatılacak.
Girdi ve öngörülebilir bir sütun
The Microsoft Naive Bayes algorithm supports the specific input columns and predictable columns that are listed in the following tablo. Içerik türleri kullanıldığında anlamları hakkında daha fazla bilgi için bir araştırma modeli, bkz: Içerik türleri (veri madenciliği).
Sütun |
Içerik türleri |
---|---|
Giriş bir öznitelik |
Döngüsel, ayrı, Discretized, anahtar, tablo ve sipariş |
Öngörülebilir bir öznitelik |
Döngüsel, ayrı, Discretized, tablo ve sipariş |
Not
Cyclical ve sipariş edilmiş içerik türleri desteklenir, ancak algoritma bunları gibi farklı değerleri kabul eder ve özel bir işlem gerçekleştirmez.