Aracılığıyla paylaş


Microsoft Naive Bayes algoritması teknik başvurusu

The Microsoft Naive Bayes algorithm is a classification algorithm provided by Microsoft SQL Server Analysis Services for use in predictive modeling.Algoritma, giriş ve öngörülebilir sütunlar arasındaki koşullu olasılığınızı hesaplar ve sütunları bağımsız olduğunu varsayar.Bu bağımsızlığı, varsayım, müşteri adayı Naive Bayes adı.

Microsoft Naive Bayes algoritma uygulaması

Bu algoritma dışında hesaplama daha yoğun olur. Microsoft algoritmaları ve bu nedenle hızlı giriş sütunlar ve öngörülebilir sütunlar arasındaki ilişkileri bulmaya madenciliği modelleri oluşturmak için yararlıdır. Algoritma, iki giriş öznitelik değerleri ve çıktı öznitelik değerleri dikkate alır.

Matematiksel Bayes teoremi özelliklerini bu belgelerde; daha fazla bilgi için kapsam dışında kalan açıklamasıdır, tarafından Microsoft Research'başlıklı belgeye bakın Bayesian ağları öğrenme:.

Tüm modellerinde değerler için olası değerleri eksik hesabına nasıl düzeltilir bir açıklaması için bkz: Değerleri eksik (Analysis Services - veri madenciliği).

Özellik Seçimi

The Microsoft Naive Bayes algorithm performs automatic feature selection to limit the number of values that are considered when building the model.Daha fazla bilgi için bkz:Içinde veri madenciliği özellik seçimi.

Algoritma

Analiz yöntem

Açıklamalar

Naive Bayes

Shannon'ın Entropisi

Bayesian K2 önceki ile

Bayesian Dirichlet ile Tekdüzen önceki (varsayılan)

Naive Bayes ayrı veya discretized öznitelikleri yalnızca kabul eder; bu nedenle, interestingness Skor kullanamazsınız.

Algoritma işlem süresini en aza indirmek ve verimli bir şekilde en yüksek önem olan öznitelikleri tasarlanmıştır; ancak, aşağıdaki parametreleri ayarlayarak algoritması tarafından kullanılan veri denetleyebilirsiniz:

  • Girdileri kullanılan değerleri sınırlamak için , MAXIMUM_INPUT_ATTRIBUTES değerini azaltın.

  • Modeli tarafından çözümlenen bir öznitelik sayısını sınırlamak için , MAXIMUM_OUTPUT_ATTRIBUTES değerini azaltın.

  • Herhangi bir öznitelik için kabul değerlerin sayısını sınırlamak için , MINIMUM_STATES değerini azaltın.

Naive Bayes algoritması'nı özelleştirme

The Microsoft Naive Bayes algorithm supports several parameters that affect the behavior, performance, and accuracy of the resulting araştırma modeli. Verileri nasıl işleneceğini denetlemek için model sütunlarda bayraklarını modelleme de ayarlayabilir veya üzerinde küme flags araştırma yapısı belirtmek için nasıl eksik veya değerleri nulls ele alınmalıdır.

Algoritma parametreleri ayarlama

The Microsoft Naive Bayes algorithm supports several parameters that affect the performance and accuracy of the resulting araştırma modeli. Aşağıdaki tabloda her parametre açıklar.

  • MAXIMUM_INPUT_ATTRIBUTES
    En fazla girdi sayısını özniteliklere belirtir, özellik seçimi çağırır önce algoritma işleyebilir.Bu değeri 0 olarak ayarlandığında özellik seçimi giriş öznitelikleri için devre dışı bırakır.

    Varsayılan değer 255'dir.

  • MAXIMUM_OUTPUT_ATTRIBUTES
    Önce bu özellik seçimi çağırır algoritma işleyebileceği en yüksek çıktı öznitelikleri belirtir.Bu değeri 0 olarak ayarlandığında özellik seçimi çıkış öznitelikleri için devre dışı bırakır.

    Varsayılan değer 255'dir.

  • MINIMUM_DEPENDENCY_PROBABILITY
    Giriş ve çıkış öznitelikleri arasında en az bir bağımlılığı olasılığını belirtir.Bu değer algoritması tarafından oluşturulan içeriği boyutunu sınırlamak için kullanılır.Bu özellik olabilir küme 0, 1.Daha büyük değerler, öznitelikler, içerik modelinin sayısını azaltın.

    Varsayılan değer 0,5'dir.

  • MAXIMUM_STATES
    Sayısı üst sınırını belirtir öznitelik durumları algoritmasını destekler.Bir öznitelik olan durumları sayısı en fazla durum sayısından büyükse, algoritma özniteliği çubuğundaki en popüler durumlarını kullanır ve kalan durumları eksik olarak nitelendirir.

    Varsayılan değer 100'dir.

Flags model oluşturma

The Microsoft Decision Trees algorithm supports the following modeling flags.araştırma yapısı veya araştırma modeli oluşturduğunuzda, modelleme bayraklarını belirtmek için tanımladığınız nasıl değerleri her sütun çözümlemesi sırasında işlenir.Daha fazla bilgi için bkz:Flags (veri madenciliği) model oluşturma.

Bayrak model oluşturma

Açıklama

model_existence_only

Sütun iki olası durumlar sahip olarak değerlendirilmez olduðu anlamýna gelir: Eksik ve varolan. null BIR eksik bir değerdir.

araştırma modeline geçerli sütun.

null DEĞİL

Sütun null içeremez gösterir.Analysis Services null karşılaşırsa modeli eğitim sırasında bir hata neden olur.

araştırma yapısı sütuna uygulanır.

Gereksinimler

Bir Naive Bayes ağaç modeli, bir anahtar sütun, tahmin edilebilir olan en az bir öznitelik ve en az bir giriş özniteliği içermelidir.Özniteliği yok, sürekli olabilir; bu verileri sürekli bir sayısal veri içeriyorsa, onu göz ardı discretized veya başlatılacak.

Girdi ve öngörülebilir bir sütun

The Microsoft Naive Bayes algorithm supports the specific input columns and predictable columns that are listed in the following tablo. Içerik türleri kullanıldığında anlamları hakkında daha fazla bilgi için bir araştırma modeli, bkz: Içerik türleri (veri madenciliği).

Sütun

Içerik türleri

Giriş bir öznitelik

Döngüsel, ayrı, Discretized, anahtar, tablo ve sipariş

Öngörülebilir bir öznitelik

Döngüsel, ayrı, Discretized, tablo ve sipariş

Not

Cyclical ve sipariş edilmiş içerik türleri desteklenir, ancak algoritma bunları gibi farklı değerleri kabul eder ve özel bir işlem gerçekleştirmez.