Aracılığıyla paylaş


araştırma modeli Modeller kümeleme için içerik (Analysis Services - veri madenciliği)

Bu konu, Microsoft kümeleme algoritmasını kullanmak için modelleri belirli araştırma modeli içerik açıklar.Genel bir açıklaması için araştırma modeli tüm modeli tipleri için içerik için bkz: araştırma modeli Içerik (Analysis Services - veri madenciliği).

kümeleme Modeli yapısını anlama

Bir küme modeli basit bir yapısı vardır.Her model modeli ve meta veriler gösteren tek bir üst düğüm vardır ve her bir üst düğüm kümeleri düz bir listesini içerir (NODE_TYPE = 5).Bu düzenleme aşağıdaki resimdeki gösterilir.

structure of model content for clustering

Her alt düğümü, tek bir küme temsil eder ve servis talepleri, kümedeki öznitelikleri hakkında ayrıntılı istatistikleri içerir.Bu küme ve kümedeki diğer kümelerden ayırt değerleri dağıtımını sayıda servis talebi sayısını içerir.

Not

Düğümlerin sayısı ya da kümelerin açıklama almak için yinelemek gerekmez; modelinin üst düğüm de sayar ve kümelerini listeler.

Üst düğüm eğitim durumların gerçek dağılımın açıklayan yararlı istatistikleri içerir.Bu istatistikler iç içe geçmiş tablo sütununda NODE_DISTRIBUTION bulunamıyor.Örneğin, aşağıdaki tabloda, dağıtımı için müşteri demografisi açıklayan NODE_DISTRIBUTION tablosundan birkaç satır gösterir kümeleme modeli TM_Clustering,'de oluşturduğunuz Temel veri madenciliği Öğreticisi:

ÖZNİTELİK_ADÝ

atribute_value

DESTEK

OLASILIK

VARYANS

value_type

Geçerlilik süresi

Eksik

0

0

0

1 (Eksik)

Geçerlilik süresi

44.9016152716593

12939

1

125.663453102554

3 (Sürekli)

Cinsiyet

Eksik

0

0

0

1 (Eksik)

Cinsiyet

T

6350

0.490764355823479

0

4 (Discrete)

Cinsiyet

M

6589

0.509235644176521

0

4 (Discrete)

Bu sonuçlar karşılaşıldığını bildiren 12939 durumda olan oranını males erkeklerde için 50-50 ve bu ortalama yaşı model oluşturmak için kullanılan 44 olduğunu görebilirsiniz.Tanımlayıcı istatistik bildirdi öznitelik sürekli sayısal veri türü, örneğin, yaş ve cinsiyet gibi farklı bir değer türü, olmasına göre değişir.Istatistiksel önlemler Ortalama and Varyans hesaplanan sürekli veri türlerinde ise Olasılık and Destek farklı veri türleri için hesaplanır.

Not

Varyansı, toplam fark kümesinin temsil eder.Sapma değeri küçük olduğunda, birçok sütun değerleri oldukça yakın ortalaması olan gösterir.Standart sapmayı edinmek için , sapma kare kökünü hesaplamak.

Her özniteliklerin olduğuna dikkat edin bir Missing Bu öznitelik için veri kaç servis taleplerini belirten bir değer türü var. Eksilen verilerin önemli olabilir ve hesaplamalar, veri türüne bağlı olarak çeşitli biçimlerde etkiler.Daha fazla bilgi için bkz:Değerleri eksik (Analysis Services - veri madenciliği).

Modeli içeriği kümeleme model

Bu bölümde modeller kümeleme için uygun olan bu sütunlar araştırma modeli içerik ayrıntı ve örnekler sağlar.

Şema satır kümesi, MODEL_CATALOG ve MODEL_NAME, genel amaçlı sütunlar hakkında bilgi için bkz: araştırma modeli Içerik (Analysis Services - veri madenciliği).

  • model_catalog
    Modelin nerede depolandığını veritabanının adı.

  • MODEL_ADI
    Model adı.

  • ÖZNİTELİK_ADÝ
    Her zaman boş yer kümeleme modunda öngörülebilir öznitelik yok olduğundan modeller.

  • node_name
    NODE_UNIQUE_NAME her zaman aynı.

  • node_unique_name
    Düğüm modelindeki benzersiz tanıtıcısı.Bu değer değiştirilemez.

  • node_type
    A kümeleme modeli aşağıdaki düğüm tiplerinden verir:

    Düğüm KIMLIĞI ve adı

    Açıklama

    1 (Modeli)

    Kök düğüm modeli.

    5 (Küme)

    Servis taleplerini durumda, küme ve küme içindeki değerleri tanımlayan istatistikleri özellikleri kümedeki bir sayımını içerir.

  • node_caption
    Görüntüleme amaçları için BIR kolay ad.Bir model oluştururken, NODE_UNIQUE_NAME değerini otomatik olarak bir resim yazısı olarak kullanılır.Ancak, küme için bir görünen ad, program aracılığıyla veya görüntüleyiciyi kullanarak güncelleştirmek NODE_CAPTION değerini değiştirebilirsiniz.

    Not

    Model reprocess, yeni değerlerle tüm ad değişikliklerinin üzerine yazılır.Adları modelinde ısrar açamıyor veya bir modeli farklı sürümleri arasında küme üyeliği değişiklikleri izlemek.

  • children_cardinality
    Tahmini numarasını alt düğümü vardır.

    Üst düğüm   Küme modelinde sayısını gösterir.

    Küme düğümleri   Her zaman 0.

  • parent_unique_name
    Düğümün üst benzersiz adı.

    Üst düğüm   Her zaman NULL.

    Küme düğümleri   Genellikle 000.

  • node_description
    Düğüm açıklaması.

    Üst düğüm    Her zaman**(Tümü)**.

    Küme düğümleri   Kümedeki diğer kümelerden ayırt birincil özniteliklerinin virgülle ayrılmış listesi.

  • node_rule
    Modelleri kümeleme için kullanılmaz.

  • marginal_rule
    Modelleri kümeleme için kullanılmaz.

  • node_probability
    Bu düğümle ilişkili olasılıktır.Üst düğüm   Her zaman 1.

    Küme düğümleri   Bileşik olasılığını özniteliklerin oluşturmak için kullanılan algoritma bağlı olarak, bazı ayarlamalar olasılığını temsil kümeleme modeli.

  • marginal_probability
    Ana düğümden düğüme ulaşma olasılığı.Içinde bir kümeleme model, Marjinal her zaman düğüm olasılık aynı olasılıktır.

  • node_distribution
    Olasılık histogram düğüm içeren bir tablo.

    Üst düğüm   Bu konuya giriş) konusuna bakın.

    Küme düğümleri   Öznitelikleri ve değerleri bu kümede bulunan servis taleplerini dağıtımını temsil eder.

  • node_support
    Bu düğüm destekleyen bir servis talebi sayısı.Üst düğüm   Eğitim durumlarda tüm model numarasını gösterir.

    Küme düğümleri   Küme boyutu, servis talebi sayısı gösterir.

    Not   Model K Ortalamalar kullanıyorsa kümeleme, her defasında yalnızca bir kümeye ait olabilir.Ancak, model EM kullanıyorsa kümeleme, her iki durumda da farklı bir kümeye ait olabilir ve durum, ait olduğu her küme için ağırlıklı bir uzaklığa atanır.Bu nedenle, EM modeller için tek tek bir küme için destek genel model için destek büyük toplamıdır.

  • msolap_model_column
    Modelleri kümeleme için kullanılmaz.

  • msolap_node_score
    Düğüm ile ilişkili bir sonuç görüntüler.

    Üst düğüm   BIC (Bayesian bilgileri ölçüt) Skoru kümeleme modeli.

    Küme düğümleri   Her zaman 0.

  • msolap_node_short_caption
    Bir etiket görüntüleme amacıyla kullanılır.Bu başlık değiştiremezsiniz.

    Üst düğüm   Modeli türü: Modeli küme

    Küme düğümleri   Küme adı.Örnek: Küme (1).

Remarks

Analysis Services oluşturmak için birden çok yöntem sunar bir kümeleme modeli.Hangi yöntem, çalıştığınız model oluşturmak için kullanılan bilmiyorsanız, modeli meta veriler programlı olarak veri madenciliği şema satır kümesi kümesi sorgulamak veya bir ADOMD istemci veya ÇYN kullanarak alabilirsiniz.Daha fazla bilgi için bkz:Nasıl Yapılır: Madenciliği model oluşturmak için kullanılan parametreleri sorgula.

Not

Aynı hangi küme yöntem veya kullandığınız parametreleri ne olursa olsun, yapı ve içerik modelinin kalır.