Aracılığıyla paylaş


Flags (veri madenciliği) model oluşturma

Modelleme Bayraklarda kullanabilirsiniz. SQL Server 2008 Analysis Services (SSAS) bir veri madenciliği algoritması için durum bir tabloda tanımlanan veriler hakkında ek bilgi sağlamak için . Algoritma, daha doğru bir veri araştırma modeli oluşturmak için bu bilgileri kullanabilirsiniz.

veri madenciliği Uzantıları (DMX), modelleme bayraklarını programsal olarak tanımlamak için kullanabilirsiniz ve veri madenciliği Tasarımcısı'nda bulunan tanımlayabilirsiniz Business Intelligence Development Studio. Bu bayraklar tanımlanması hakkında daha fazla bilgi için bkz: araştırma modelii sütunlar.

Bazı modelleme bayraklarını düzeyinde tanımlanan araştırma yapısı, diğerleri araştırma modeli sütun düzeyinde tanımlanmıştır, ancak.Örneğin, NOT NULL bayrak modelleme araştırma yapısı sütunlarla kullanılır. araştırma modeli sütun, ek bir modelleme bayraklarını tanımlayabilirsiniz.

Aşağıdaki liste, desteklenen modelleme bayraklarını açıklar. Analysis Services. Özel algoritmalar tarafından desteklenen bayraklarını model oluşturma hakkında daha fazla bilgi için algoritması için teknik başvuru konusuna bakın.

  • NOT NULL
    Belirten değerleri öznitelik sütun hiç null bir değer içermelidir.Bir hata neden Analysis Services Bu öznitelik sütun için null bir değer modeli eğitim işlemi sırasında karşılaşır.

  • MODEL_EXISTENCE_ONLY
    Sütun iki durumu sahip olarak değerlendirilmez gösterir: Missing ve Existing. Değer NULL, eksik olarak kabul edilir.

    Not

    Eksik algoritması tarafından kullanılan özel bir durumdur ve metinden farklı bir sütuna "Eksik" değeri.Daha fazla bilgi için bkz:Değerleri eksik (Analysis Services - veri madenciliği).

    Iþarettir belirtmek için bu model için tipik bir kullanım yeri öznitelikleri NULL olgu değeri açık ve örtülü bir anlamı olan NOT NULL olgu sütun herhangi bir değer olduğunu olgu gibi önemli olabilir. Örneğin, [DateContractSigned] sütun olabilir NULL hiçbir zaman olarak bir anlaşma imzalandı, ve NOT NULL anlaşma imzalandı. Amacı, model, bir anlaşma imzalanacak yoksa tahmin etmek için ise, bu nedenle, MODEL_EXISTENCE_ONLY bayrağı tam tarih değeri yoksaymak için kullanabileceğiniz NOT NULL durumda ve yalnızca değer olduğu durumlar arasında ayırım Missing veya Existing.

  • REGRESSOR
    Sütun özniteliği için öznitelik varlığını daha az önemli değerlerdir.Bu bayrak bir araştırma modeli sütun olarak tanımlanır.

Not

Üçüncü taraf eklentiler tarafından tanımlanmış olan ek olarak diğer modelleme bayraklarını olabilir Analysis Services.

Görüntüleme ve Flags modelleme değiştirme

Veri madenciliği Tasarımcısı'nda görüntüleyebilir ve yapısı veya modelini özelliklerini görüntüleyerek araştırma yapısı veya madenciliği sütun ile ilişkili modelleme bayrakları değiştirin.

Modelleme bayrağı yapısı sütun veya modeli sütun değiştirmek veya görüntülemek için

  1. Içinde BI Development Studioçözüm gezgini'da araştırma yapısı'nı çift tıklatın.

  2. Için küme, NOT NULL modelleme bayrağı tıklatın araştırma yapısı tab.

    Için küme regresör veya MODEL_EXISTENCE_ONLY bayraklarını tıklatın Mining modeli tab.

  3. Görüntülemek veya değiştirmek ve seçmek istediğiniz sütun sağ tıklatın. Özellikleri.

  4. Yeni model bayrak eklemek için , metin kutusunun yanındaki tıklatın ModelingFlags özellik ve Seç onay kutusunu veya kullanmak istediğiniz modelleme bayraklarını kutuları işaretleyin.

    Modelleme bayrakları, yalnızca sütun veri türü için uygun olmaları durumunda görüntülenir.

    Not

    Modelleme bayrak değiştirdikten sonra model reprocess gerekir.

Bir varolan araştırma modeli ve yapısını DMX kullanarak kullanılan modelleme bayraklarını değiştiremezsiniz.ALTER MADENCILIĞI STRUCTURE….ADD araştırma modeli söz dizimini kullanarak, yeni bir araştırma modeli oluşturmanız gerekir.

Hangi modelleme bayrakları geçerli yapısında kullanılmakta olmadığından emin değilseniz, aşağıdaki sözdizimini kullanarak modelleme bayraklarını döndüren bir sorgu oluşturabilirsiniz:

SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_STRUCTURE_COLUMNS
WHERE STRUCTURE_NAME = '<structure name>'

Bayrak modelleme regresör kullanma

Zaman, küme bayrağının bir sütunda modelleme regresör, karma algoritması için sütun olası regresörs içerdiğini belirten.Model kullanılan bir fiili regressors algoritması tarafından belirlenir.Öngörülebilir özniteliği model, olası bir regresör atılacak.

Tüm sürekli giriş sütunları, veri madenciliği sihirbazını kullanarak bir model oluştururken, olası regressors bayrakla işaretlenir.Bu nedenle, açıkça regresör bayrağının bir sütunda bile ayarlamazsanız, sütun son modelinde bir regresör olarak kullanılabilir.

Son modelinde yönelik şema satır kümesi kümesi için bir sorgu gerçekleştirerek gerçekte kullanılan regressors belirleyebilirsiniz araştırma modeli, aşağıdaki örnekte gösterildiği gibi:

SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_columnS
WHERE MODEL_NAME = '<model name>'

Not   Madenciliği model değiştirmek ve içerik türü bir sütun sürekli için ayrı değiştirirseniz, el ile madenciliği sütunda bayrağı değiştirin ve sonra model reprocess gerekir.

Regressors, doğrusal regresyon modeller

Doğrusal regresyon modeli esas alan Microsoft Karar ağaçları algoritması. Kullanmadığınız bile Microsoft Bir ağaç veya sürekli öznitelik bulunan bir gerileme gösteren bir düğüm, doğrusal regresyon algoritması, herhangi bir karar ağacı model içerebilir.

Sürekli bir sütun, bir regresör gösteren belirtmeniz gerekmez.The Microsoft Decision Trees algorithm will partition the dataset into regions with meaningful patterns even if you do not küme the regresör flag on the sütun. Fark olan zaman, küme modelleme bayrak, regresyon denklemi formunun bulmak algoritmayı deneyecek bir * C1 + b * C2 +... desenleri ağacının düğümlerin sığdırmak için.Kalan toplamı olarak hesaplanır ve çok iyi bir sapma ise, konsol ağacında bir bölünme zorlanır.

Örneğin, müşterinin satın alma davranışı kullanarak tahmin Geliri olarak, öznitelik ve küme bayrak sütun modelleme regresör, karma algoritması ilk sığacak şekilde deneyinGeliri değerleri standart regresyon formül kullanarak.Sapma çok büyük ise, regresyon formülün durdurulmuş ve diğer bir özniteliğine göre ağacı bölünmesi.Karar ağacı algoritması, sonra bir regresör gelir için her dalları sonra bölme sığacak deneyin.

Algoritma belirli bir regresör kullanmanızı güvence altına almak için FORCED_REGRESSOR parametresini kullanabilirsiniz.Bu parametre bir karar ağaçları algoritmasını ve doğrusal regresyon algoritması ile kullanılabilir.