Logistic regresyon modeli sorgulama (- Analysis Services veri madenciliği)
Bir veri karşı bir sorgu oluşturduğunuzda, araştırma modeli, analiz keşfedilen desenleri hakkında ayrıntılı bilgi sağlayan içerik bir sorgu oluşturabilir veya yeni verileri kullanarak Öngörüler yapmak modelinde desenleri kullanır tahmin sorgu oluşturabilirsiniz.
Bu bölümde, Microsoft Logistic regresyon algoritma dayalı modelleri için sorgular oluşturmak açıklar.
İçerik sorguları
Veri madenciliği şeması satır kümesi kullanarak modeli Parametreler alınıyor
Modeli hakkında ek ayrıntı dmx kullanarak bulma
Tahmin sorgular
Sürekli bir değer için Öngörüler yapmak
Ayrı bir değer için Öngörüler yapmak
Logistic regresyon modeli hakkında bilgi alma
Logistic regresyon modelleri özel bir parametre küme Microsoft Neural ağ algoritması kullanılarak oluşturulur; Bu nedenle, logistic regresyon modeli neural ağ modeli aynı bilgileri bazıları vardır, ancak daha az karmaşıktır.Modeli içeriği ve hangi düğüm türü ne tür bilgiler deposu yapısını anlamak için bkz: Logistic regresyon modeller için içerik modeli mining (Analysis Services - veri madenciliği).
Sorgu senaryolarda gelmesini, logistic regresyon modeli Ara veri Mining öğretici aşağıdaki bölümde açıklandığı şekilde oluşturabilirsiniz: Ders 5: Ağ Neural ve Logistic regresyon modeller (Ara veri madenciliği Öğreticisi) oluşturma.
Araştırma yapısı da kullanabilirsiniz Targeted Mailing, dan Temel veri madenciliği öğreticisi.
ALTER MINING STRUCTURE [Targeted Mailing]
ADD MINING MODEL [TM_Logistic Regression]
([Customer Key],
[Age],
[Bike Buyer] PREDICT,
[Yearly Income] PREDICT,
[Commute Distance],
[English Education],
Gender,
[House Owner Flag],
[Marital Status],
[Number Cars Owned],
[Number Children At Home],
[Region],
[Total Children]
)
USING Microsoft_Logistic_Regression
Örnek sorgu 1: Veri madenciliği şeması satır kümesi kullanarak modeli Parametreler alınıyor
Veri madenciliği şema satır kümesi sorgulayarak, ne zaman oluşturulduğunu, ne zaman modeli son işlendiği, modelin temel araştırma yapısı adını ve öngörülebilir bir öznitelik olarak kullanılan sütun adı gibi modeli hakkında meta veriler bulabilirsiniz.Aşağıdaki örnek modeli ilk, adını ve türünü modeli ile birlikte oluşturulan kullanılmış olan parametreler ve oluşturulma tarih verir.
SELECT MODEL_NAME, SERVICE_NAME, DATE_CREATED, MINING_PARAMETERS
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Call Center_LR'
Örnek sonuçlar:
MODEL_ADI |
HİZMET_ADI |
DATE_CREATED |
MINING_PARAMETERS |
---|---|---|---|
Center_LR arayın |
Microsoft_Logistic_Regression |
04/07/2009 20:38:33 |
HOLDOUT_PERCENTAGE = 30 HOLDOUT_SEED = 1, MAXIMUM_INPUT_ATTRIBUTES 255 MAXIMUM_OUTPUT_ATTRIBUTES = 255 MAXIMUM_STATES = 100, SAMPLE_SIZE = 10000 = |
Başa dön
Örnek sorgu 2: Modeli hakkında ek ayrıntı dmx kullanarak bulma
Logistic regresyon modeli hakkında bazı temel bilgileri aşağıdaki sorgu döndürür.Logistic regresyon modeli bir neural ağ modeli Marjinal istatistikleri düğüm varlığını da dahil olmak üzere pek çok yolla benzer (node_type = 24) girdi kullanılan değerleri açıklar.Bu örnek sorgu hedeflenen posta modeli kullanır ve tüm girişleri değerlerini yuvalanmış alarak onları alır tablo, NODE_DISTRIBUTION.
SELECT FLATTENED NODE_DISTRIBUTION AS t
FROM [TM_Logistic Regression].CONTENT
Kısmi sonuçlar:
t.ATTRIBUTE_NAME |
t.ATTRIBUTE_VALUE |
t.support |
t.PROBABILITY |
t.VARIANCE |
t.VALUETYPE |
---|---|---|---|---|---|
Geçerlilik süresi |
Eksik |
0 |
0 |
0 |
1 |
Geçerlilik süresi |
45.43491192 |
17484 |
1 |
126.9544114 |
3 |
Bisiklet alıcı |
Eksik |
0 |
0 |
0 |
1 |
Bisiklet alıcı |
0 |
8869 |
0.507263784 |
0 |
4 |
Bisiklet alıcı |
1 |
8615 |
0.492736216 |
0 |
4 |
Uzaklık iletişim |
Eksik |
0 |
0 |
0 |
1 |
Uzaklık iletişim |
5-10 Mil |
3033 |
0.173472889 |
0 |
4 |
Gerçek sorgu çok fazla satır döndürür; Ancak, bu örnek, sağlanan girdileri hakkında bilgi türünü göstermektedir.Ayrı girişleri için olası her değerin listelenen tablo.Sürekli değeri için girdi gibi Age, tam bir liste imkansız olacak discretized giriş olarak ortalama.Marjinal istatistikleri düğüm bilgileri kullanma hakkında daha fazla bilgi için bkz: Logistic regresyon modeller için içerik modeli mining (Analysis Services - veri madenciliği).
Not
sonuçlar daha kolay görüntüleme için düzleştirilmiş, ancak tek bir sütunda, iç içe geçmiş tablo dönebilirsiniz sizin sağlayıcı hiyerarşik satır kümeleri destekler.Daha fazla bilgi için bkz: Hiyerarşik satır kümeleri ole db Programmer's Guide.
Başa dön
Logistic regresyon modeli üzerinde tahmin sorgular
Kullanabileceğiniz Tahmin (dmx) işlev ile her tür araştırma modeli için yeni veri modeline sunarlar ve Öngörüler göre yeni değerler.Geri dönmek gibi bir öngörü doğru olma olasılığını tahmin hakkında ek bilgi için işlevler de kullanabilirsiniz.Bu bölümde bir logistic regresyon modeli üzerinde tahmin sorgular bazı örnekler verilmektedir.
Örnek sorgu 3: Sürekli bir değer için Öngörüler yapmak
Logistic regresyon sürekli öznitelikler için iki giriş destekler çünkü ve tahmin, verilerinizdeki çeşitli faktörler ilişkilendirmek modeller oluşturmak kolay bir işlemdir.Bu etkenler arasında ilişki keşfetmek için tahmin sorguları kullanabilirsiniz.
Aşağıdaki sorgu örneği çağrı merkezinin modelinden, deneyimli eğitmen dayanır ve am Cuma üst karakter için hizmet notu öngörür bir singleton sorgu oluşturur.The PredictHistogram (DMX) function returns a nested table that provides statistics relevant to understanding the validity of the predicted value.
SELECT
Predict([Call Center_LR].[Service Grade]) as Predicted ServiceGrade,
PredictHistogram([Call Center_LR].[Service Grade]) as [Results],
FROM
[Call Center_LR]
NATURAL PREDICTION JOIN
(SELECT 'Friday' AS [Day Of Week],
'AM' AS [Shift]) AS t
Örnek sonuçlar:
Öngörülen hizmet notu |
Sonuçlar |
---|---|
0.102601830123659 |
Servis notu$DESTEK$OLASILIK$ADJUSTEDPROBABILITY$SAPMA$STDSAPMA
0.10260183012365983.02325581395350.98837209302325600.001205526606000870.034720694203902
0.9767441860465120.01162790697674420.011627906976744200
|
İç içe geçmiş NODE_DISTRIBUTION olasılığı, destek ve standart sapma değerleri hakkında daha fazla bilgi için tablo, bkz: Logistic regresyon modeller için içerik modeli mining (Analysis Services - veri madenciliği).
Başa dön
Örnek sorgu 4: Ayrı bir değer için Öngörüler yapmak
Logistic regresyon, genellikle ikili bir sonuç için katkıda bulunan faktörler analiz etmek istediğiniz senaryolarda kullanılır.Öğreticide kullanılan modeli öngörür ServiceGrade, sürekli bir değer rağmen gerçek yaşamdan senaryoda, isteyebilirsiniz küme hedef değer modelini hizmet notu bazı karşılanmış olup olmadığını tahmin etmek discretized.Alternatif olarak, sürekli bir değer kullanarak Öngörüler çıktı ancak daha sonra iyi, serginin ya da kötü tahmin edilen sonuçlar grup.
Aşağıdaki örnek, öngörülebilir öznitelik gruplandırılır şeklini değiştirmek verilmektedir.Bunu yapmak için bir kopyasını oluşturmak araştırma yapısı ve hedef sütun discretization yöntemi değerlerin gruplandırılmış yerine sürekli olacak şekilde değiştirin.
Aşağıdaki yordam nasıl değiştirileceği açıklanır gruplandırma , Service Grade değer çağrı merkezi veri.
Çağrı merkezi araştırma yapısı ve modelleri discretized sürüm oluşturmak için
Business Intelligence Development Studio, Solution Explorer'da, sırasıyla Mining yapıları.
Sağ Call Center.dmm ve Copy.
Sağ tıklatın Mining yapıları ve Yapıştır.Adlı yeni bir araştırma yapısı ISS eklendi, Call Center 1.
Yeni araştırma yapısı sağ tıklatın ve seçin yeniden.Yeni adı, çağrı merkezi Discretized yazın.
Yeni araştırma yapısı tasarımcısında açmak için çift tıklatın.Veri madenciliği modelleri tüm de kopyalanmış ve tüm 1 uzantılı dikkat edin.Adları şimdilik olduğu gibi bırakın.
De Mining yapısı sekmesinde, sağ tıklatın sütun için Service Gradeve Özellikler.
Değişiklik Content özellik dan sürekli için Discretized.Değişiklik DiscretizationMethod özellik için kümeleri.Discretization BucketCount için 3 yazın.
Not
Bu parametreler yalnızca işlem gösteren için kullanılır ve mutlaka geçerli bir model oluşturmak,
Dan Mining modeli Seç menüsünden işlem yapısı ve tüm modeller.
Aşağıdaki örnek sorgu, bu discretized modelini temel alır ve öngörülen her sonuç için olasılık değerleriyle birlikte haftanın belirtilen gün için hizmet notu öngörür.
SELECT
(PredictHistogram([Call Center_LR 1].[Service Grade])) as [Predictions]
FROM
[Call Center_LR 1]
NATURAL PREDICTION JOIN
(SELECT 'Saturday' AS [Day Of Week]) AS t
Beklenen sonuçlar:
Öngörüler |
---|
Servis notu$DESTEK$OLASILIK$ADJUSTEDPROBABILITY$SAPMA$STDSAPMA
0.1087271838312535.72465047706410.4252934580602870.017016836003029300
0.0585576923062531.70988808007030.3774986676198850.02088202006045400
0.17016949152515.61091598832020.1858442379561920.066138657138604900
0.9545454545454550.01136363636363640.011363636363636400
|
Tahmin edilen sonuçlar belirtildiği gibi üç kategoride gruplandırılmış dikkat edin; Ancak, bu gruplandırmalar gerekebilir değil rasgele değerleri veri içinde gerçek değerlerin üzerinde tabanlı kümeleme küme iş hedefleri olarak.
Başa dön
Tahmin işlevlerin listesi
Tüm Microsoft algoritmaları desteği ortak küme işlevleri.Ancak, Microsoft Logistic regresyon algoritması aşağıdaki tablo. listelenen ek işlevleri destekler
|
Tüm ortak işlevlerin listesi için Microsoft algoritmalar, bkz: Eşleştirme türleri (dmx) sorgu işlevler.Belirli işlevleri sözdizimini görmek Veri madenciliği Extensions (dmx) işlev başvurusu.
Not
Ağ neural ve logistic regresyon modeller için PredictSupport (dmx) işlevi eğitim boyutunu gösteren tek bir değer döndüren küme için tüm modeli.
Ayrıca bkz.