SystemGetCrossValidationResults (- Analysis Services veri madenciliği)
Araştırma yapısı cross-sections, belirtilen sayıda bölümleri her bölüm için bir modeli eğitir ve sonra her bölüm için doğruluk ölçüler döndürür.
Not
Çapraz-kümeleme modelleri ya da kullanılarak oluşturulan modelleri doğrulamak için bu saklı yordam kullanılamaz Microsoft zaman Series algoritması veya Microsoft sırası kümeleme algoritması.Kümeleme modelleri geçici olarak doğrulamak için ayrı kullanabilirsiniz saklı yordam, SystemGetClusterCrossValidationResults (- Analysis Services veri madenciliği).
Sözdizimi
SystemGetCrossValidationResults(
<mining structure>
[, <mining model list>]
,<fold count>
,<max cases>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])
Bağımsız değişkenler
mining structure
Geçerli veritabanında bir araştırma yapısı adı.(gerekli)
mining model list
Doğrulamak için veri madenciliği modelleri virgülle ayrılmış listesi.Model adı tanımlayıcı adında geçerli olmayan karakterler içeriyorsa, adı köşeli ayraçlar içine alınmalıdır.
Veri madenciliği modelleri listesini belirtilirse, belirtilen yapısıyla ilişkilidir ve öngörülebilir bir öznitelik içeren tüm modelleri karşı çapraz doğrulama gerçekleştirilir.
Not
Kümeleme modelleri geçici olarak doğrulamak için ayrı bir saklı yordam kullanın SystemGetClusterCrossValidationResults (- Analysis Services veri madenciliği).
(isteğe bağlı)
fold count
Bölümlere ayırmak için sayısını belirten bir tamsayı veri küme.En küçük değer 2'dır.En büyük sayı Katlama maximum integer veya durumlarda sayısı düşük. kullanıldığınBu servis talebi sayısı kabaca her bölüm içerir: max cases/fold count.
Varsayılan değer yoktur.
Not
Hatları sayısı büyük ölçüde etkiler saat çapraz doğrulama gerçekleştirmek için gerekli.Çok uzun bir süredir sorguyu çalıştırmak ve bazı durumlarda sunucunun yanıt vermemesine neden olabilmesi çok yüksek bir sayı ya da saat aşımına seçerseniz.
(gerekli)
max cases
Tüm hatları sınanabilir durumlarda en fazla sayısını belirten bir tamsayı.0 Değeri gösterir veri tüm durumlarda kaynak kullanılacak.
Kendi tüm veri küme durumlarda gerçek sayısından daha büyük bir değer belirtirseniz, veri durumlarda kaynak kullanılacak.
Varsayılan değer yoktur.
(gerekli)
target attribute
Öngörülebilir öznitelik adını içeren bir dize.Bir sütun, iç içe geçmiş tablo sütun veya iç içe geçmiş tablo anahtar sütununa bir araştırma modeli öngörülebilir öznitelik olabilir.Not
Hedef öznitelik varlığını yalnızca çalışma zamanında doğrulanır saat.
(gerekli)
target state
Formül öngörmek için değer belirtir.Hedef değer belirtilirse, ölçüler için belirtilen değer yalnızca toplanır.Bir değer belirtilmezse veya null, ölçüler için her tahmin en olası durum için hesaplanmış
Varsayılan değer null.
Belirtilen özniteliği için belirtilen değer geçersiz ise veya formül belirtilen öznitelik için doğru türde değil hata doğrulama sırasında ortaya çıkar.
(isteğe bağlı)
target threshold
Double 0 ve 1'den daha büyüktür.Kazanılması için doğru olarak sayılması için belirtilen hedef durumu tahmin minimum olasılık puanı gösterir.A tahmin bir değerden küçük veya bu değere eşit bu değerlendirilir yanlış bir olasılık vardır.
Hiçbir değer belirtilmedi veya null, en olası durumu kullanılır, ne olursa olsun, olasılık puan.
Varsayılan değer null.
Not
Analysis Servicesbir hata durumunda atmaz, küme state threshold ondan, ancak, hiçbir zaman bu değeri kullanmakAslında bir eşik yüzde 0 olasılık ile Öngörüler doğru olarak sayılır 0.0 anlamına gelir.
(isteğe bağlı)
test list
Sınama seçenekleri belirten bir dize.Not Bu parametre, gelecekteki kullanım için ayrılmıştır.
(isteğe bağlı)
Dönüş Türü
Her model, her bölüm için puanlar döndürülen satır kümesi içerir.
Aşağıdaki tablo satır kümesi içindeki sütunları açıklar.
Sütun adı |
Açıklama |
---|---|
ModelName |
Test modelinin adı. |
ÖznitelikAdı |
Adı tahmin edilebilir sütun. |
AttributeState |
Belirtilen hedef değer tahmin edilebilir sütun.Bu değer ise null, en olası tahmin kullanıldı. Bu sütun için bir değer içeriyorsa, yalnızca bu değeri karşı modeli doğruluğunu karar. |
PartitionIndex |
Sonuçlar için hangi bölümünü tanımlayan 1 tabanlı bir dizin için geçerli. |
Bölüm boyutu |
Her bölümünde bulunan kaç servis taleplerini gösteren bir tamsayı. |
Sınama |
Gerçekleştirilen sınama kategorisi.Kategori ve her kategoride yer testleri açıklaması için bkz: Karşılıklı doğrulama raporu (Analysis Services - veri madenciliği). |
Ölçü |
Sýnamasý tarafýndan verilen ölçü adı.Her model için önlemleri tahmin edilebilir değerin türüne bağlıdır.Her ölçü bir tanım için bkz: Karşılıklı doğrulama (- Analysis Services veri madenciliği). Her tahmin edilebilir türü için döndürülen önlemlerin bir listesi için bkz: Karşılıklı doğrulama raporu (Analysis Services - veri madenciliği). |
Değer |
Belirtilen sınama ölçü değeri. |
Açıklamalar
Tam veri küme için doğruluk ölçüler döndürmek için kullanın SystemGetAccuracyResults (- Analysis Services veri madenciliği).
Araştırma modeli hatları bölümlenmiş, işleme atlamak ve yalnızca dönüş sonuçlar kullanarak çapraz doğrulama SystemGetAccuracyResults (- Analysis Services veri madenciliği).
Örnekler
Aşağıdaki örnek, iki hatları çapraz doğrulama için bir araştırma yapısı bölümlemek ve madenciliği yapıyla ilgili olan iki veri madenciliği modelleri test etmek gösterilmiştir [v Target Mail].
Üç kod satırı, sınamak istediğiniz veri madenciliği modelleri listeler.Yapısı ile ilişkili tüm kümeleme modelleri listesi belirtmezseniz, kullanılır.Kod satırını dört bölüm sayısını belirtir.İçin belirtilen değer yok çünkü max cases, tüm Araştırma yapısı durumlarda kullanılan ve dağıtılmış eşit üzerinden bölümleri.
Beş satır öngörülebilir öznitelik, bisiklet alıcı, altıncı satır değerini tahmin etmek için 1 ("Evet, satın alacak" anlamına gelir) belirtir.
null değeri yedi satır, karşılanması gereken minimum olasılık çubuğu yok olduğunu gösterir.Bu nedenle, ilk tahmin bir sıfır olan olasılık doğruluğu değerlendirme içinde kullanılır.
CALL SystemGetCrossValidationResults(
[v Target Mail],
[Target Mail DT], [Target Mail NB],
2,
'Bike Buyer',
1,
NULL
)
Örnek sonuçlar:
ModelName |
ÖznitelikAdı |
AttributeState |
PartitionIndex |
Bölüm boyutu |
Sınama |
Ölçü |
Değer |
---|---|---|---|---|---|---|---|
Hedef posta dt |
Bisiklet alıcı |
1 |
1 |
500 |
Sınıflandırma |
Doğru olumlu |
144 |
Hedef posta dt |
Bisiklet alıcı |
1 |
1 |
500 |
Sınıflandırma |
Yanlış pozitif |
105 |
Hedef posta dt |
Bisiklet alıcı |
1 |
1 |
500 |
Sınıflandırma |
Doğru negatif |
186 |
Hedef posta dt |
Bisiklet alıcı |
1 |
1 |
500 |
Sınıflandırma |
Yanlış negatif |
65 |
Hedef posta dt |
Bisiklet alıcı |
1 |
1 |
500 |
Olasılığını |
Günlük puan |
-0.619042807138345 |
Hedef posta dt |
Bisiklet alıcı |
1 |
1 |
500 |
Olasılığını |
Yükselt |
0.0740963734002671 |
Hedef posta dt |
Bisiklet alıcı |
1 |
1 |
500 |
Olasılığını |
Kök ortalama kare hata |
0.346946279977653 |
Hedef posta dt |
Bisiklet alıcı |
1 |
2 |
500 |
Sınıflandırma |
Doğru olumlu |
162 |
Hedef posta dt |
Bisiklet alıcı |
1 |
2 |
500 |
Sınıflandırma |
Yanlış pozitif |
86 |
Hedef posta dt |
Bisiklet alıcı |
1 |
2 |
500 |
Sınıflandırma |
Doğru negatif |
165 |
Hedef posta dt |
Bisiklet alıcı |
1 |
2 |
500 |
Sınıflandırma |
Yanlış negatif |
87 |
Hedef posta dt |
Bisiklet alıcı |
1 |
2 |
500 |
Olasılığını |
Günlük puan |
-0.654117781086519 |
Hedef posta dt |
Bisiklet alıcı |
1 |
2 |
500 |
Olasılığını |
Yükselt |
0.038997399132084 |
Hedef posta dt |
Bisiklet alıcı |
1 |
2 |
500 |
Olasılığını |
Kök ortalama kare hata |
0.342721344892651 |
Gereksinimler
Çapraz doğrulama yalnızca SQL Server Enterprise ile başlayan SQL Server 2008.
Ayrıca bkz.