Aracılığıyla paylaş


Sınıflandırma matrisi (Analysis Services - veri madenciliği)

The Classification Matrix tab of the Mining Accuracy Chart tab of Data Mining Designer displays a matrix for each model that you specify in the Input Selection tab.Bu grafik görüntüleyerek, hangi bazen olarak anılacaktır bir karışıklığı matris, ne kadar sıklıkla modeli doğru olarak öngörülen hızlı bir şekilde görebilirsiniz.

Oysa gerçek değerlerini sütunları göstermek her Matrisin satır modeli için öngörülen değerleri temsil eder.Sınıflandırma matris kategoriler halinde tüm durumlarda sıralayarak oluşturulur: olup öngörülen değer gerçek değerini eşleşti ve tahmini değeri doğru veya yanlış olup olmadığı.Bu kategoriler olarak adlandırılır yanlış pozitif, doğru olumlu, yanlış negatif, ve doğru negatif.Sonra her kategorideki tüm servis talepleri dikkate alınır ve toplamları matrisin içinde görüntülenir.

Bu bölüm, bir sınıflandırma matris oluşturma ve sonuçlar yorumlamak açıklar.

Not

Sınıflandırma matris yalnızca kesikli öngörülebilir öznitelikleri ile kullanılabilir.

Senaryo

Örneğin, bir parçası oluşturulan model göz önüne Temel veri madenciliği öğreticisi.The TM_DecisionTree model, which is used to help create a targeted mailing campaign, can be used to predict which customers are most likely to buy a bike.Müşteri değeri, bir bisiklet satın almak olasıdır, [Bike Buyer] sütun 1; Müşteri değeri, bir bisiklet satın almak düşüktür, [Bike Buyer] sütun: 0.

Model Öngörüler yapmak en etkili olup olmadığını değerlendirin için onu karşı bir veri küme için test değerleri [Bike Buyer] ' dir. zaten bilinenGenellikle, kenara eğitim modeli için kullanılan araştırma yapısı oluşturduğunuzda ayarladığınız sınama veri küme kullanın.Bu veriler gerçek sonuçlar içerdiğinden, beklenen değer modeli öngörülen kaç kez hızlı bir şekilde belirleyebilirsiniz.

Sınıflandırma matris anlama

Aşağıdaki tablo TM_DecisionTree modeli için sınıflandırma matris oluşturduğunuzda sonuçlarnı gösterir.Bu öngörülebilir öznitelik için yalnızca iki olası değerler için 0 ve 1, sıklıkla modeli bir tahmin doğru yaptığı bildirmek oldukça kolaydır.

Öngörülen

0 (Gerçek)

1 (Gerçek)

0

362

144

1

121

373

362 Değeri içeren, ilk sonuç hücre sayısını gösterir doğru pozitif durumlar için 0 değeri.Müşteri bir bisiklet satın 0 gösterir çünkü bu istatistik, bu modelin doğru değeri olmayan bisiklet-362 durumlarda alıcılar için öngörülen söyler.

121 Değer içeren, doğrudan o biri, altındaki hücre sayısını bildirir yanlış pozitif durumlar, ya da kaç kez modeli öngörülen birisi zaman, aslında bir bisiklet satın onlar yapmadı.

144 Değeri içeren hücre sayısını gösterir yanlış pozitif durumlar değeri 1.Müşteri bir bisiklet satın 1 anlamına gelir çünkü bu istatistik, 144 durumlarda birisi değil satın bir bisiklet modeli öngörülen söyler, ne zaman olgu görünmelerini.

Son olarak, 373 değeri içeren hücre doğru pozitif durumlar için hedef değeri 1 sayısını gösterir.Başka bir deyişle, 373 durumlarda modeli düzgün birisi bir bisiklet satın öngörülen.

Çapraz bitişiktir hücrelerdeki değerleri toplayarak modeli genel doğruluğunu belirleyebilirsiniz.Bir çapraz doğru Öngörüler toplam sayısını bildirir ve diğer çapraz toplam sayısı hatalı Öngörüler söyler.

Birden çok öngörülebilir değerleri kullanma

[Bisiklet alıcı] durum yalnızca iki olası değerler olduğundan yorumlamak özellikle kolaydır.Öngörülebilir öznitelik birden çok olası değerler varsa, sınıflandırma matris her olası gerçek değeri için yeni bir sütun ekler ve ardından eşleşmeleri Regresyondaki her değer için sayar.Aşağıdaki tablo sonuçlar burada üç değeri (0, 1, 2) olası farklı model üzerinde gösterir.

Öngörülen

0 (Gerçek)

1 (Gerçek)

2 (Gerçek)

0

111

3

5

1

2

123

17

2

19

0

20

Daha karmaşık Ara rapor ve buna ek olarak daha fazla sütun hale getirse de, yanlış tahmin yapma maliyetini değerlendirmek istediğinizde ek ayrıntı çok yararlı olabilir.Üzerinde köşegen toplamları oluşturun veya satır farklı kombinasyonları sonuçlar karşılaştırmak için tıklatabilirsiniz Copy sağlanan düğmeyi Sınıflandırma matris sekmesini ve rapor Excel'e yapıştırabilirsiniz.Alternatif olarak, her ikisini de destekler, Excel veri Mining istemcisi gibi bir istemci kullanabilirsiniz SQL Server 2005 ve SQL Server 2008, doğrudan Microsoft Excel'de bir sınıflandırma raporu oluşturmak için içeren hem sayıları ve yüzdeleri.Daha fazla bilgi için bkz: sql Server veri Mining.

Sınıflandırma matris oluşturma

Sınıflandırma matris oluşturduğunuzda, bu temel adımları izleyin:

  1. De Mining doğruluğu grafik tıklatın veri Mining Tasarımcısı, Giriş seçimi sekmesi.

  2. De Giriş seçimi sekmesinde, değerlendirmek için bir model seçin.

  3. Öngörülebilir öznitelik ve isteğe bağlı olarak tahmin edilebilir değer belirtin.

  4. Değerlendirme içinde kullanmak için veri küme seçin.

  5. ' I Sınıflandırma matris otomatik olarak sınıflandırma matris biçiminde bir rapor üretmek için sekme.

Tüm grafik türleri için geçerlidir, bir adım adım yordam için bkz: Nasıl yapılır: Doğruluk grafik için bir araştırma modeli oluşturma.

The Basic Data Mining Tutorial also includes a walkthrough of how to create a lift chart for the Targeted Mailing model.Daha fazla bilgi için bkz: Lift grafik (temel veri madenciliği Öğreticisi) doğrulukla sınama.