Aracılığıyla paylaş


Sınıflandırma matris (Analysis Services - veri madenciliği)

The Classification Matrix tab of the Mining Accuracy Chart tab of veri madenciliği Designer displays a matrix for each model that you specify in the Input Selection tab.Bu grafik görüntüleyerek, hangi bazen olarak adlandırılmıştır bir karışıklıkları matrisi, ne kadar sıklıkla modeli doğru öngörülen hızlı şekilde görebilirsiniz.

Fiili değerler sütunları göstermek için ise her matris satırları, modeli için tahmini değerleri gösterir.Sınıflandırma matris kategorilere tüm servis talepleri sıralayarak oluşturulur: Öngörülen Değer, gerçek değerini mi eşleşti ve öngörülen değer, doğru veya yanlış olup olmadığı. Bu kategoriler bazen olarak adlandırılır Yanlış pozitif, gerçek pozitif, yanlış negatif, and doğru negatif.Her kategorideki tüm servis talepleri sonra sayılır ve toplamları dizey içinde görüntülenir.

Bu bölüm sınıflandırması matris oluşturma ve sonuçlar yorumlama açıklar.

Not

Ayrı öngörülebilir özniteliklere sahip yalnızca BIR sınıflandırma matris kullanılır.

Senaryosu

Örneğin, bir parçası olarak oluşturulan modelini dikkate Temel veri madenciliği Öğreticisi. The TM_DecisionTree model, which is used to help create a targeted mailing campaign, can be used to predict which customers are most likely to buy a bike.Müşterinin değerini bisikleti satın olasıdır, [Bike Buyer] sütun değeri bisikleti satın almak müşteri düşüktür; 1 ise [Bike Buyer] sütun 0'dır.

Model Öngörüler yapmadan en etkin olup olmadığını değerlendirmeniz için bir veri sınamanız küme ilişkin değerleri [Bike Buyer] zaten denir. Genellikle, Owner modeli eğitim için kullanılan araştırma yapısı oluşturduğunuzda ayarladığınız test veri kümesi kullanılır.Bu veriler gerçek sonuçlar içerdiğinden, beklenen değer modeli öngörülen kaç defa hızlı bir şekilde belirleyebilirsiniz.

Sınıflama matrisin anlama

Aşağıdaki tabloda TM_DecisionTree modeli için oluşturulan bir sınıflandırma matris sonuçlar gösterir.Öngörülebilir bu öznitelik için iki olası değerler olduğundan, 0 ve 1, bu modeli bir tahmin doğru hissettiren ne sıklıkta iletmeleri oldukça kolaydır.

Öngörülen

0 (Gerçek)

1 (Actual)

0

362

144

1

121

373

Değer 362 içeren ilk sonuç hücre sayısını gösterir. gerçek pozitif durumlar 0 değeri.0, Müşterinin bir bisikleti satın olduğunu belirtir çünkü bu istatistiğe bu modeli 362 durumda olmayan bisikleti alıcılar için doğru değer öngörülen bildirir.

Hücre doğrudan 121 değeri içerir, bu bir, sayısı bildirir Yanlış pozitif durumlar veya model kaç kez gerçekten görünmelerini değil, birisi bir bisikletin satın, öngörülen.

144 Değeri içeren hücre gösterir Yanlış pozitif durumlar 1 değeri.1, Bir bisiklet müşterinin satınalma anlamına gelir, çünkü bu istatistiğe 144 durumlarda, gerçekte yanlış yüklenmediği halde yanlış yüklenmiş, birisinin bir bisikleti satın değil modeli öngörülen bildirir.

Son olarak, 373 değeri içeren hücre hedef değeri 1'için doğru pozitif durumlar sayısını gösterir.Diğer bir deyişle, 373 durumlarda modeli doğru birisi bir bisikleti satın öngörülen.

Çapraz olarak bitişik olan hücrelerdeki değerleri toplayarak, model genel doğruluğunu belirleyebilirsiniz.Bir çapraz doğru Öngörüler toplam sayısı size bildirir ve başka bir çapraz hatalı Öngörüler toplam sayısı size bildirir.

Birden fazla tahmin edilebilir değerleri kullanma

[Bike alıcı] büyük/küçük durum, özellikle yalnızca iki olası değerler olduğundan yorumlamak kolay bir işlemdir.Zaman öngörülebilir öznitelik birden çok olası değer vardır, sınıflandırma Matrisin her olası bir fiili değer için yeni bir sütun ekler ve her değer öngörülen için sonra eşleşmeleri sayar.Aşağıdaki tablo (0, 1, 2), üç değer olasıdır farklı modelinde, sonuçlar gösterir.

Öngörülen

0 (Gerçek)

1 (Actual)

2 (Actual)

0

111

3

5

1

2

123

17

2

19

0

20

Daha fazla sütun ve buna ek olarak rapor daha karmaşık bir arama yapar, ancak yanlış tahmin yapma maliyetini değerlendirmek istediğiniz ek ayrıntı çok yararlı olabilir.Toplamların üzerinde köşegenleri oluşturmak veya satır farklı kombinasyonları için sonuçlar karşılaştırmak için tıklatabilirsiniz Kopyalama sağlanan düğmesiSınıflandırma matrisi sekmesini tıklatın ve Excel'e Rapor yapıştırma.Alternatif olarak, her ikisini de destekler; Excel, veri madenciliği istemci gibi bir istemci kullanabilirsiniz SQL Server 2005 ve SQL Server 2008, doğrudan sayımları hem de yüzde içeren Excel içinde bir sınıflandırma rapor oluşturmak için. Daha fazla bilgi için bkz: SQL Server veri madenciliği.

Sınıflama matris oluşturma

Sınıflandırma matris oluşturduğunuzda, bu temel adımları izleyin:

  1. Içinde Madenciliği doğruluğu grafik veri madenciliği tasarımcısının seçeneğini tıklatınGiriş Seçimi tab.

  2. Içinde Giriş Seçimi sekmesini değerlendirmek için modeli seçin.

  3. Öngörülebilir özniteliği ve isteğe bağlı olarak tahmin edilebilir bir değer belirtin.

  4. Verileri seçmek küme değerlendirme içinde kullanılacak.

  5. Tıklatın Sınıflandırma matrisi sekmesi, otomatik olarak sınıflandırma matris biçiminde rapor oluşturmaya çalışır.

Tüm grafik türleri için geçerli bir adım adım yordam için bkz: Nasıl Yapılır: Bir doğruluğu grafik için oluşturma bir araştırma modeli.

The Basic veri madenciliği Tutorial also includes a walkthrough of how to create a yükseltme grafiği for the Targeted Mailing model.Daha fazla bilgi için bkz:Doğruluğu Lift grafikleri (temel veri madenciliği Öğreticisi) ile sınama.