Bagikan melalui


Matriks Klasifikasi (Analysis Services - Penggalian Data)

Berlaku untuk: SQL Server 2019 dan Analysis Services Azure Analysis Services Fabric/Power BI Premium sebelumnya

Penting

Penambangan data tidak digunakan lagi di SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.

Matriks klasifikasi mengurutkan semua kasus dari model ke dalam kategori, dengan menentukan apakah nilai yang diprediksi cocok dengan nilai aktual. Semua kasus di setiap kategori kemudian dihitung, dan total ditampilkan dalam matriks. Matriks klasifikasi adalah alat standar untuk evaluasi model statistik dan terkadang disebut sebagai matriks kebingungan.

Bagan yang dibuat saat Anda memilih opsi Matriks Klasifikasi membandingkan aktual dengan nilai yang diprediksi untuk setiap status yang diprediksi yang Anda tentukan. Baris dalam matriks mewakili nilai yang diprediksi untuk model, sedangkan kolom mewakili nilai aktual. Kategori yang digunakan dalam analisis adalah positif palsu, positif benar, negatif palsu, dan negatif sejati

Matriks klasifikasi adalah alat penting untuk menilai hasil prediksi karena memudahkan untuk memahami dan memperkirakan efek prediksi yang salah. Dengan melihat jumlah dan persentase di setiap sel matriks ini, Anda dapat dengan cepat melihat seberapa sering model diprediksi secara akurat.

Bagian ini menjelaskan cara membuat matriks klasifikasi dan cara menginterpretasikan hasilnya.

Memahami Matriks Klasifikasi

Pertimbangkan model yang Anda buat sebagai bagian dari Tutorial Penggalian Data Dasar. Model [TM_DecisionTree] digunakan untuk membantu membuat kampanye surat yang ditargetkan, dan dapat digunakan untuk memprediksi pelanggan mana yang paling mungkin membeli sepeda. Untuk menguji kegunaan model ini yang diharapkan, Anda menggunakan himpunan data yang nilai atribut hasilnya, [Pembeli Sepeda], sudah diketahui. Biasanya, Anda akan menggunakan himpunan data pengujian yang Anda sisihkan saat membuat struktur penambangan yang digunakan untuk melatih model.

Hanya ada dua kemungkinan hasil: ya (pelanggan kemungkinan akan membeli sepeda), dan tidak (pelanggan kemungkinan tidak akan membeli sepeda). Oleh karena itu, matriks klasifikasi yang dihasilkan relatif sederhana.

Menginterpretasikan Hasil

Tabel berikut ini memperlihatkan matriks klasifikasi untuk model TM_DecisionTree. Ingat bahwa untuk atribut yang dapat diprediksi ini, 0 berarti Tidak dan 1 berarti Ya.

Diperkirakan 0 (Aktual) 1 (Aktual)
0 362 144
1 121 373

Sel hasil pertama, yang berisi nilai 362, menunjukkan jumlah positif benar untuk nilai 0. Karena 0 menunjukkan bahwa pelanggan tidak membeli sepeda, statistik ini memberi tahu Anda bahwa model memprediksi nilai yang benar untuk pembeli non sepeda dalam kasus 362.

Sel tepat di bawah yang satu itu, yang berisi nilai 121, memberi tahu Anda jumlah positif palsu, atau berapa kali model memprediksi bahwa seseorang akan membeli sepeda ketika sebenarnya tidak.

Sel yang berisi nilai 144 menunjukkan jumlah positif palsu untuk nilai 1. Karena 1 berarti bahwa pelanggan membeli sepeda, statistik ini memberi tahu Anda bahwa dalam 144 kasus, model memprediksi seseorang tidak akan membeli sepeda padahal sebenarnya mereka melakukannya.

Terakhir, sel yang berisi nilai 373 menunjukkan jumlah positif sejati untuk nilai target 1. Dengan kata lain, dalam 373 kasus model memprediksi dengan benar bahwa seseorang akan membeli sepeda.

Dengan menjumlahkan nilai dalam sel yang berdekatan secara diagonal, Anda dapat menentukan akurasi keseluruhan model. Satu diagonal memberi tahu Anda jumlah total prediksi yang akurat, dan diagonal lainnya memberi tahu Anda jumlah total prediksi yang salah.

Menggunakan Beberapa Nilai yang Dapat Diprediksi

Kasus [Pembeli Sepeda] sangat mudah ditafsirkan karena hanya ada dua nilai yang mungkin. Ketika atribut yang dapat diprediksi memiliki beberapa nilai yang mungkin, matriks klasifikasi menambahkan kolom baru untuk setiap nilai aktual yang mungkin lalu menghitung jumlah kecocokan untuk setiap nilai yang diprediksi. Tabel berikut ini memperlihatkan hasil pada model yang berbeda, di mana tiga nilai (0, 1, 2) dimungkinkan.

Diperkirakan 0 (Aktual) 1 (Aktual) 2 (Aktual)
0 111 3 5
1 2 123 17
2 19 0 20

Meskipun penambahan lebih banyak kolom membuat laporan terlihat lebih kompleks, detail tambahan bisa sangat berguna ketika Anda ingin menilai biaya kumulatif untuk membuat prediksi yang salah. Untuk membuat jumlah pada diagonal atau membandingkan hasil untuk kombinasi baris yang berbeda, Anda bisa mengklik tombol Salin yang disediakan di tab Matriks Klasifikasi dan menempelkan laporan ke Excel. Atau, Anda dapat menggunakan klien seperti Klien Penggalian Data untuk Excel, yang mendukung SQL Server 2005 (9.x) dan versi yang lebih baru, untuk membuat laporan klasifikasi langsung di Excel yang menyertakan hitungan dan persentase. Untuk informasi selengkapnya, lihat SQL Server Penggalian Data.

Pembatasan pada Matriks Klasifikasi

Matriks klasifikasi hanya dapat digunakan dengan atribut diskrit yang dapat diprediksi.

Meskipun Anda dapat menambahkan beberapa model saat memilih model pada tab Pilihan Input dari perancang Bagan Akurasi Penambangan , tab Matriks Klasifikasi akan menampilkan matriks terpisah untuk setiap model.

Topik berikut berisi informasi selengkapnya tentang cara membuat dan menggunakan matriks klasifikasi dan bagan lainnya.

Topik Tautan
Menjelaskan jenis bagan terkait. Bagan Angkat (Analysis Services - Penggalian Data)

Bagan Laba (Analysis Services - Penggalian Data)

Plot Sebar (Analysis Services - Penggalian Data)
Menjelaskan penggunaan validasi silang untuk model penambangan dan struktur penambangan. Validasi Silang (Analysis Services - Penggalian Data)
Menjelaskan langkah-langkah untuk membuat bagan angkat dan bagan akurasi lainnya. Tugas dan Panduan Pengujian dan Validasi (Penggalian Data)

Lihat juga

Pengujian dan Validasi (Penggalian Data)