Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Berlaku untuk: SQL Server 2019 dan Analysis Services
Azure Analysis Services
Fabric/Power BI Premium sebelumnya
Penting
Penambangan data tidak digunakan lagi di SQL Server 2017 Analysis Services dan sekarang dihentikan di SQL Server 2022 Analysis Services. Dokumentasi tidak diperbarui untuk fitur yang tidak digunakan lagi dan dihentikan. Untuk mempelajari selengkapnya, lihat Kompatibilitas mundur Analysis Services.
Matriks klasifikasi mengurutkan semua kasus dari model ke dalam kategori, dengan menentukan apakah nilai yang diprediksi cocok dengan nilai aktual. Semua kasus di setiap kategori kemudian dihitung, dan total ditampilkan dalam matriks. Matriks klasifikasi adalah alat standar untuk evaluasi model statistik dan terkadang disebut sebagai matriks kebingungan.
Bagan yang dibuat saat Anda memilih opsi Matriks Klasifikasi membandingkan aktual dengan nilai yang diprediksi untuk setiap status yang diprediksi yang Anda tentukan. Baris dalam matriks mewakili nilai yang diprediksi untuk model, sedangkan kolom mewakili nilai aktual. Kategori yang digunakan dalam analisis adalah positif palsu, positif benar, negatif palsu, dan negatif sejati
Matriks klasifikasi adalah alat penting untuk menilai hasil prediksi karena memudahkan untuk memahami dan memperkirakan efek prediksi yang salah. Dengan melihat jumlah dan persentase di setiap sel matriks ini, Anda dapat dengan cepat melihat seberapa sering model diprediksi secara akurat.
Bagian ini menjelaskan cara membuat matriks klasifikasi dan cara menginterpretasikan hasilnya.
Memahami Matriks Klasifikasi
Pertimbangkan model yang Anda buat sebagai bagian dari Tutorial Penggalian Data Dasar. Model [TM_DecisionTree] digunakan untuk membantu membuat kampanye surat yang ditargetkan, dan dapat digunakan untuk memprediksi pelanggan mana yang paling mungkin membeli sepeda. Untuk menguji kegunaan model ini yang diharapkan, Anda menggunakan himpunan data yang nilai atribut hasilnya, [Pembeli Sepeda], sudah diketahui. Biasanya, Anda akan menggunakan himpunan data pengujian yang Anda sisihkan saat membuat struktur penambangan yang digunakan untuk melatih model.
Hanya ada dua kemungkinan hasil: ya (pelanggan kemungkinan akan membeli sepeda), dan tidak (pelanggan kemungkinan tidak akan membeli sepeda). Oleh karena itu, matriks klasifikasi yang dihasilkan relatif sederhana.
Menginterpretasikan Hasil
Tabel berikut ini memperlihatkan matriks klasifikasi untuk model TM_DecisionTree. Ingat bahwa untuk atribut yang dapat diprediksi ini, 0 berarti Tidak dan 1 berarti Ya.
Diperkirakan | 0 (Aktual) | 1 (Aktual) |
---|---|---|
0 | 362 | 144 |
1 | 121 | 373 |
Sel hasil pertama, yang berisi nilai 362, menunjukkan jumlah positif benar untuk nilai 0. Karena 0 menunjukkan bahwa pelanggan tidak membeli sepeda, statistik ini memberi tahu Anda bahwa model memprediksi nilai yang benar untuk pembeli non sepeda dalam kasus 362.
Sel tepat di bawah yang satu itu, yang berisi nilai 121, memberi tahu Anda jumlah positif palsu, atau berapa kali model memprediksi bahwa seseorang akan membeli sepeda ketika sebenarnya tidak.
Sel yang berisi nilai 144 menunjukkan jumlah positif palsu untuk nilai 1. Karena 1 berarti bahwa pelanggan membeli sepeda, statistik ini memberi tahu Anda bahwa dalam 144 kasus, model memprediksi seseorang tidak akan membeli sepeda padahal sebenarnya mereka melakukannya.
Terakhir, sel yang berisi nilai 373 menunjukkan jumlah positif sejati untuk nilai target 1. Dengan kata lain, dalam 373 kasus model memprediksi dengan benar bahwa seseorang akan membeli sepeda.
Dengan menjumlahkan nilai dalam sel yang berdekatan secara diagonal, Anda dapat menentukan akurasi keseluruhan model. Satu diagonal memberi tahu Anda jumlah total prediksi yang akurat, dan diagonal lainnya memberi tahu Anda jumlah total prediksi yang salah.
Menggunakan Beberapa Nilai yang Dapat Diprediksi
Kasus [Pembeli Sepeda] sangat mudah ditafsirkan karena hanya ada dua nilai yang mungkin. Ketika atribut yang dapat diprediksi memiliki beberapa nilai yang mungkin, matriks klasifikasi menambahkan kolom baru untuk setiap nilai aktual yang mungkin lalu menghitung jumlah kecocokan untuk setiap nilai yang diprediksi. Tabel berikut ini memperlihatkan hasil pada model yang berbeda, di mana tiga nilai (0, 1, 2) dimungkinkan.
Diperkirakan | 0 (Aktual) | 1 (Aktual) | 2 (Aktual) |
---|---|---|---|
0 | 111 | 3 | 5 |
1 | 2 | 123 | 17 |
2 | 19 | 0 | 20 |
Meskipun penambahan lebih banyak kolom membuat laporan terlihat lebih kompleks, detail tambahan bisa sangat berguna ketika Anda ingin menilai biaya kumulatif untuk membuat prediksi yang salah. Untuk membuat jumlah pada diagonal atau membandingkan hasil untuk kombinasi baris yang berbeda, Anda bisa mengklik tombol Salin yang disediakan di tab Matriks Klasifikasi dan menempelkan laporan ke Excel. Atau, Anda dapat menggunakan klien seperti Klien Penggalian Data untuk Excel, yang mendukung SQL Server 2005 (9.x) dan versi yang lebih baru, untuk membuat laporan klasifikasi langsung di Excel yang menyertakan hitungan dan persentase. Untuk informasi selengkapnya, lihat SQL Server Penggalian Data.
Pembatasan pada Matriks Klasifikasi
Matriks klasifikasi hanya dapat digunakan dengan atribut diskrit yang dapat diprediksi.
Meskipun Anda dapat menambahkan beberapa model saat memilih model pada tab Pilihan Input dari perancang Bagan Akurasi Penambangan , tab Matriks Klasifikasi akan menampilkan matriks terpisah untuk setiap model.
Konten terkait
Topik berikut berisi informasi selengkapnya tentang cara membuat dan menggunakan matriks klasifikasi dan bagan lainnya.
Topik | Tautan |
---|---|
Menjelaskan jenis bagan terkait. | Bagan Angkat (Analysis Services - Penggalian Data) Bagan Laba (Analysis Services - Penggalian Data) Plot Sebar (Analysis Services - Penggalian Data) |
Menjelaskan penggunaan validasi silang untuk model penambangan dan struktur penambangan. | Validasi Silang (Analysis Services - Penggalian Data) |
Menjelaskan langkah-langkah untuk membuat bagan angkat dan bagan akurasi lainnya. | Tugas dan Panduan Pengujian dan Validasi (Penggalian Data) |