Mengevaluasi kinerja model di Azure Machine Learning Studio (klasik)

Artikel
20/03/2017

BERLAKU UNTUK: Berlaku untuk. Machine Learning Studio (klasik) Tidak berlaku untuk. Azure Machine Learning

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
Pelajari lebih lanjut tentang Azure Machine Learning

Dokumentasi ML Studio (klasik) akan dihentikan dan mungkin tidak akan diperbarui di masa mendatang.

Dalam artikel ini, Anda dapat mempelajari metrik yang dapat Anda gunakan untuk memantau performa model di Azure Machine Learning Studio (klasik). Mengevaluasi performa model adalah salah satu tahap inti dalam proses ilmu data. Ini menunjukkan seberapa sukses penilaian (prediksi) himpunan data yang telah dilakukan oleh model yang terlatih. Azure Machine Learning Studio (klasik) mendukung evaluasi model melalui dua modul pembelajaran mesin utamanya:

Modul ini memungkinkan Anda untuk melihat performa model Anda dalam hal jumlah metrik yang umumnya digunakan dalam statistik dan pembelajaran mesin.

Mengevaluasi model harus dipertimbangkan bersama dengan:

Tiga skenario pembelajaran umum yang diawasi ditampilkan:

regresi
klasifikasi biner
klasifikasi multikelas

Evaluasi vs. Validasi Silang

Evaluasi dan validasi silang adalah cara standar untuk mengukur performa model Anda. Keduanya menghasilkan metrik evaluasi yang dapat Anda periksa atau bandingkan dengan model lain.

Evaluasi Model memperkirakan himpunan data yang dinilai sebagai input (atau dua jika Anda ingin membandingkan performa dua model yang berbeda). Oleh karena itu, Anda perlu melatih model Anda menggunakan modul Model Latihan dan membuat prediksi pada beberapa set data menggunakan modul Model Penilaian sebelum Anda dapat mengevaluasi hasilnya. Evaluasi didasarkan pada label/probabilitas yang dinilai bersama dengan label yang sebenarnya, yang semuanya dihasilkan oleh modul Model Penilaian.

Atau, Anda dapat menggunakan validasi silang untuk melakukan sejumlah operasi evaluasi penilaian latihan (10 kali lipat) secara otomatis pada subset data input yang berbeda. Data input dibagi menjadi 10 bagian, di mana satu dikhususkan untuk pengujian, dan 9 lainnya untuk pelatihan. Proses ini diulang 10 kali dan metrik evaluasi dirata-ratakan. Ini membantu dalam menentukan seberapa baik model akan digeneralisasi ke himpunan data baru. Modul Model Validasi Silang mengambil model yang tidak terlatih dan beberapa himpunan data berlabel, dan mengeluarkan hasil evaluasi dari masing-masing sebanyak 10 kali, selain hasil rata-rata.

Di bagian berikut, kita akan membangun model regresi dan klasifikasi sederhana dan mengevaluasi performanya, menggunakan Model Evaluasi dan modul Model Validasi Silang.

Mengevaluasi Model Regresi

Asumsikan kita ingin memprediksi harga mobil menggunakan fitur seperti dimensi, tenaga kuda, spesifikasi mesin, dan sebagainya. Ini adalah masalah regresi khas, di mana (harga) variabel target adalah nilai numerik berkelanjutan. Kita dapat menyesuaikan model regresi linier yang, mengingat nilai fitur mobil tertentu, dapat memprediksi harga mobil itu. Model regresi ini dapat digunakan untuk menilai himpunan data yang sama dengan yang kita latih. Setelah memiliki harga mobil yang diprediksi, kita dapat mengevaluasi performa model dengan melihat berapa banyak prediksi menyimpang dari harga aktual rata-rata. Untuk mengilustrasikan ini, kita menggunakan Himpunan data harga mobil (Mentah) yang tersedia di bagian Himpunan Data Tersimpan di Azure Machine Learning Studio (klasik).

Membuat Eksperimen

Tambahkan modul berikut ke ruang kerja Anda di Azure Machine Learning Studio (klasik):

Sambungkan port seperti yang ditunjukkan di bawah ini di Gambar 1 dan atur kolom Label modul Train Model ke harga.

Mengevaluasi Model Regresi

Gambar 1. Mengevaluasi Model Regresi.

Memeriksa Hasil Evaluasi

Setelah menjalankan eksperimen, Anda dapat mengklik port output modul Evaluasi Model dan pilih Visualisasi untuk melihat hasil evaluasi. Metrik evaluasi yang tersedia untuk model regresi adalah: Kesalahan Absolut Rata-Rata, Kesalahan Absolut Rata-Rata Akar, Kesalahan Absolut Relatif, Kesalahan Kuadrat Relatif, dan Koefisien Penentuan.

Istilah "kesalahan" di sini menunjukkan perbedaan antara nilai yang diprediksi dan nilai sebenarnya. Nilai absolut atau kuadrat dari perbedaan ini biasanya dihitung untuk menangkap total besarnya kesalahan di semua instans, karena perbedaan antara nilai yang diprediksi dan benar bisa negatif dalam beberapa kasus. Metrik kesalahan mengukur performa prediktif model regresi dalam hal simpangan rata-rata prediksinya dari nilai sebenarnya. Nilai kesalahan yang lebih rendah berarti model lebih akurat dalam membuat prediksi. Metrik kesalahan keseluruhan dari nol berarti model tersebut sangat cocok dengan data.

Koefisien penentuan, yang juga dikenal sebagai R kuadrat, juga merupakan cara standar untuk mengukur seberapa baik model sesuai dengan data. Ini dapat diartikan sebagai proporsi variasi yang dijelaskan oleh model. Proporsi yang lebih tinggi lebih baik dalam hal ini, di mana 1 menunjukkan kecocokan yang sempurna.

Metrik Regresi Linier untuk Evaluasi

Gambar 2. Metrik Evaluasi Regresi Linier.

Menggunakan Validasi Silang

Seperti disebutkan sebelumnya, Anda dapat melakukan pelatihan, penilaian, dan evaluasi berulang secara otomatis menggunakan modul Model Validasi Silang. Yang Anda butuhkan dalam hal ini adalah himpunan data, model yang tidak terlatih, dan modul Model Validasi Silang (lihat gambar di bawah). Anda perlu mengatur kolom label ke harga di properti modul Model Validasi Silang.

Validasi Silang Model Regresi

Gambar 3. Memvalidasi Silang Model Regresi.

Setelah menjalankan eksperimen, Anda dapat memeriksa hasil evaluasi dengan mengklik port output yang tepat dari modul Model Validasi Silang. Ini akan memberikan tampilan terperinci dari metrik untuk setiap perulangan (kali), dan hasil rata-rata masing-masing metrik (Gambar 4).

Hasil Validasi Silang Model Regresi

Gambar 4. Hasil Validasi Silang Model Regresi.

Mengevaluasi Model Klasifikasi Biner

Dalam skenario klasifikasi biner, variabel target hanya memiliki dua kemungkinan hasil, misalnya: {0, 1} atau {false, true}, {negative, positive}. Asumsikan Anda diberi himpunan data karyawan dewasa dengan beberapa variabel demografis dan pekerjaan, dan Anda diminta untuk memprediksi tingkat pendapatan, variabel biner dengan nilai {"<=50 K", ">50 K"}. Dengan kata lain, kelas negatif mewakili karyawan yang menghasilkan kurang dari atau sama dengan 50 K per tahun, dan kelas positif mewakili semua karyawan lainnya. Seperti dalam skenario regresi, kita akan melatih model, menilai beberapa data, dan mengevaluasi hasilnya. Perbedaan utama di sini adalah pilihan metrik yang dihitung dan dihasilkan oleh Azure Machine Learning Studio (klasik). Untuk mengilustrasikan skenario prediksi tingkat pendapatan, kita akan menggunakan himpunan data Dewasa untuk membuat eksperimen Studio (klasik) dan mengevaluasi performa model regresi logistik dua kelas, pengklasifikasi biner yang umum digunakan.