Bagikan melalui


Pilih parameter untuk mengoptimalkan algoritma Anda di Azure Machine Learning Studio (klasik)

BERLAKU UNTUK:Berlaku untuk.Machine Learning Studio (klasik) Tidak berlaku untuk.Azure Machine Learning

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Topik ini menjelaskan cara memilih hyperparameter yang tepat yang ditetapkan untuk algoritma di Azure Machine Learning Studio (klasik). Sebagian besar algoritme pembelajaran mesin memiliki parameter yang sudah ditetapkan. Saat Anda melatih model, Anda perlu memberikan nilai untuk parameter tersebut. Kemanjuran model terlatih tergantung pada parameter model yang Anda pilih. Proses menemukan kumpulan parameter yang optimal dikenal sebagai pemilihan model.

Ada berbagai cara untuk melakukan pemilihan model. Dalam pembelajaran mesin, validasi silang adalah salah satu metode yang paling banyak digunakan untuk pemilihan model, dan merupakan mekanisme pemilihan model default di Azure Machine Learning Studio (klasik). Karena Azure Machine Learning Studio (klasik) mendukung R dan Python, Anda selalu dapat menerapkan mekanisme pemilihan model mereka sendiri dengan menggunakan R atau Python.

Ada empat langkah dalam proses menemukan set parameter terbaik:

  1. Tentukan ruang parameter: Untuk algoritma, pertama-tama tentukan nilai parameter tepat yang ingin Anda pertimbangkan.
  2. Tentukan pengaturan validasi silang: Tentukan cara memilih lipatan validasi silang untuk himpunan data.
  3. Tentukan metrik: Tentukan metrik apa yang digunakan untuk menentukan kumpulan parameter terbaik, seperti akurasi, kesalahan kuadrat rata-rata akar, presisi, pengenalan, atau skor-f.
  4. Melatih, mengevaluasi, dan membandingkan: Untuk setiap kombinasi nilai parameter yang unik, validasi silang dilakukan oleh dan berdasarkan metrik kesalahan yang Anda tentukan. Setelah evaluasi dan perbandingan, Anda dapat memilih model berkinerja terbaik.

Gambar berikut menggambarkan cara hal ini dapat dicapai di Azure Machine Learning Studio (klasik).

Cari kumpulan parameter terbaik

Tentukan ruang parameter

Anda dapat menentukan parameter yang ditetapkan pada langkah inisialisasi model. Panel parameter dari semua algoritme pembelajaran mesin memiliki dua mode pelatih: Parameter Tunggal dan Rentang Parameter. Pilih mode Rentang Parameter. Dalam mode Rentang Parameter, Anda dapat memasukkan beberapa nilai untuk setiap parameter. Anda dapat memasukkan nilai yang dipisahkan koma di kotak teks.

Pohon keputusan yang didorong dua kelas, parameter tunggal

Secara bergantian, Anda dapat menentukan titik grid maksimum dan minimum dan jumlah total poin yang akan dihasilkan dengan Gunakan Range Builder. Secara default, nilai parameter dihasilkan pada skala linier. Tetapi jika Log Scale dicentang, nilai dihasilkan dalam skala log (artinya, rasio titik yang berdekatan konstan, alih-alih perbedaannya). Untuk parameter bilangan bulat, Anda dapat menentukan rentang dengan menggunakan tanda hubung. Misalnya, "1-10" berarti bahwa semua bilangan bulat antara 1 dan 10 (keduanya inklusif) membentuk kumpulan parameter. Mode campuran juga didukung. Misalnya, parameter yang ditetapkan "1-10, 20, 50" akan mencakup bilangan bulat 1-10, 20, dan 50.

Pohon keputusan yang didorong dua kelas, parameter rentang

Tentukan lipatan validasi silang

Modul Partisi dan Sampel dapat digunakan untuk menetapkan lipatan ke data secara acak. Dalam konfigurasi sampel berikut untuk modul, kami mendefinisikan lima lipatan dan menetapkan nomor lipatan secara acak ke instans sampel.

Partisi dan Sampel

Tentukan metrik

Modul Tune Model Hyperparameters memberikan dukungan untuk memilih sekumpulan parameter terbaik untuk algoritma dan himpunan data tertentu secara empiris. Selain informasi lain mengenai pelatihan model, panel Properti modul ini menyertakan metrik untuk menentukan set parameter terbaik. Ini memiliki dua kotak daftar drop-down yang berbeda untuk algoritma klasifikasi dan regresi masing-masing. Jika algoritma yang sedang dipertimbangkan adalah algoritma klasifikasi, metrik regresi diabaikan dan sebaliknya. Dalam contoh khusus ini, metriknya adalah Akurasi.

Parameter sapuan

Melatih, mengevaluasi, dan membandingkan

Modul Tune Model Hyperparameters yang sama melatih semua model yang sesuai dengan set parameter, mengevaluasi berbagai metrik, lalu membuat model terlatih terbaik berdasarkan metrik yang Anda pilih. Modul ini memiliki dua input wajib:

  • Pelajar yang tidak terlatih
  • Himpunan data

Modul ini juga memiliki input himpunan data opsional. Sambungkan himpunan data dengan informasi lipat ke input set data wajib. Jika himpunan data tidak diberi informasi lipatan apa pun, maka validasi silang 10 kali lipat secara otomatis dijalankan secara default. Jika penetapan lipat tidak selesai dan himpunan data validasi disediakan di port himpunan data opsional, maka mode uji latihan dipilih dan himpunan data pertama digunakan untuk melatih model di setiap kombinasi parameter.

Penggolong pohon keputusan yang ditingkatkan

Model kemudian dievaluasi pada himpunan data validasi. Port output kiri modul menunjukkan metrik yang berbeda sebagai fungsi nilai parameter. Port output kanan memberikan model terlatih yang sesuai dengan model berkinerja terbaik sesuai dengan metrik yang dipilih (Akurasi dalam hal ini).

Himpunan data validasi

Anda dapat melihat parameter yang tepat yang dipilih dengan memvisualisasikan port output kanan. Model ini dapat digunakan dalam mencetak set pengujian atau dalam layanan web yang dioperasionalkan setelah disimpan sebagai model terlatih.