Latih model
Penting
Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.
Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.
- Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
- Mer informasjon tentang Azure Machine Learning.
ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.
Melatih model klasifikasi atau regresi dengan cara yang diawasi
Kategori: Pembelajaran Mesin / Kereta Api
Catatan
Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja
Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.
Ringkasan Modul
Artikel ini menjelaskan cara menggunakan modul Train Model di Pembelajaran Mesin Studio (klasik) untuk melatih model klasifikasi atau regresi. Pelatihan berlangsung setelah Anda menentukan model dan mengatur parameternya, dan memerlukan data yang diberi tag. Anda juga dapat menggunakan Latih Model untuk melatih kembali model yang ada dengan data baru.
Cara kerja proses pelatihan
Dalam Pembelajaran Mesin, membuat dan menggunakan model pembelajaran mesin biasanya merupakan proses tiga langkah.
Anda mengonfigurasi model, dengan memilih jenis algoritme tertentu, dan menentukan parameter atau hyperparameternya. Pilih salah satu jenis model berikut:
- Model klasifikasi, berdasarkan jaringan saraf, pohon keputusan, dan hutan keputusan, dan algoritma lainnya.
- Model regresi, yang dapat mencakup regresi linier standar, atau yang menggunakan algoritma lain, termasuk jaringan saraf dan regresi Baysian.
Berikan kumpulan data yang diberi label, dan memiliki data yang kompatibel dengan algoritme. Sambungkan data dan model ke Model Kereta.
Pelatihan apa yang dihasilkan adalah format biner tertentu, iLearner, yang merangkum pola statistik yang dipelajari dari data. Anda tidak dapat langsung mengubah atau membaca format ini; namun, modul lain di Studio (klasik) dapat menggunakan model terlatih ini.
Anda juga dapat melihat properti model. Untuk informasi selengkapnya, lihat bagian Hasil .
Setelah pelatihan selesai, gunakan model terlatih dengan salah satu modul penilaian, untuk membuat prediksi pada data baru.
Catatan
Tugas pembelajaran mesin khusus lainnya memerlukan metode pelatihan yang berbeda, dan Studio (klasik) menyediakan modul pelatihan terpisah untuk mereka. Misalnya, deteksi gambar, pengelompokan, dan detction anomali semuanya menggunakan metode pelatihan khusus. Model Kereta api dimaksudkan untuk digunakan dengan model regresi dan klasifikasi saja.
Pelatihan yang diawasi dan tidak diawasi
Anda mungkin pernah mendengar istilah-istilah yang diawasi atau pembelajaran tanpa pengawasan . Melatih model klasifikasi atau regresi dengan Train Model adalah contoh klasik dari pembelajaran mesin yang diawasi. Itu berarti Anda harus menyediakan dataset yang berisi data historis untuk mempelajari pola. Data harus berisi hasil (label) yang Anda coba prediksi, dan faktor terkait (variabel). Model pembelajaran mesin membutuhkan hasil untuk menentukan fitur yang paling memprediksi hasilnya.
Selama proses pelatihan, data diurutkan berdasarkan hasil dan algoritma mengekstrak pola statistik untuk membangun model.
Pembelajaran tanpa pengawasan menunjukkan bahwa hasilnya tidak diketahui, atau Anda memilih untuk tidak menggunakan label yang diketahui. Misalnya, algoritma pengelompokan biasanya menggunakan metode pembelajaran tanpa pengawasan, tetapi dapat menggunakan label jika tersedia. Contoh lain adalah pemodelan topik menggunakan LDA. Anda tidak dapat menggunakan Train Model dengan algoritma ini.
Tip
Baru mengenal pembelajaran mesin? Tutorial ini memandu Anda melalui proses mendapatkan data, mengonfigurasi algoritma, pelatihan, dan kemudian menggunakan model: Buat eksperimen pembelajaran mesin pertama Anda
Cara menggunakan Model Kereta Api
Di Pembelajaran Mesin Studio (klasik), konfigurasikan model klasifikasi atau model model regresi.
Anda juga dapat melatih model kustom yang dibuat dengan menggunakan Create R Model.
Tambahkan modul Train Model ke eksperimen. Anda dapat menemukan modul ini pada kategori Pembelajaran Mesin. Perluas Train, lalu seret modul Train Model ke dalam eksperimen Anda.
Di input kiri, pasang mode tidak terlatih. Lampirkan himpunan data pelatihan ke input kanan Latih Model.
Himpunan data pelatihan harus berisi kolom label. Setiap baris tanpa label akan diabaikan.
Untuk kolom Label, klik Luncurkan pemilih kolom, dan pilih satu kolom yang berisi hasil yang dapat digunakan model untuk pelatihan.
Untuk masalah klasifikasi, kolom label harus berisi nilai kategoris atau nilai diskrit. Beberapa contoh mungkin saja peringkat ya/tidak, kode atau nama klasifikasi penyakit, atau grup pendapatan. Jika Anda memilih kolom nonkategorikal, modul akan mengembalikan kesalahan selama pelatihan.
Untuk masalah regresi, kolom label harus berisi data numerik yang mewakili variabel respons. Idealnya data numerik mewakili skala kontinu.
Contohnya mungkin skor risiko kredit, proyeksi waktu kegagalan hard drive, atau perkiraan jumlah panggilan ke pusat panggilan pada hari atau waktu tertentu. Jika Anda tidak memilih kolom numerik, Anda mungkin mendapatkan kesalahan.
- Jika Anda tidak menentukan kolom label mana yang akan digunakan, Pembelajaran Mesin akan mencoba menyimpulkan mana kolom label yang sesuai, dengan menggunakan metadata himpunan data. Jika memilih kolom yang salah, gunakan pemilih kolom untuk memperbaikinya.
Tip
Jika Anda mengalami masalah dalam menggunakan Pemilih Kolom, lihat artikel Memilih Kolom dalam Himpunan Data untuk tips. Ini menjelaskan beberapa skenario dan kiat umum untuk menggunakan opsi DENGAN ATURAN dan MENURUT NAMA.
Jalankan eksperimen. Jika Anda memiliki banyak data, ini bisa memakan waktu cukup lama.
Hasil
Setelah model dilatih:
Untuk melihat parameter model dan bobot fitur, klik kanan output dan pilih Visualisasikan.
Untuk menggunakan model dalam eksperimen lain, klik kanan model dan pilih Simpan Model. Ketik nama untuk model.
Ini menyimpan model sebagai snapshot yang tidak diperbarui dengan menjalankan berulang percobaan.
Untuk menggunakan model dalam memprediksi nilai baru, hubungkan ke modul Model Skor, bersama dengan data input baru.
Tugas terkait
Jika Anda perlu melatih jenis model yang tidak didukung oleh Model Kereta Api, ada beberapa opsi:
Buat metode penilaian khusus menggunakan skrip R, atau gunakan salah satu dari banyak paket penilaian R yang tersedia.
Tulis skrip Python Anda sendiri untuk melatih dan mencetak model, atau gunakan pustaka Python yang ada:
Model deteksi anomali
- Train Anomaly Detection Model mendukung modul deteksi anomali di Studio (klasik).
Model rekomendasi
Jika model Anda menggunakan rekomendasi Matchbox yang disediakan dalam Pembelajaran Mesin, gunakan modul Train Matchbox Recommender.
Jika Anda menggunakan algoritma yang berbeda untuk analisis atau rekomendasi keranjang pasar, gunakan metode pelatihannya, dalam skrip R atau skrip Python.
Model pengelompokan
Gunakan Train Clustering Model untuk algoritma K-means yang disertakan.
Untuk model pengelompokan lainnya, gunakan skrip R atau modul skrip Python untuk mengonfigurasi dan melatih model.
Contoh
Untuk contoh bagaimana modul Train Model digunakan dalam eksperimen pembelajaran mesin, lihat eksperimen ini di Azure AI Gallery:
- Peramalan Ritel: Menunjukkan cara membangun, melatih, dan membandingkan beberapa model.
- Prediksi Penundaan Penerbangan: Menunjukkan cara melatih beberapa model klasifikasi terkait.
Input yang diharapkan
Nama | Jenis | Deskripsi |
---|---|---|
Model tak terlatih | Antarmuka ILearner | Pelajar yang tidak terlatih |
Himpunan Data | Tabel Data | Data pelatihan |
Parameter modul
Nama | Rentang | Jenis | Default | Deskripsi |
---|---|---|---|---|
Kolom label | apa pun | Pilihan Kolom | Memilih kolom yang berisi label atau kolom hasil |
Output
Nama | Jenis | Deskripsi |
---|---|---|
Model terlatih | Antarmuka ILearner | Pembelajar terlatih |
Pengecualian
Untuk daftar semua kesalahan modul, lihat Kode Kesalahan Modul.
Pengecualian | Deskripsi |
---|---|
Kesalahan 0032 | Pengecualian terjadi jika argumen bukan sebuah angka. |
Kesalahan 0033 | Pengecualian terjadi jika argumen adalah Tidak terbatas. |
Kesalahan 0083 | Pengecualian terjadi jika himpunan data yang digunakan untuk pelatihan tidak dapat digunakan untuk jenis pembelajar yang konkret. |
Kesalahan 0035 | Pengecualian terjadi jika tidak ada fitur yang disediakan untuk pengguna atau item yang diberikan. |
Kesalahan 0003 | Pengecualian terjadi jika satu atau beberapa input null atau kosong. |
Kesalahan 0020 | Pengecualian terjadi jika jumlah kolom di beberapa himpunan data yang diteruskan ke modul terlalu kecil. |
Kesalahan 0021 | Pengecualian terjadi jika jumlah kolom di beberapa himpunan data yang diteruskan ke modul terlalu kecil. |
Kesalahan 0013 | Pengecualian terjadi jika diteruskan ke pelajar modul memiliki tipe tidak valid. |