Latih model

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Melatih model klasifikasi atau regresi dengan cara yang diawasi

Kategori: Pembelajaran Mesin / Kereta Api

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Ringkasan Modul

Artikel ini menjelaskan cara menggunakan modul Train Model di Pembelajaran Mesin Studio (klasik) untuk melatih model klasifikasi atau regresi. Pelatihan berlangsung setelah Anda menentukan model dan mengatur parameternya, dan memerlukan data yang diberi tag. Anda juga dapat menggunakan Latih Model untuk melatih kembali model yang ada dengan data baru.

Cara kerja proses pelatihan

Dalam Pembelajaran Mesin, membuat dan menggunakan model pembelajaran mesin biasanya merupakan proses tiga langkah.

  1. Anda mengonfigurasi model, dengan memilih jenis algoritme tertentu, dan menentukan parameter atau hyperparameternya. Pilih salah satu jenis model berikut:

    • Model klasifikasi, berdasarkan jaringan saraf, pohon keputusan, dan hutan keputusan, dan algoritma lainnya.
    • Model regresi, yang dapat mencakup regresi linier standar, atau yang menggunakan algoritma lain, termasuk jaringan saraf dan regresi Baysian.
  2. Berikan kumpulan data yang diberi label, dan memiliki data yang kompatibel dengan algoritme. Sambungkan data dan model ke Model Kereta.

    Pelatihan apa yang dihasilkan adalah format biner tertentu, iLearner, yang merangkum pola statistik yang dipelajari dari data. Anda tidak dapat langsung mengubah atau membaca format ini; namun, modul lain di Studio (klasik) dapat menggunakan model terlatih ini.

    Anda juga dapat melihat properti model. Untuk informasi selengkapnya, lihat bagian Hasil .

  3. Setelah pelatihan selesai, gunakan model terlatih dengan salah satu modul penilaian, untuk membuat prediksi pada data baru.

Catatan

Tugas pembelajaran mesin khusus lainnya memerlukan metode pelatihan yang berbeda, dan Studio (klasik) menyediakan modul pelatihan terpisah untuk mereka. Misalnya, deteksi gambar, pengelompokan, dan detction anomali semuanya menggunakan metode pelatihan khusus. Model Kereta api dimaksudkan untuk digunakan dengan model regresi dan klasifikasi saja.

Pelatihan yang diawasi dan tidak diawasi

Anda mungkin pernah mendengar istilah-istilah yang diawasi atau pembelajaran tanpa pengawasan . Melatih model klasifikasi atau regresi dengan Train Model adalah contoh klasik dari pembelajaran mesin yang diawasi. Itu berarti Anda harus menyediakan dataset yang berisi data historis untuk mempelajari pola. Data harus berisi hasil (label) yang Anda coba prediksi, dan faktor terkait (variabel). Model pembelajaran mesin membutuhkan hasil untuk menentukan fitur yang paling memprediksi hasilnya.

Selama proses pelatihan, data diurutkan berdasarkan hasil dan algoritma mengekstrak pola statistik untuk membangun model.

Pembelajaran tanpa pengawasan menunjukkan bahwa hasilnya tidak diketahui, atau Anda memilih untuk tidak menggunakan label yang diketahui. Misalnya, algoritma pengelompokan biasanya menggunakan metode pembelajaran tanpa pengawasan, tetapi dapat menggunakan label jika tersedia. Contoh lain adalah pemodelan topik menggunakan LDA. Anda tidak dapat menggunakan Train Model dengan algoritma ini.

Tip

Baru mengenal pembelajaran mesin? Tutorial ini memandu Anda melalui proses mendapatkan data, mengonfigurasi algoritma, pelatihan, dan kemudian menggunakan model: Buat eksperimen pembelajaran mesin pertama Anda

Cara menggunakan Model Kereta Api

  1. Di Pembelajaran Mesin Studio (klasik), konfigurasikan model klasifikasi atau model model regresi.

    Anda juga dapat melatih model kustom yang dibuat dengan menggunakan Create R Model.

  2. Tambahkan modul Train Model ke eksperimen. Anda dapat menemukan modul ini pada kategori Pembelajaran Mesin. Perluas Train, lalu seret modul Train Model ke dalam eksperimen Anda.

  3. Di input kiri, pasang mode tidak terlatih. Lampirkan himpunan data pelatihan ke input kanan Latih Model.

    Himpunan data pelatihan harus berisi kolom label. Setiap baris tanpa label akan diabaikan.

  4. Untuk kolom Label, klik Luncurkan pemilih kolom, dan pilih satu kolom yang berisi hasil yang dapat digunakan model untuk pelatihan.

    • Untuk masalah klasifikasi, kolom label harus berisi nilai kategoris atau nilai diskrit. Beberapa contoh mungkin saja peringkat ya/tidak, kode atau nama klasifikasi penyakit, atau grup pendapatan. Jika Anda memilih kolom nonkategorikal, modul akan mengembalikan kesalahan selama pelatihan.

    • Untuk masalah regresi, kolom label harus berisi data numerik yang mewakili variabel respons. Idealnya data numerik mewakili skala kontinu.

    Contohnya mungkin skor risiko kredit, proyeksi waktu kegagalan hard drive, atau perkiraan jumlah panggilan ke pusat panggilan pada hari atau waktu tertentu. Jika Anda tidak memilih kolom numerik, Anda mungkin mendapatkan kesalahan.

    • Jika Anda tidak menentukan kolom label mana yang akan digunakan, Pembelajaran Mesin akan mencoba menyimpulkan mana kolom label yang sesuai, dengan menggunakan metadata himpunan data. Jika memilih kolom yang salah, gunakan pemilih kolom untuk memperbaikinya.

    Tip

    Jika Anda mengalami masalah dalam menggunakan Pemilih Kolom, lihat artikel Memilih Kolom dalam Himpunan Data untuk tips. Ini menjelaskan beberapa skenario dan kiat umum untuk menggunakan opsi DENGAN ATURAN dan MENURUT NAMA.

  5. Jalankan eksperimen. Jika Anda memiliki banyak data, ini bisa memakan waktu cukup lama.

Hasil

Setelah model dilatih:

  • Untuk melihat parameter model dan bobot fitur, klik kanan output dan pilih Visualisasikan.

  • Untuk menggunakan model dalam eksperimen lain, klik kanan model dan pilih Simpan Model. Ketik nama untuk model.

    Ini menyimpan model sebagai snapshot yang tidak diperbarui dengan menjalankan berulang percobaan.

  • Untuk menggunakan model dalam memprediksi nilai baru, hubungkan ke modul Model Skor, bersama dengan data input baru.

Jika Anda perlu melatih jenis model yang tidak didukung oleh Model Kereta Api, ada beberapa opsi:

  • Buat metode penilaian khusus menggunakan skrip R, atau gunakan salah satu dari banyak paket penilaian R yang tersedia.

  • Tulis skrip Python Anda sendiri untuk melatih dan mencetak model, atau gunakan pustaka Python yang ada:

  • Model deteksi anomali

  • Model rekomendasi

    • Jika model Anda menggunakan rekomendasi Matchbox yang disediakan dalam Pembelajaran Mesin, gunakan modul Train Matchbox Recommender.

    • Jika Anda menggunakan algoritma yang berbeda untuk analisis atau rekomendasi keranjang pasar, gunakan metode pelatihannya, dalam skrip R atau skrip Python.

  • Model pengelompokan

Contoh

Untuk contoh bagaimana modul Train Model digunakan dalam eksperimen pembelajaran mesin, lihat eksperimen ini di Azure AI Gallery:

Input yang diharapkan

Nama Jenis Deskripsi
Model tak terlatih Antarmuka ILearner Pelajar yang tidak terlatih
Himpunan Data Tabel Data Data pelatihan

Parameter modul

Nama Rentang Jenis Default Deskripsi
Kolom label apa pun Pilihan Kolom Memilih kolom yang berisi label atau kolom hasil

Output

Nama Jenis Deskripsi
Model terlatih Antarmuka ILearner Pembelajar terlatih

Pengecualian

Untuk daftar semua kesalahan modul, lihat Kode Kesalahan Modul.

Pengecualian Deskripsi
Kesalahan 0032 Pengecualian terjadi jika argumen bukan sebuah angka.
Kesalahan 0033 Pengecualian terjadi jika argumen adalah Tidak terbatas.
Kesalahan 0083 Pengecualian terjadi jika himpunan data yang digunakan untuk pelatihan tidak dapat digunakan untuk jenis pembelajar yang konkret.
Kesalahan 0035 Pengecualian terjadi jika tidak ada fitur yang disediakan untuk pengguna atau item yang diberikan.
Kesalahan 0003 Pengecualian terjadi jika satu atau beberapa input null atau kosong.
Kesalahan 0020 Pengecualian terjadi jika jumlah kolom di beberapa himpunan data yang diteruskan ke modul terlalu kecil.
Kesalahan 0021 Pengecualian terjadi jika jumlah kolom di beberapa himpunan data yang diteruskan ke modul terlalu kecil.
Kesalahan 0013 Pengecualian terjadi jika diteruskan ke pelajar modul memiliki tipe tidak valid.

Lihat juga

Evaluasi Model
Daftar Modul A-Z