Bagikan melalui


Pembelajaran Mesin - Kereta Api

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Artikel ini menjelaskan modul yang disediakan di Pembelajaran Mesin Studio (klasik) untuk melatih model pembelajaran mesin. Pelatihan adalah proses menganalisis data input dengan menggunakan parameter model yang telah ditentukan. Dari analisis ini, model mempelajari pola, dan menyimpannya dalam bentuk model terlatih.

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Artikel ini juga menjelaskan keseluruhan proses di Pembelajaran Mesin Studio (klasik) untuk pembuatan model, pelatihan, evaluasi, dan penilaian.

Membuat dan menggunakan model pembelajaran mesin

Alur kerja khas untuk pembelajaran mesin mencakup fase-fase ini:

  • Memilih algoritma yang sesuai, dan mengatur opsi awal.
  • Melatih model pada data yang kompatibel.
  • Membuat prediksi dengan menggunakan data baru, berdasarkan pola dalam model.
  • Mengevaluasi model untuk menentukan apakah prediksi akurat, berapa banyak kesalahan yang ada, dan jika ada overfitting.

Pembelajaran Mesin Studio (klasik) mendukung kerangka kerja yang fleksibel dan dapat disesuaikan untuk pembelajaran mesin. Setiap tugas dalam proses ini dilakukan oleh jenis modul tertentu, yang dapat dimodifikasi, ditambahkan, atau dihapus, tanpa merusak sisa eksperimen Anda.

Modul dalam kategori ini mendukung pelatihan untuk berbagai jenis model. Selama pelatihan, data dianalisis oleh algoritma pembelajaran mesin. Algoritma ini menganalisis distribusi dan jenis data, mengkompilasi statistik, dan menciptakan pola yang dapat digunakan nanti untuk prediksi.

Lebih lanjut tentang pelatihan model

Saat Pembelajaran Mesin melatih model, baris dengan nilai yang hilang dilewati. Oleh karena itu, jika Anda ingin memperbaiki nilai secara manual, menggunakan imputasi, atau menentukan metode lain untuk menangani nilai yang hilang, gunakan modul Bersihkan Data yang Hilang sebelum pelatihan pada himpunan data.

Sebaiknya gunakan modul Edit Metadata untuk memperbaiki masalah lain dengan data. Anda mungkin perlu menandai kolom label, mengubah tipe data, atau mengoreksi nama kolom.

Untuk tugas pembersihan data umum lainnya, seperti normalisasi, pengambilan sampel, binning, dan penskalaan, lihat kategori Transformasi Data .

Pilih pelatih yang tepat

Metode yang Anda gunakan untuk melatih model tergantung pada jenis model yang Anda buat, dan jenis data yang dibutuhkan model. Misalnya, Pembelajaran Mesin menyediakan modul khusus untuk melatih model deteksi anomali, model rekomendasi, dan banyak lagi.

Periksa daftar modul pelatihan untuk menentukan mana yang benar untuk skenario Anda.

Jika Anda tidak yakin dengan parameter terbaik untuk digunakan saat melatih model, gunakan salah satu modul yang disediakan untuk penyapuan dan validasi parameter:

  • Tune Model Hyperparameters dapat melakukan sapuan parameter pada hampir semua model klasifikasi dan regresi. Ini melatih beberapa model, dan kemudian mengembalikan model terbaik.

  • Modul Sweep Clustering mendukung penyetelan model selama proses pelatihan, dan dimaksudkan untuk digunakan hanya dengan model pengelompokan. Anda dapat menentukan rentang sentroid, dan melatih data sambil secara otomatis mendeteksi parameter terbaik.

  • Modul Model Cross-Validate juga berguna untuk pengoptimalan model, tetapi tidak mengembalikan model terlatih. Sebaliknya, ini menyediakan metrik yang dapat Anda gunakan untuk menentukan model terbaik.

Melatih kembali model

Jika Anda perlu melatih kembali model produksi, Anda dapat menjalankan kembali eksperimen kapan saja.

Anda juga dapat mengotomatiskan proses pelatihan ulang dengan menggunakan layanan web. Untuk panduan, lihat Melatih ulang dan memperbarui model Pembelajaran Mesin dengan Azure Data Factory.

Gunakan model yang telah dilatih sebelumnya

Pembelajaran Mesin mencakup beberapa model yang telah dilatih sebelumnya, seperti modul Klasifikasi Gambar Kaskade Pretrained. Anda dapat menggunakan model ini untuk penilaian tanpa input data tambahan.

Selain itu, beberapa modul (seperti Deteksi Anomali Deret Waktu) tidak menghasilkan model terlatih dalam format iLearner. Tetapi mereka mengambil data pelatihan dan membuat model secara internal, yang kemudian dapat digunakan untuk membuat prediksi. Untuk menggunakan ini, Anda cukup mengonfigurasi parameter dan memberikan data.

Menyimpan snapshot dari model terlatih

Jika Anda ingin menyimpan atau mengekspor model, klik kanan modul pelatihan, dan pilih Simpan sebagai Model Terlatih. Model ini diekspor ke format iLearner dan disimpan di ruang kerja Anda, di bawah Model Terlatih. Model terlatih dapat digunakan kembali dalam eksperimen lain, atau terhubung ke modul lain untuk penilaian.

Anda juga dapat menggunakan modul Load Trained Model dalam percobaan untuk mengambil model yang disimpan.

Daftar modul

Kategori Train mencakup modul-modul ini:

  • Sweep Clustering: Melakukan sapuan parameter pada model pengelompokan untuk menentukan pengaturan parameter optimal, dan melatih model terbaik.
  • Melatih Model Deteksi Anomali: Melatih model detektor anomali dan memberi label data dari kumpulan pelatihan.
  • Model Pengelompokan Kereta: Melatih model pengelompokan dan menetapkan data dari pelatihan yang ditetapkan ke kluster.
  • Train Matchbox Recommender: Melatih rekomendasi Bayesian dengan menggunakan algoritma Matchbox.
  • Model Kereta: Melatih model klasifikasi atau regresi dari satu set pelatihan.
  • Tune Model Hyperparameters: Melakukan sapuan parameter pada model regresi atau klasifikasi untuk menentukan pengaturan parameter optimal, dan melatih model terbaik.

Beberapa modul tidak termasuk dalam kategori ini, karena memerlukan format khusus atau disesuaikan untuk tugas tertentu:

Lihat juga