Pembelajaran Mesin - Kereta Api
Penting
Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.
Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.
- Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
- Mer informasjon tentang Azure Machine Learning.
ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.
Artikel ini menjelaskan modul yang disediakan di Pembelajaran Mesin Studio (klasik) untuk melatih model pembelajaran mesin. Pelatihan adalah proses menganalisis data input dengan menggunakan parameter model yang telah ditentukan. Dari analisis ini, model mempelajari pola, dan menyimpannya dalam bentuk model terlatih.
Catatan
Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja
Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.
Artikel ini juga menjelaskan keseluruhan proses di Pembelajaran Mesin Studio (klasik) untuk pembuatan model, pelatihan, evaluasi, dan penilaian.
Membuat dan menggunakan model pembelajaran mesin
Alur kerja khas untuk pembelajaran mesin mencakup fase-fase ini:
- Memilih algoritma yang sesuai, dan mengatur opsi awal.
- Melatih model pada data yang kompatibel.
- Membuat prediksi dengan menggunakan data baru, berdasarkan pola dalam model.
- Mengevaluasi model untuk menentukan apakah prediksi akurat, berapa banyak kesalahan yang ada, dan jika ada overfitting.
Pembelajaran Mesin Studio (klasik) mendukung kerangka kerja yang fleksibel dan dapat disesuaikan untuk pembelajaran mesin. Setiap tugas dalam proses ini dilakukan oleh jenis modul tertentu, yang dapat dimodifikasi, ditambahkan, atau dihapus, tanpa merusak sisa eksperimen Anda.
Modul dalam kategori ini mendukung pelatihan untuk berbagai jenis model. Selama pelatihan, data dianalisis oleh algoritma pembelajaran mesin. Algoritma ini menganalisis distribusi dan jenis data, mengkompilasi statistik, dan menciptakan pola yang dapat digunakan nanti untuk prediksi.
Lebih lanjut tentang pelatihan model
Saat Pembelajaran Mesin melatih model, baris dengan nilai yang hilang dilewati. Oleh karena itu, jika Anda ingin memperbaiki nilai secara manual, menggunakan imputasi, atau menentukan metode lain untuk menangani nilai yang hilang, gunakan modul Bersihkan Data yang Hilang sebelum pelatihan pada himpunan data.
Sebaiknya gunakan modul Edit Metadata untuk memperbaiki masalah lain dengan data. Anda mungkin perlu menandai kolom label, mengubah tipe data, atau mengoreksi nama kolom.
Untuk tugas pembersihan data umum lainnya, seperti normalisasi, pengambilan sampel, binning, dan penskalaan, lihat kategori Transformasi Data .
Pilih pelatih yang tepat
Metode yang Anda gunakan untuk melatih model tergantung pada jenis model yang Anda buat, dan jenis data yang dibutuhkan model. Misalnya, Pembelajaran Mesin menyediakan modul khusus untuk melatih model deteksi anomali, model rekomendasi, dan banyak lagi.
Periksa daftar modul pelatihan untuk menentukan mana yang benar untuk skenario Anda.
Jika Anda tidak yakin dengan parameter terbaik untuk digunakan saat melatih model, gunakan salah satu modul yang disediakan untuk penyapuan dan validasi parameter:
Tune Model Hyperparameters dapat melakukan sapuan parameter pada hampir semua model klasifikasi dan regresi. Ini melatih beberapa model, dan kemudian mengembalikan model terbaik.
Modul Sweep Clustering mendukung penyetelan model selama proses pelatihan, dan dimaksudkan untuk digunakan hanya dengan model pengelompokan. Anda dapat menentukan rentang sentroid, dan melatih data sambil secara otomatis mendeteksi parameter terbaik.
Modul Model Cross-Validate juga berguna untuk pengoptimalan model, tetapi tidak mengembalikan model terlatih. Sebaliknya, ini menyediakan metrik yang dapat Anda gunakan untuk menentukan model terbaik.
Melatih kembali model
Jika Anda perlu melatih kembali model produksi, Anda dapat menjalankan kembali eksperimen kapan saja.
Anda juga dapat mengotomatiskan proses pelatihan ulang dengan menggunakan layanan web. Untuk panduan, lihat Melatih ulang dan memperbarui model Pembelajaran Mesin dengan Azure Data Factory.
Gunakan model yang telah dilatih sebelumnya
Pembelajaran Mesin mencakup beberapa model yang telah dilatih sebelumnya, seperti modul Klasifikasi Gambar Kaskade Pretrained. Anda dapat menggunakan model ini untuk penilaian tanpa input data tambahan.
Selain itu, beberapa modul (seperti Deteksi Anomali Deret Waktu) tidak menghasilkan model terlatih dalam format iLearner. Tetapi mereka mengambil data pelatihan dan membuat model secara internal, yang kemudian dapat digunakan untuk membuat prediksi. Untuk menggunakan ini, Anda cukup mengonfigurasi parameter dan memberikan data.
Menyimpan snapshot dari model terlatih
Jika Anda ingin menyimpan atau mengekspor model, klik kanan modul pelatihan, dan pilih Simpan sebagai Model Terlatih. Model ini diekspor ke format iLearner dan disimpan di ruang kerja Anda, di bawah Model Terlatih. Model terlatih dapat digunakan kembali dalam eksperimen lain, atau terhubung ke modul lain untuk penilaian.
Anda juga dapat menggunakan modul Load Trained Model dalam percobaan untuk mengambil model yang disimpan.
Daftar modul
Kategori Train mencakup modul-modul ini:
- Sweep Clustering: Melakukan sapuan parameter pada model pengelompokan untuk menentukan pengaturan parameter optimal, dan melatih model terbaik.
- Melatih Model Deteksi Anomali: Melatih model detektor anomali dan memberi label data dari kumpulan pelatihan.
- Model Pengelompokan Kereta: Melatih model pengelompokan dan menetapkan data dari pelatihan yang ditetapkan ke kluster.
- Train Matchbox Recommender: Melatih rekomendasi Bayesian dengan menggunakan algoritma Matchbox.
- Model Kereta: Melatih model klasifikasi atau regresi dari satu set pelatihan.
- Tune Model Hyperparameters: Melakukan sapuan parameter pada model regresi atau klasifikasi untuk menentukan pengaturan parameter optimal, dan melatih model terbaik.
Tugas terkait
Beberapa modul tidak termasuk dalam kategori ini, karena memerlukan format khusus atau disesuaikan untuk tugas tertentu:
- Melatih Model Deteksi Anomali
- Latih Vowpal Wabbit Versi 7-4
- Latih Vowpal Wabbit Versi 7-10
- Latih Vowpal Wabbit Versi 8
- Alokasi Latent Dirichlet