Modul pembelajaran mesin dalam modul ML Studio (klasik)
Penting
Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.
Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.
- Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
- Mer informasjon tentang Azure Machine Learning.
ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.
Alur kerja khas untuk pembelajaran mesin mencakup banyak fase:
Mengidentifikasi masalah yang harus dipecahkan dan metrik untuk mengukur hasil.
Menemukan, membersihkan, dan menyiapkan data yang sesuai.
Mengidentifikasi fitur terbaik dan merekayasa fitur baru.
Membangun, mengevaluasi, dan menyetel model.
Menggunakan model untuk menghasilkan prediksi, rekomendasi, dan hasil lainnya.
Modul di bagian ini menyediakan alat untuk tahap akhir pembelajaran mesin, di mana Anda menerapkan algoritma ke data untuk melatih model. Pada fase akhir ini, Anda juga menghasilkan skor, dan kemudian mengevaluasi keakuratan dan kegunaan model.
Catatan
Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja
Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.
Daftar tugas pembelajaran mesin berdasarkan kategori
-
Pilih dari berbagai algoritma pembelajaran mesin yang dapat disesuaikan, termasuk pengelompokan, regresi, klasifikasi, dan model deteksi anomali .
-
Berikan data Anda ke model yang dikonfigurasi untuk belajar dari pola dan membuat statistik yang dapat digunakan untuk prediksi.
-
Buat prediksi menggunakan model terlatih.
-
Ukur keakuratan model terlatih, atau bandingkan beberapa model.
Untuk deskripsi terperinci tentang alur kerja eksperimental ini, lihat panduan solusi risiko kredit.
Prasyarat
Sebelum Anda bisa sampai ke bagian yang menyenangkan dari membangun model, biasanya banyak persiapan diperlukan. Bagian ini menyediakan tautan ke alat di Pembelajaran Mesin Studio (klasik) yang dapat membantu Anda membersihkan data, meningkatkan kualitas input, dan mencegah kesalahan run-time.
Eksplorasi data dan kualitas data
Pastikan bahwa data Anda adalah jenis data yang tepat, kuantitas yang tepat, dan kualitas yang tepat untuk algoritma yang Anda pilih. Pahami berapa banyak data yang Anda miliki, dan bagaimana data tersebut didistribusikan. Apakah ada outlier? Bagaimana mereka dihasilkan, dan apa artinya? Apakah ada catatan duplikat?
Menangani nilai yang hilang
Nilai yang hilang dapat memengaruhi hasil Anda dalam banyak hal. Misalnya, hampir semua metode statistik membuang kasus dengan nilai yang hilang. Secara default, Pembelajaran Mesin mengikuti aturan ini ketika menemukan baris dengan nilai yang hilang:
Jika data yang digunakan untuk melatih model memiliki nilai yang hilang, baris apa pun dengan nilai yang hilang akan dilewati.
Jika data yang digunakan sebagai input saat mencetak nilai terhadap model memiliki nilai yang hilang, nilai yang hilang digunakan sebagai input, tetapi null disebarkan. Ini biasanya berarti bahwa null dimasukkan dalam hasil, bukan prediksi yang valid.
Pastikan untuk memeriksa data Anda sebelum melatih model Anda. Untuk menyiratkan nilai yang hilang atau memperbaiki data Anda, gunakan modul ini:
Pilih fitur dan kurangi dimensi
Pembelajaran Mesin Studio (klasik) dapat membantu Anda menyaring data Anda untuk menemukan atribut yang paling berguna.
Gunakan alat seperti Fisher Linear Discriminant Analysis atau Filter Based Feature Selection untuk menentukan kolom data mana yang memiliki daya prediksi paling besar. Alat-alat ini juga dapat mengidentifikasi kolom yang harus dihapus karena kebocoran data.
Buat atau rekayasa fitur dari data yang ada. Menormalkan data atau mengelompokkan data ke dalam tempat sampah untuk membuat pengelompokan data baru, atau menstandarisasi rentang nilai numerik sebelum analisis.
Kurangi dimensi dengan mengelompokkan nilai kategoris, dengan menggunakan analisis komponen utama, atau dengan pengambilan sampel.
Contoh
Untuk contoh pembelajaran mesin yang sedang beraksi, lihat Galeri AI Azure.
Untuk tips, dan panduan beberapa tugas persiapan data yang khas, lihat Panduan yang menjalankan Proses Ilmu Data Tim.