Bagikan melalui


Modul pembelajaran mesin dalam modul ML Studio (klasik)

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Alur kerja khas untuk pembelajaran mesin mencakup banyak fase:

  • Mengidentifikasi masalah yang harus dipecahkan dan metrik untuk mengukur hasil.

  • Menemukan, membersihkan, dan menyiapkan data yang sesuai.

  • Mengidentifikasi fitur terbaik dan merekayasa fitur baru.

  • Membangun, mengevaluasi, dan menyetel model.

  • Menggunakan model untuk menghasilkan prediksi, rekomendasi, dan hasil lainnya.

Modul di bagian ini menyediakan alat untuk tahap akhir pembelajaran mesin, di mana Anda menerapkan algoritma ke data untuk melatih model. Pada fase akhir ini, Anda juga menghasilkan skor, dan kemudian mengevaluasi keakuratan dan kegunaan model.

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Daftar tugas pembelajaran mesin berdasarkan kategori

Untuk deskripsi terperinci tentang alur kerja eksperimental ini, lihat panduan solusi risiko kredit.

Prasyarat

Sebelum Anda bisa sampai ke bagian yang menyenangkan dari membangun model, biasanya banyak persiapan diperlukan. Bagian ini menyediakan tautan ke alat di Pembelajaran Mesin Studio (klasik) yang dapat membantu Anda membersihkan data, meningkatkan kualitas input, dan mencegah kesalahan run-time.

Eksplorasi data dan kualitas data

Pastikan bahwa data Anda adalah jenis data yang tepat, kuantitas yang tepat, dan kualitas yang tepat untuk algoritma yang Anda pilih. Pahami berapa banyak data yang Anda miliki, dan bagaimana data tersebut didistribusikan. Apakah ada outlier? Bagaimana mereka dihasilkan, dan apa artinya? Apakah ada catatan duplikat?

Menangani nilai yang hilang

Nilai yang hilang dapat memengaruhi hasil Anda dalam banyak hal. Misalnya, hampir semua metode statistik membuang kasus dengan nilai yang hilang. Secara default, Pembelajaran Mesin mengikuti aturan ini ketika menemukan baris dengan nilai yang hilang:

  • Jika data yang digunakan untuk melatih model memiliki nilai yang hilang, baris apa pun dengan nilai yang hilang akan dilewati.

  • Jika data yang digunakan sebagai input saat mencetak nilai terhadap model memiliki nilai yang hilang, nilai yang hilang digunakan sebagai input, tetapi null disebarkan. Ini biasanya berarti bahwa null dimasukkan dalam hasil, bukan prediksi yang valid.

Pastikan untuk memeriksa data Anda sebelum melatih model Anda. Untuk menyiratkan nilai yang hilang atau memperbaiki data Anda, gunakan modul ini:

Pilih fitur dan kurangi dimensi

Pembelajaran Mesin Studio (klasik) dapat membantu Anda menyaring data Anda untuk menemukan atribut yang paling berguna.

Contoh

Untuk contoh pembelajaran mesin yang sedang beraksi, lihat Galeri AI Azure.

Untuk tips, dan panduan beberapa tugas persiapan data yang khas, lihat Panduan yang menjalankan Proses Ilmu Data Tim.

Lihat juga