Model pembelajaran mesin di Microsoft Fabric
Model pembelajaran mesin adalah file yang dilatih untuk mengenali jenis pola tertentu. Anda melatih model melalui sekumpulan data, dan Anda menyediakannya dengan algoritma yang menggunakan untuk alasan atas dan belajar dari himpunan data tersebut. Setelah melatih model, Anda dapat menggunakannya untuk alasan atas data yang tidak pernah dilihat sebelumnya, dan membuat prediksi tentang data tersebut.
Penting
Microsoft Fabric sedang dalam pratinjau.
Dalam MLflow, model pembelajaran mesin dapat menyertakan beberapa versi model. Di sini, setiap versi dapat mewakili perulangan model. Dalam artikel ini, Anda mempelajari cara berinteraksi dengan model pembelajaran mesin untuk melacak dan membandingkan versi model.
Buat model
Dalam MLflow, model pembelajaran mesin menyertakan format kemasan standar. Format ini memungkinkan penggunaan model tersebut di berbagai alat hilir, termasuk inferensi batch pada Apache Spark. Format mendefinisikan konvensi untuk menyimpan model dalam "rasa" yang berbeda yang dapat dipahami oleh alat hilir yang berbeda.
Pengalaman pengguna dapat langsung membuat model pembelajaran mesin dari pengalaman pengguna. API MLflow juga dapat langsung membuat model pembelajaran mesin.
Untuk membuat model pembelajaran mesin dari pengalaman pengguna, Anda dapat:
Buat ruang kerja ilmu data baru, atau pilih ruang kerja ilmu data yang sudah ada.
Dari menu dropdown + Baru , pilih Model. Ini membuat model kosong di ruang kerja ilmu data Anda.
Setelah pembuatan model, Anda dapat mulai menambahkan versi model untuk melacak metrik dan parameter eksekusi. Mendaftarkan atau menyimpan eksekusi eksperimen ke model yang ada.
Anda juga dapat membuat eksperimen pembelajaran mesin langsung dari pengalaman penulisan Anda dengan mlflow.register_model()
API. Jika model terdaftar dengan nama yang diberikan tidak ada, API membuatnya secara otomatis.
import mlflow
model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")
print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))
Mengelola versi dalam model
Model pembelajaran mesin berisi kumpulan versi model untuk pelacakan dan perbandingan yang disederhanakan. Dalam model, ilmuwan data dapat menavigasi di berbagai versi model untuk menjelajahi parameter dan metrik yang mendasar. Ilmuwan data juga dapat membuat perbandingan di seluruh versi model untuk mengidentifikasi apakah model yang lebih baru mungkin memberikan hasil yang lebih baik atau tidak.
Melacak model
Versi model pembelajaran mesin mewakili model individual yang telah didaftarkan untuk pelacakan.
Setiap versi model menyertakan informasi berikut:
- Waktu Dibuat: Tanggal dan waktu pembuatan model.
- Nama Eksekusi: Pengidentifikasi untuk eksekusi eksperimen yang digunakan untuk membuat versi model khusus ini.
- Hiperparameter: Hyperparameter disimpan sebagai pasangan kunci-nilai. Kedua kunci dan nilai merupakan string.
- Metrik: Jalankan metrik yang disimpan sebagai pasangan kunci-nilai. Nilainya adalah numerik.
- Skema/Tanda Tangan Model: Deskripsi input dan output model.
- File yang dicatat: File yang dicatat dalam format apa pun. Misalnya, Anda dapat merekam gambar, lingkungan, model, dan file data.
Membandingkan dan memfilter model
Untuk membandingkan dan mengevaluasi kualitas versi model pembelajaran mesin, Anda dapat membandingkan parameter, metrik, dan metadata antara versi yang dipilih.
Membandingkan model secara visual
Anda dapat membandingkan eksekusi secara visual dalam model yang ada. Ini memungkinkan navigasi yang mudah antara, dan mengurutkan di beberapa versi.
Untuk membandingkan eksekusi, Anda dapat:
- Pilih model pembelajaran mesin yang ada yang berisi beberapa versi.
- Pilih tab Tampilan , lalu navigasikan ke tampilan daftar Model . Anda juga dapat memilih opsi untuk Menampilkan daftar model langsung dari tampilan detail.
- Anda bisa mengkustomisasi kolom dalam tabel. Perluas panel Kustomisasi kolom . Dari sana, Anda dapat memilih properti, metrik, dan hiperparameter yang ingin Anda lihat.
- Terakhir, Anda dapat memilih beberapa versi, untuk membandingkan hasilnya, di panel perbandingan metrik. Dari panel ini, Anda bisa mengkustomisasi bagan dengan perubahan pada judul bagan, jenis visualisasi, sumbu X, sumbu Y, dan lainnya.
Membandingkan model menggunakan API MLflow
Ilmuwan data juga dapat menggunakan MLflow untuk mencari di antara beberapa model yang disimpan dalam ruang kerja. Kunjungi dokumentasi MLflow untuk menjelajahi API MLflow lainnya untuk interaksi model.
from pprint import pprint
client = MlflowClient()
for rm in client.list_registered_models():
pprint(dict(rm), indent=4)
Menerapkan model
Setelah melatih model pada himpunan data, Anda dapat menerapkan model tersebut ke data yang tidak pernah dilihatnya untuk menghasilkan prediksi. Kami menyebut model ini menggunakan penilaian atau inferensi teknik. Untuk informasi selengkapnya tentang penilaian model Microsoft Fabric, lihat bagian berikutnya.