Model pembelajaran mesin di Microsoft Fabric

Model pembelajaran mesin adalah file yang dilatih untuk mengenali jenis pola tertentu. Anda melatih model melalui sekumpulan data, dan Anda menyediakannya dengan algoritma yang digunakan untuk alasan dan belajar dari himpunan data tersebut. Setelah melatih model, Anda dapat menggunakannya untuk alasan atas data yang tidak pernah dilihat sebelumnya, dan membuat prediksi tentang data tersebut.

Dalam MLflow, model pembelajaran mesin dapat menyertakan beberapa versi model. Di sini, setiap versi dapat mewakili iterasi model. Dalam artikel ini, Anda mempelajari cara berinteraksi dengan model ML untuk melacak dan membandingkan versi model.

Membuat model pembelajaran mesin

Dalam MLflow, model pembelajaran mesin menyertakan format kemasan standar. Format ini memungkinkan penggunaan model tersebut di berbagai alat hilir, termasuk inferensi batch pada Apache Spark. Format mendefinisikan konvensi untuk menyimpan model dalam "rasa" yang berbeda yang dapat dipahami oleh alat hilir yang berbeda.

Anda dapat langsung membuat model pembelajaran mesin dari UI Fabric. API MLflow juga dapat langsung membuat model.

Untuk membuat model pembelajaran mesin dari UI, Anda dapat:

  1. Buat ruang kerja ilmu data baru, atau pilih ruang kerja ilmu data yang ada.

  2. Dari menu dropdown + Baru, pilih Model untuk membuat model kosong di ruang kerja ilmu data Anda.

    Screenshot showing the New drop-down menu.

  3. Setelah pembuatan model, Anda dapat mulai menambahkan versi model untuk melacak metrik dan parameter eksekusi. Daftarkan atau simpan eksekusi eksperimen ke model yang ada.

Anda juga dapat membuat eksperimen pembelajaran mesin langsung dari pengalaman penulisan Anda dengan mlflow.register_model() API. Jika model pembelajaran mesin terdaftar dengan nama yang diberikan tidak ada, API membuatnya secara otomatis.

import mlflow

model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")

print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))

Mengelola versi dalam model pembelajaran mesin

Model pembelajaran mesin berisi kumpulan versi model untuk pelacakan dan perbandingan yang disederhanakan. Dalam model, ilmuwan data dapat menavigasi di berbagai versi model untuk menjelajahi parameter dan metrik yang mendasar. Ilmuwan data juga dapat membuat perbandingan di seluruh versi model untuk mengidentifikasi apakah model yang lebih baru mungkin memberikan hasil yang lebih baik atau tidak.

Melacak model pembelajaran mesin

Versi model pembelajaran mesin mewakili model individual yang terdaftar untuk pelacakan.

Screenshot showing the details screen of a model.

Setiap versi model menyertakan informasi berikut:

  • Waktu Dibuat: Tanggal dan waktu pembuatan model.
  • Jalankan Nama: Pengidentifikasi untuk eksekusi eksperimen yang digunakan untuk membuat versi model khusus ini.
  • Hyperparameter: Hyperparameter disimpan sebagai pasangan kunci-nilai. Kedua kunci dan nilai merupakan string.
  • Metrik: Jalankan metrik yang disimpan sebagai pasangan kunci-nilai. Nilainya adalah numerik.
  • Skema/Tanda Tangan Model: Deskripsi input dan output model.
  • File yang dicatat: File yang dicatat dalam format apa pun. Misalnya, Anda dapat merekam gambar, lingkungan, model, dan file data.

Membandingkan dan memfilter model pembelajaran mesin

Untuk membandingkan dan mengevaluasi kualitas versi model pembelajaran mesin, Anda dapat membandingkan parameter, metrik, dan metadata antara versi yang dipilih.

Membandingkan model pembelajaran mesin secara visual

Anda dapat membandingkan eksekusi secara visual dalam model yang ada. Perbandingan visual memungkinkan navigasi yang mudah antara, dan mengurutkan di beberapa versi.

Screenshot showing a list of runs for comparison.

Untuk membandingkan eksekusi, Anda dapat:

  1. Pilih model pembelajaran mesin yang ada yang berisi beberapa versi.
  2. Pilih tab Tampilan , lalu navigasikan ke tampilan daftar Model. Anda juga dapat memilih opsi untuk Menampilkan daftar model langsung dari tampilan detail.
  3. Anda bisa mengkustomisasi kolom dalam tabel. Perluas panel Kustomisasi kolom . Dari sana, Anda dapat memilih properti, metrik, dan hiperparameter yang ingin Anda lihat.
  4. Terakhir, Anda dapat memilih beberapa versi, untuk membandingkan hasilnya, di panel perbandingan metrik. Dari panel ini, Anda bisa mengkustomisasi bagan dengan perubahan pada judul bagan, jenis visualisasi, sumbu X, sumbu Y, dan lainnya.

Membandingkan model pembelajaran mesin menggunakan API MLflow

Ilmuwan data juga dapat menggunakan MLflow untuk mencari di antara beberapa model yang disimpan dalam ruang kerja. Kunjungi dokumentasi MLflow untuk menjelajahi API MLflow lainnya untuk interaksi model.

from pprint import pprint

client = MlflowClient()
for rm in client.list_registered_models():
    pprint(dict(rm), indent=4)

Menerapkan model pembelajaran mesin

Setelah melatih model pada himpunan data, Anda dapat menerapkan model tersebut ke data yang tidak pernah dilihatnya untuk menghasilkan prediksi. Kami menyebut model ini menggunakan penilaian teknik atau inferensi. Untuk informasi selengkapnya tentang penilaian model Microsoft Fabric, lihat bagian berikutnya.