Mengatur eksekusi pelatihan dengan eksperimen MLflow
Eksperimen adalah unit organisasi untuk eksekusi pelatihan model Anda. Ada dua jenis eksperimen: ruang kerja dan notebook.
- Anda dapat membuat eksperimen ruang kerja dari antarmuka pengguna Databricks Mosaic AI atau API MLflow. Eksperimen ruang kerja tidak terkait dengan notebook mana pun, dan setiap notebook dapat mencatat eksekusi untuk eksperimen ini dengan menggunakan ID eksperimen atau nama eksperimen.
- Eksperimen notebook dikaitkan dengan notebook tertentu. Azure Databricks secara otomatis membuat eksperimen notebook jika tidak ada eksperimen aktif saat Anda memulai eksekusi menggunakan mlflow.start_run().
Untuk melihat semua eksperimen di ruang kerja yang dapat Anda akses, pilih eksperimen Pembelajaran Mesin > di bar samping.
Membuat eksperimen ruang kerja
Bagian ini menjelaskan cara membuat eksperimen ruang kerja menggunakan UI Azure Databricks. Anda dapat membuat eksperimen ruang kerja langsung dari ruang kerja atau dari halaman Eksperimen.
Anda juga dapat menggunakan API MLflow atau penyedia Databricks Terraform dengan databricks_mlflow_experiment.
Untuk instruksi tentang pengelogan eksekusi ke eksperimen ruang kerja, lihat Membuat log contoh buku catatan.
Klik Ruang Kerja di bilah samping.
Navigasikan ke folder tempat Anda ingin membuat eksperimen.
Klik kanan pada folder dan pilih Buat > eksperimen MLflow.
Dalam dialog Buat Eksperimen MLflow, masukkan nama untuk eksperimen dan lokasi artefak opsional. Jika Anda tidak menentukan lokasi artefak, artefak disimpan dalam penyimpanan artefak yang dikelola MLflow:
dbfs:/databricks/mlflow-tracking/<experiment-id>
.Azure Databricks mendukung volume Unity Catalog, penyimpanan Azure Blob, dan lokasi artefak penyimpanan Azure Data Lake.
Di MLflow 2.15.0 ke atas, Anda dapat menyimpan artefak dalam volume Katalog Unity. Saat Anda membuat eksperimen MLflow, tentukan jalur volume formulir
dbfs:/Volumes/catalog_name/schema_name/volume_name/user/specified/path
sebagai lokasi artefak eksperimen MLflow Anda.Untuk menyimpan artefak di penyimpanan Azure Blob, tentukan URI formulir
wasbs://<container>@<storage-account>.blob.core.windows.net/<path>
. Artefak yang disimpan dalam penyimpanan Azure Blob tidak muncul di UI MLflow; Anda harus mengunduhnya menggunakan klien penyimpanan blob.Catatan
Saat Anda menyimpan artefak di lokasi selain DBFS, artefak tidak muncul di UI MLflow. Model yang disimpan di lokasi selain DBFS tidak dapat didaftarkan di Registri Model.
Klik Buat. Eksperimen kosong muncul.
Anda juga dapat membuat eksperimen ruang kerja baru dari halaman Eksperimen. Untuk membuat eksperimen baru, gunakan menu drop-down. Dari menu drop-down, Anda dapat memilih eksperimen AutoML atau eksperimen kosong (kosong).
Eksperimen AutoML. Halaman Konfigurasi eksperimen AutoML muncul. Untuk informasi tentang menggunakan AutoML, lihat Melatih model ML dengan UI Mosaic AutoML.
Eksperimen kosong. Dialog Buat Eksperimen MLflow muncul. Masukkan nama dan lokasi artefak opsional dalam dialog untuk membuat eksperimen ruang kerja baru. Lokasi artefak default adalah
dbfs:/databricks/mlflow-tracking/<experiment-id>
.Untuk eksekusi log ke eksperimen ini, panggil
mlflow.set_experiment()
dengan jalur eksperimen. Jalur eksperimen muncul di bagian atas halaman eksperimen. Lihat Membuat log contoh buku catatan untuk detail dan contoh buku catatan.
Membuat eksperimen notebook
Saat Anda menggunakan perintah mlflow.start_run() di notebook, eksekusi mencatat metrik dan parameter ke eksperimen aktif. Jika tidak ada eksperimen yang aktif, Azure Databricks membuat eksperimen notebook. Eksperimen notebook memiliki nama dan ID yang sama dengan notebook yang sesuai. ID notebook adalah pengidentifikasi numerik di akhir URL dan ID Notebook.
Atau, Anda dapat meneruskan jalur ruang kerja Azure Databricks ke buku catatan yang sudah ada di mlflow.set_experiment() untuk membuat eksperimen notebook untuk itu.
Untuk instruksi tentang pengelogan eksekusi ke eksperimen buku catatan, lihat Membuat log contoh buku catatan.
Catatan
Jika Anda menghapus eksperimen notebook menggunakan API (misalnya, MlflowClient.tracking.delete_experiment()
di Python), notebook itu sendiri dipindahkan ke folder Keranjang Sampah.
Melihat eksperimen
Setiap eksperimen yang dapat Anda akses muncul di halaman eksperimen. Dari halaman ini, Anda dapat melihat eksperimen apa pun. Klik nama eksperimen untuk menampilkan halaman eksperimen.
Cara lain untuk mengakses halaman eksperimen:
- Anda dapat mengakses halaman eksperimen untuk eksperimen ruang kerja dari menu ruang kerja.
- Anda dapat mengakses halaman eksperimen untuk eksperimen notebook dari notebook.
Untuk mencari eksperimen, ketik teks di bidang Eksperimen filter dan tekan Enter atau klik ikon kaca pembesar. Daftar eksperimen berubah hanya untuk menampilkan eksperimen yang berisi teks pencarian di kolom Nama, Dibuat oleh, Lokasi, atau Deskripsi .
Klik nama eksperimen apa pun dalam tabel untuk menampilkan halaman eksperimennya:
Halaman eksperimen mencantumkan semua eksekusi yang terkait dengan eksperimen. Dari tabel, Anda dapat membuka halaman eksekusi untuk setiap eksekusi yang terkait dengan eksperimen dengan mengklik Nama Eksekusinya. Kolom Sumber memberi Anda akses ke versi notebook yang membuat eksekusi. Anda juga dapat mencari dan memfilter eksekusi berdasarkan metrik atau pengaturan parameter.
Melihat eksperimen ruang kerja
- Klik Ruang Kerja di bilah samping.
- Buka folder yang berisi eksperimen.
- Klik nama eksperimen.
Melihat eksperimen notebook
Di bilah sisi kanan buku catatan, klik ikon Eksperimen .
Bilah sisi Eksekusi Eksperimen muncul dan menampilkan ringkasan setiap eksekusi yang terkait dengan eksperimen notebook, termasuk parameter dan metrik eksekusi. Di bagian atas bilah sisi adalah nama eksperimen yang baru-baru ini eksekusinya dicatat di notebook tersebut (baik eksperimen notebook atau eksperimen ruang kerja).
Dari bilah sisi, Anda dapat menavigasi ke halaman eksperimen atau langsung ke jalankan.
- Untuk melihat eksperimen, klik di ujung kanan, di samping Eksekusi Eksperimen.
- Untuk menampilkan eksekusi, klik nama eksekusi.
Mengelola eksperimen
Anda dapat mengganti nama, menghapus, atau mengelola izin untuk eksperimen yang Anda miliki dari halaman eksperimen, halaman eksperimen, atau menu ruang kerja.
Catatan
Anda tidak dapat langsung mengganti nama, menghapus, atau mengelola izin pada eksperimen MLflow yang dibuat oleh buku catatan di folder Databricks Git. Anda harus melakukan tindakan ini di tingkat folder Git.
Mengganti nama eksperimen dari halaman eksperimen atau halaman eksperimen
Penting
Fitur ini ada di Pratinjau Publik.
Untuk mengganti nama eksperimen dari halaman eksperimen atau halaman eksperimen, klik dan pilih Ganti Nama.
Mengganti nama eksperimen dari menu ruang kerja
- Klik Ruang Kerja di bilah samping.
- Buka folder yang berisi eksperimen.
- Klik kanan pada nama eksperimen dan pilih Ganti Nama.
Menyalin nama eksperimen
Untuk menyalin nama eksperimen, klik di bagian atas halaman eksperimen. Anda dapat menggunakan nama ini di perintah set_experiment
MLflow untuk mengatur eksperimen MLflow yang aktif.
Anda juga dapat menyalin nama eksperimen dari bilah sisi eksperimen di notebook.
Menghapus eksperimen notebook
Eksperimen notebook adalah bagian dari notebook dan tidak dapat dihapus secara terpisah. Saat Anda menghapus notebook, eksperimen notebook terkait akan dihapus. Saat Anda menghapus eksperimen notebook menggunakan UI, buku catatan juga dihapus.
Untuk menghapus eksperimen notebook menggunakan API, gunakan API Ruang Kerja untuk memastikan buku catatan dan eksperimen dihapus dari ruang kerja.
Menghapus eksperimen ruang kerja dari menu ruang kerja
- Klik Ruang Kerja di bilah samping.
- Buka folder yang berisi eksperimen.
- Klik kanan pada nama eksperimen dan pilih Pindahkan ke Sampah.
Menghapus eksperimen ruang kerja atau notebook dari halaman eksperimen atau halaman eksperimen
Penting
Fitur ini ada di Pratinjau Publik.
Untuk menghapus eksperimen dari halaman eksperimen atau halaman eksperimen, klik dan pilih Hapus.
Saat Anda menghapus eksperimen notebook, notebook tersebut juga akan dihapus.
Mengubah izin untuk eksperimen
Untuk mengubah izin eksperimen dari halaman eksperimen, klik Bagikan.
Anda dapat mengubah izin untuk eksperimen yang Anda miliki dari halaman eksperimen. Klik di kolom Tindakan dan pilih Izin.
Untuk informasi tentang tingkat izin eksperimen, lihat ACL eksperimen MLflow.
Menyalin eksperimen di antara ruang kerja
Untuk memigrasikan eksperimen MLflow antar ruang kerja, Anda bisa menggunakan proyek berbasis komunitas sumber terbuka MLflow Export-Import.
Dengan alat-alat ini, Anda dapat:
- Berbagi dan berkolaborasi dengan ilmuwan data lain di server pelacakan yang sama atau lainnya. Misalnya, Anda bisa mengkloning eksperimen dari pengguna lain ke ruang kerja Anda.
- Salin eksperimen MLflow dan jalankan dari server pelacakan lokal Anda ke ruang kerja Databricks Anda.
- Cadangkan eksperimen dan model misi penting ke ruang kerja Databricks lain.