Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Artikel ini menunjukkan cara mengaktifkan Model Melayani di ruang kerja Anda dan mengalihkan model Anda ke pengalaman Mosaic AI Model Serving yang dibangun pada komputasi tanpa server.
Penting
Mulai 22 Agustus 2025, pelanggan tidak akan lagi dapat membuat titik akhir penyajian baru menggunakan pengalaman Penyajian Model MLflow Warisan. Pada 15 September 2025, pengalaman warisan akan mencapai akhir masa pakai dan semua titik akhir yang ada menggunakan layanan ini tidak dapat lagi digunakan.
Persyaratan
- Model terdaftar di MLflow Model Registry.
- Izin pada model terdaftar seperti yang dijelaskan dalam panduan kontrol akses.
- Aktifkan komputasi tanpa server di ruang kerja Anda.
Perubahan signifikan
- Dalam Penyajian Model, format permintaan ke endpoint dan respons dari endpoint sedikit berbeda dari Penyajian Model MLflow versi Legacy. Lihat Menilai titik akhir model untuk detail tentang protokol format baru.
- Dalam Model Serving, URL titik akhir menyertakan
serving-endpointsalih-alihmodel. - Model Serving mencakup dukungan penuh untuk mengelola sumber daya dengan alur kerja API.
- Model Serving siap diproduksi dan didukung oleh Azure Databricks SLA.
Mengidentifikasi titik akhir penyajian yang menggunakan Penyajian Model MLflow Warisan
Untuk mengidentifikasi model yang melayani titik akhir yang menggunakan Penyajian Model MLflow Warisan:
- Navigasi ke UI Model di ruang kerja Anda.
- Pilih filter Registri Model Ruang Kerja .
- Pilih filter Penyajian warisan yang diaktifkan saja .
Migrasi Model MLflow Warisan yang Dilayani ke Pelayanan Model
Anda dapat membuat titik akhir Model Serving dan mengalihkan alur kerja penyajian model secara fleksibel tanpa menonaktifkan Model MLflow Warisan.
Langkah-langkah berikut menunjukkan cara menyelesaikan ini dengan UI. Untuk setiap model di mana Anda mengaktifkan Penyajian Model MLflow Warisan:
- Daftarkan model Anda ke Unity Catalog.
- Navigasi ke Melayani titik akhir di bar samping ruang kerja pembelajaran mesin Anda.
- Ikuti alur kerja yang dijelaskan dalam Memasukkan Titik Akhir Penyajian ke dalam Model Kustom tentang cara membuat titik akhir penyajian dengan model Anda.
- Transisikan aplikasi Anda untuk menggunakan URL baru yang disediakan oleh titik akhir penyajian untuk mengkueri model, bersama dengan format penilaian baru.
- Setelah model Anda selesai ditransisikan, Anda dapat mengakses Model di bilah samping ruang kerja pembelajaran mesin Anda.
- Pilih model yang ingin Anda nonaktifkan Penyajian Model MLflow Warisan.
- Pada tab Sajian, pilih Hentikan.
- Pesan tampaknya mengonfirmasi. Pilih Hentikan Penayangan.
Memigrasikan versi model yang disebarkan ke Model Serving
Dalam versi sebelumnya dari fungsionalitas Model Serving, titik akhir penyajian dibuat berdasarkan tahap versi model terdaftar: Staging atau Production. Untuk memigrasikan model yang dilayani dari pengalaman tersebut, Anda dapat mereplikasi perilaku tersebut dalam pengalaman Model Serving baru.
Bagian ini menunjukkan cara membuat titik akhir penyajian model terpisah untuk Staging versi model dan Production versi model. Langkah-langkah berikut menunjukkan cara menyelesaikan ini dengan API titik akhir penyajian untuk setiap model yang dilayani.
Dalam contoh, nama modelA model terdaftar memiliki versi 1 di tahap Production model dan versi 2 dalam tahap Stagingmodel .
Buat dua titik akhir untuk model terdaftar Anda, satu untuk
Stagingversi model dan satu lagi untukProductionversi model.Untuk
Stagingversi model:POST /api/2.0/serving-endpoints { "name":"modelA-Staging" "config": { "served_entities": [ { "entity_name":"model-A", "entity_version":"2", // Staging Model Version "workload_size":"Small", "scale_to_zero_enabled":true }, ], }, }Untuk
Productionversi model:POST /api/2.0/serving-endpoints { "name":"modelA-Production" "config": { "served_entities": [ { "entity_name":"model-A", "entity_version":"1", // Production Model Version "workload_size":"Small", "scale_to_zero_enabled":true }, ], }, }Verifikasi status titik akhir.
Untuk titik akhir staging:
GET /api/2.0/serving-endpoints/modelA-StagingUntuk titik akhir Produksi:
GET /api/2.0/serving-endpoints/modelA-ProductionSetelah titik akhir siap, kueri titik akhir menggunakan:
Untuk titik akhir staging:
POST /serving-endpoints/modelA-Staging/invocationsUntuk titik akhir Produksi:
POST /serving-endpoints/modelA-Production/invocationsPerbarui titik akhir berdasarkan transisi versi model.
Dalam skenario di mana model baru versi 3 dibuat, Anda dapat memiliki transisi model versi 2 ke
Production, sementara model versi 3 dapat beralih keStagingdan model versi 1Archived. Perubahan ini dapat tercermin dalam model terpisah yang melayani titik akhir sebagai berikut:Untuk titik akhir
Staging, perbarui titik akhir untuk menggunakan versi model baru diStaging.PUT /api/2.0/serving-endpoints/modelA-Staging/config { "served_entities": [ { "entity_name":"model-A", "entity_version":"3", // New Staging model version "workload_size":"Small", "scale_to_zero_enabled":true }, ], }Untuk titik akhir
Production, perbarui titik akhir untuk menggunakan versi model baru diProduction.PUT /api/2.0/serving-endpoints/modelA-Production/config { "served_entities": [ { "entity_name":"model-A", "entity_version":"2", // New Production model version "workload_size":"Small", "scale_to_zero_enabled":true }, ], }