Bagikan melalui


Migrasi ke Pelayanan Model

Artikel ini menunjukkan cara mengaktifkan Model Melayani di ruang kerja Anda dan mengalihkan model Anda ke pengalaman Mosaic AI Model Serving yang dibangun pada komputasi tanpa server.

Penting

Mulai 22 Agustus 2025, pelanggan tidak akan lagi dapat membuat titik akhir penyajian baru menggunakan pengalaman Penyajian Model MLflow Warisan. Pada 15 September 2025, pengalaman warisan akan mencapai akhir masa pakai dan semua titik akhir yang ada menggunakan layanan ini tidak dapat lagi digunakan.

Persyaratan

Perubahan signifikan

  • Dalam Penyajian Model, format permintaan ke endpoint dan respons dari endpoint sedikit berbeda dari Penyajian Model MLflow versi Legacy. Lihat Menilai titik akhir model untuk detail tentang protokol format baru.
  • Dalam Model Serving, URL titik akhir menyertakan serving-endpoints alih-alih model.
  • Model Serving mencakup dukungan penuh untuk mengelola sumber daya dengan alur kerja API.
  • Model Serving siap diproduksi dan didukung oleh Azure Databricks SLA.

Mengidentifikasi titik akhir penyajian yang menggunakan Penyajian Model MLflow Warisan

Untuk mengidentifikasi model yang melayani titik akhir yang menggunakan Penyajian Model MLflow Warisan:

  1. Navigasi ke UI Model di ruang kerja Anda.
  2. Pilih filter Registri Model Ruang Kerja .
  3. Pilih filter Penyajian warisan yang diaktifkan saja .

Migrasi Model MLflow Warisan yang Dilayani ke Pelayanan Model

Anda dapat membuat titik akhir Model Serving dan mengalihkan alur kerja penyajian model secara fleksibel tanpa menonaktifkan Model MLflow Warisan.

Langkah-langkah berikut menunjukkan cara menyelesaikan ini dengan UI. Untuk setiap model di mana Anda mengaktifkan Penyajian Model MLflow Warisan:

  1. Daftarkan model Anda ke Unity Catalog.
  2. Navigasi ke Melayani titik akhir di bar samping ruang kerja pembelajaran mesin Anda.
  3. Ikuti alur kerja yang dijelaskan dalam Memasukkan Titik Akhir Penyajian ke dalam Model Kustom tentang cara membuat titik akhir penyajian dengan model Anda.
  4. Transisikan aplikasi Anda untuk menggunakan URL baru yang disediakan oleh titik akhir penyajian untuk mengkueri model, bersama dengan format penilaian baru.
  5. Setelah model Anda selesai ditransisikan, Anda dapat mengakses Model di bilah samping ruang kerja pembelajaran mesin Anda.
  6. Pilih model yang ingin Anda nonaktifkan Penyajian Model MLflow Warisan.
  7. Pada tab Sajian, pilih Hentikan.
  8. Pesan tampaknya mengonfirmasi. Pilih Hentikan Penayangan.

Memigrasikan versi model yang disebarkan ke Model Serving

Dalam versi sebelumnya dari fungsionalitas Model Serving, titik akhir penyajian dibuat berdasarkan tahap versi model terdaftar: Staging atau Production. Untuk memigrasikan model yang dilayani dari pengalaman tersebut, Anda dapat mereplikasi perilaku tersebut dalam pengalaman Model Serving baru.

Bagian ini menunjukkan cara membuat titik akhir penyajian model terpisah untuk Staging versi model dan Production versi model. Langkah-langkah berikut menunjukkan cara menyelesaikan ini dengan API titik akhir penyajian untuk setiap model yang dilayani.

Dalam contoh, nama modelA model terdaftar memiliki versi 1 di tahap Production model dan versi 2 dalam tahap Stagingmodel .

  1. Buat dua titik akhir untuk model terdaftar Anda, satu untuk Staging versi model dan satu lagi untuk Production versi model.

    Untuk Staging versi model:

    POST /api/2.0/serving-endpoints
      {
         "name":"modelA-Staging"
         "config":
         {
            "served_entities":
            [
               {
                  "entity_name":"model-A",
                  "entity_version":"2",  // Staging Model Version
                  "workload_size":"Small",
                  "scale_to_zero_enabled":true
               },
            ],
         },
      }
    

    Untuk Production versi model:

    POST /api/2.0/serving-endpoints
      {
         "name":"modelA-Production"
         "config":
         {
            "served_entities":
            [
               {
                  "entity_name":"model-A",
                  "entity_version":"1",   // Production Model Version
                  "workload_size":"Small",
                  "scale_to_zero_enabled":true
               },
            ],
         },
      }
    
  2. Verifikasi status titik akhir.

    Untuk titik akhir staging: GET /api/2.0/serving-endpoints/modelA-Staging

    Untuk titik akhir Produksi: GET /api/2.0/serving-endpoints/modelA-Production

  3. Setelah titik akhir siap, kueri titik akhir menggunakan:

    Untuk titik akhir staging: POST /serving-endpoints/modelA-Staging/invocations

    Untuk titik akhir Produksi: POST /serving-endpoints/modelA-Production/invocations

  4. Perbarui titik akhir berdasarkan transisi versi model.

    Dalam skenario di mana model baru versi 3 dibuat, Anda dapat memiliki transisi model versi 2 ke Production, sementara model versi 3 dapat beralih ke Staging dan model versi 1 Archived. Perubahan ini dapat tercermin dalam model terpisah yang melayani titik akhir sebagai berikut:

    Untuk titik akhir Staging, perbarui titik akhir untuk menggunakan versi model baru di Staging.

    PUT /api/2.0/serving-endpoints/modelA-Staging/config
    {
       "served_entities":
       [
          {
             "entity_name":"model-A",
             "entity_version":"3",  // New Staging model version
             "workload_size":"Small",
             "scale_to_zero_enabled":true
          },
       ],
    }
    

    Untuk titik akhir Production, perbarui titik akhir untuk menggunakan versi model baru di Production.

    PUT /api/2.0/serving-endpoints/modelA-Production/config
    {
       "served_entities":
       [
          {
             "entity_name":"model-A",
             "entity_version":"2",  // New Production model version
             "workload_size":"Small",
             "scale_to_zero_enabled":true
          },
       ],
    }
    

Sumber Daya Tambahan: