Aracılığıyla paylaş


Model Sunma'ya Geçiş

Bu makalede, çalışma alanınızda Model Sunumunu etkinleştirme ve modellerinizi sunucusuz işlem üzerinde oluşturulan Mozaik Yapay Zeka Modeli Sunma deneyimine geçme işlemleri gösterilmektedir.

Önemli

22 Ağustos 2025'den itibaren müşteriler artık Eski MLflow Model Sunma deneyimini kullanarak yeni hizmet uç noktaları oluşturamayacaktır. 15 Eylül 2025'te eski deneyim kullanım ömrü sonuna ulaşacak ve bu hizmeti kullanan mevcut tüm uç noktalar artık kullanılamayacak.

Gereksinimler

Önemli değişiklikler

  • Model Sunma'da uç noktaya isteğin biçimi ve uç noktadan gelen yanıt, Eski MLflow Model Sunma'dan biraz farklıdır. Yeni biçim protokolüyle ilgili ayrıntılar için Bir model uç noktasını değerlendirme konusuna bakın.
  • Model Sunma'da, uç nokta URL'si serving-endpoints yerine model öğesini içerir.
  • Model Sunma, API iş akışlarıyla kaynakları yönetmeye yönelik tam destek içerir.
  • Model Sunma, üretime hazır ve Azure Databricks SLA tarafından desteklenir.

Eski MLflow Model Sunma'ya sahip servis uç noktalarını belirleme

Eski MLflow Model Sunma kullanan model sunma uç noktalarını belirlemek için:

  1. Çalışma alanınızdaki Modeller kullanıcı arabirimine gidin.
  2. Çalışma Alanı Modeli Kayıt Defteri filtresini seçin.
  3. Yalnızca eski hizmet sunma etkin filtresini seçin.

Eski MLflow Model Sunum tarafından sunulan modelleri Model Sunmaya geçirme

Eski MLflow Model Sunumu devre dışı bırakmadan bir model sunma uç noktası oluşturabilir ve model sunma iş akışlarını esnek bir şekilde geçirebilirsiniz.

Aşağıdaki adımlarda bunun kullanıcı arabirimiyle nasıl gerçekleştirilir gösterilmektedir. Eski MLflow Model Sunma özelliğini etkinleştirdiğiniz her model için:

  1. Modelinizi Unity Kataloğu'na kaydedin.
  2. Makine öğrenmesi çalışma alanınızın kenar çubuğunda Hizmet uç noktalarına gidin.
  3. Modeliniz ile bir sunum uç noktası oluşturma konusunda, Özel model sunan uç noktalar oluşturma başlığında açıklanan iş akışını izleyin.
  4. Uygulamanızı, yeni puanlama biçimiyle birlikte modeli sorgulamak için sunum uç noktası tarafından sağlanan yeni URL'yi kullanacak şekilde geçirin.
  5. Modelleriniz devredildiğinde, makine öğrenmesi çalışma alanınızın kenar çubuğundaki Modeller'e gidebilirsiniz.
  6. Eski MLflow Model Sunumunu devre dışı bırakmak istediğiniz modeli seçin.
  7. Sunucu sekmesinde Durdurseçin.
  8. Onaylamak için bir ileti görüntülenir. Sunulmasını Durdur'u seçin.

Dağıtılan model sürümlerini Model Serving'e geçirme

Model Sunma işlevinin önceki sürümlerinde, sunum uç noktası kayıtlı model sürümünün aşamasına göre oluşturulmuştur: Staging veya Production. Sunulan modellerinizi mevcut deneyimden taşımak için bu davranışı yeni Model Sunma deneyiminde tekrarlayabilirsiniz.

Bu bölümde, Staging model sürümleri ve Production model sürümleri için ayrı model sunum uç noktalarının nasıl oluşturulacağı gösterilmektedir. Aşağıdaki adımlar, sunulan modellerinizin her biri için hizmet veren uç noktalar API'siyle bunu nasıl gerçekleştireceğini gösterir.

Örnekte, kayıtlı model adı, modelA model aşamasında sürüm 1'e ve Production model aşamasında sürüm 2'ye sahiptir.

  1. Kayıtlı modeliniz için iki uç nokta oluşturun: biri Staging model sürümleri, diğeri Production model sürümleri için.

    Model sürümleri için: Staging

    POST /api/2.0/serving-endpoints
      {
         "name":"modelA-Staging"
         "config":
         {
            "served_entities":
            [
               {
                  "entity_name":"model-A",
                  "entity_version":"2",  // Staging Model Version
                  "workload_size":"Small",
                  "scale_to_zero_enabled":true
               },
            ],
         },
      }
    

    Model sürümleri için: Production

    POST /api/2.0/serving-endpoints
      {
         "name":"modelA-Production"
         "config":
         {
            "served_entities":
            [
               {
                  "entity_name":"model-A",
                  "entity_version":"1",   // Production Model Version
                  "workload_size":"Small",
                  "scale_to_zero_enabled":true
               },
            ],
         },
      }
    
  2. Uç noktaların durumunu doğrulayın.

    Hazırlık (Staging) uç noktası için: GET /api/2.0/serving-endpoints/modelA-Staging

    Üretim uç noktası için: GET /api/2.0/serving-endpoints/modelA-Production

  3. Uç noktalar hazır olduktan sonra aşağıdakileri kullanarak uç noktayı sorgula:

    Hazırlık (Staging) uç noktası için: POST /serving-endpoints/modelA-Staging/invocations

    Üretim uç noktası için: POST /serving-endpoints/modelA-Production/invocations

  4. Uç noktayı model sürümü geçişlerine göre güncelleştirin.

    Yeni model sürüm 3'in oluşturulduğu senaryoda, model sürüm 2'nin Productionsürümüne geçişini sağlayabilirsiniz; model sürüm 3 Staging geçiş yapabilir ve model sürüm 1 Archived. Bu değişiklikler, uç noktaları sunan ayrı bir modele aşağıdaki gibi yansıtılabilir:

    Staging uç noktası için uç noktayı Staging'da yeni model sürümünü kullanacak şekilde güncelleştirin.

    PUT /api/2.0/serving-endpoints/modelA-Staging/config
    {
       "served_entities":
       [
          {
             "entity_name":"model-A",
             "entity_version":"3",  // New Staging model version
             "workload_size":"Small",
             "scale_to_zero_enabled":true
          },
       ],
    }
    

    Production uç noktası için, uç noktayı Production'deki yeni model sürümünü kullanacak şekilde güncelleştirin.

    PUT /api/2.0/serving-endpoints/modelA-Production/config
    {
       "served_entities":
       [
          {
             "entity_name":"model-A",
             "entity_version":"2",  // New Production model version
             "workload_size":"Small",
             "scale_to_zero_enabled":true
          },
       ],
    }
    

Ek kaynaklar