Aracılığıyla paylaş


Model Sunma'ya Geçiş

Bu makalede, çalışma alanınızda Model Sunma'yı etkinleştirme ve modellerinizi sunucusuz işlem üzerinde oluşturulmuş Mozaik Yapay Zeka Model Sunma deneyimine değiştirme işlemleri gösterilmektedir.

Gereksinimler

Önemli değişiklikler

  • Model Sunma'da uç noktaya isteğin biçimi ve uç noktadan gelen yanıt, Eski MLflow Model Sunma'dan biraz farklıdır. Yeni biçim protokolüyle ilgili ayrıntılar için bkz . Model uç noktasını puanlama.
  • Model Sunma'da uç nokta URL'si yerine modelöğesini içerirserving-endpoints.
  • Model Sunma, API iş akışlarıyla kaynakları yönetmeye yönelik tam destek içerir.
  • Model Sunma, üretime hazır ve Azure Databricks SLA tarafından desteklenir.

Hizmet veren eski MLflow Model Sunum modellerini Model Sunma'ya geçirme

Eski MLflow Model Sunum'u devre dışı bırakmadan model sunma uç noktası oluşturabilir ve iş akışlarını sunan modeli esnek bir şekilde geçirebilirsiniz.

Aşağıdaki adımlarda bunun kullanıcı arabirimiyle nasıl gerçekleştirilir gösterilmektedir. Eski MLflow Model Sunma özelliğini etkinleştirdiğiniz her model için:

  1. Modelinizi Unity Kataloğu'na kaydedin.
  2. Makine öğrenmesi çalışma alanınızın kenar çubuğunda Uç noktaları sunma bölümüne gidin.
  3. Modelinizle bir sunum uç noktası oluşturma konusunda Özel model sunan uç noktalar oluşturma başlığında açıklanan iş akışını izleyin.
  4. Uygulamanızı, yeni puanlama biçimiyle birlikte modeli sorgulamak için sunum uç noktası tarafından sağlanan yeni URL'yi kullanacak şekilde geçirin.
  5. Modelleriniz devredildiğinde makine öğrenmesi çalışma alanınızın kenar çubuğundaKi Modeller'e gidebilirsiniz.
  6. Eski MLflow Model Sunumunu devre dışı bırakmak istediğiniz modeli seçin.
  7. Sunum sekmesinde Durdur'u seçin.
  8. Onaylamak için bir ileti görüntülenir. Sunulmasını Durdur'u seçin.

Dağıtılan model sürümlerini Model Sunma'ya geçirme

Model Sunma işlevinin önceki sürümlerinde, sunum uç noktası kayıtlı model sürümünün aşamasına göre oluşturulmuştur: Staging veya Production. Sunulan modellerinizi bu deneyimden geçirmek için bu davranışı yeni Model Sunma deneyiminde çoğaltabilirsiniz.

Bu bölümde, model sürümleri ve Production model sürümleri için Staging ayrı model sunum uç noktalarının nasıl oluşturulacağı gösterilmektedir. Aşağıdaki adımlar, sunulan modellerinizin her biri için hizmet veren uç noktalar API'siyle bunu nasıl gerçekleştireceğini gösterir.

Örnekte, kayıtlı model adının modelA model aşamasında sürüm 1 ve model aşamasında Production 2 Stagingsürümü vardır.

  1. Kayıtlı modeliniz için biri model sürümleri, diğeri Staging de model sürümleri için Production iki uç nokta oluşturun.

    Model sürümleri için Staging :

    POST /api/2.0/serving-endpoints
      {
         "name":"modelA-Staging"
         "config":
         {
            "served_entities":
            [
               {
                  "entity_name":"model-A",
                  "entity_version":"2",  // Staging Model Version
                  "workload_size":"Small",
                  "scale_to_zero_enabled":true
               },
            ],
         },
      }
    

    Model sürümleri için Production :

    POST /api/2.0/serving-endpoints
      {
         "name":"modelA-Production"
         "config":
         {
            "served_entities":
            [
               {
                  "entity_name":"model-A",
                  "entity_version":"1",   // Production Model Version
                  "workload_size":"Small",
                  "scale_to_zero_enabled":true
               },
            ],
         },
      }
    
  2. Uç noktaların durumunu doğrulayın.

    Hazırlama uç noktası için: GET /api/2.0/serving-endpoints/modelA-Staging

    Üretim uç noktası için: GET /api/2.0/serving-endpoints/modelA-Production

  3. Uç noktalar hazır olduktan sonra aşağıdakileri kullanarak uç noktayı sorgula:

    Hazırlama uç noktası için: POST /serving-endpoints/modelA-Staging/invocations

    Üretim uç noktası için: POST /serving-endpoints/modelA-Production/invocations

  4. Uç noktayı model sürümü geçişlerine göre güncelleştirin.

    Yeni model sürüm 3'in oluşturulduğu senaryoda, model sürüm 2'ye Productiongeçiş yapabilirken model sürüm 3'e Staging geçiş yapabilir ve model sürüm 1'e Archivedgeçebilirsiniz. Bu değişiklikler, uç noktaları sunan ayrı bir modele aşağıdaki gibi yansıtılabilir:

    Uç nokta için Staging uç noktayı içindeki yeni model sürümünü kullanacak şekilde güncelleştirin Staging.

    PUT /api/2.0/serving-endpoints/modelA-Staging/config
    {
       "served_entities":
       [
          {
             "entity_name":"model-A",
             "entity_version":"3",  // New Staging model version
             "workload_size":"Small",
             "scale_to_zero_enabled":true
          },
       ],
    }
    

    Uç nokta için Production uç noktayı içindeki yeni model sürümünü kullanacak şekilde güncelleştirin Production.

    PUT /api/2.0/serving-endpoints/modelA-Production/config
    {
       "served_entities":
       [
          {
             "entity_name":"model-A",
             "entity_version":"2",  // New Production model version
             "workload_size":"Small",
             "scale_to_zero_enabled":true
          },
       ],
    }
    

MozaikML çıkarım iş akışlarını Model Sunma'ya geçirme

Bu bölümde, MozaikML çıkarım dağıtımlarınızı Mozaik Yapay Zeka Modeli Sunma'ya geçirme hakkında rehberlik sağlanır ve bir not defteri örneği bulunur.

Aşağıdaki tabloda, MozaikML çıkarımı ile Azure Databricks'te hizmet veren model arasındaki eşlik özetlemektedir.

MozaikML Çıkarımı Mozaik AI Modeli Sunma
create_inference_deployment Uç nokta sunan bir model oluşturma
update_inference_deployment Uç noktaya hizmet veren modeli güncelleştirme
delete_inference_deployment Model sunma uç noktasını silme
get_inference_deployment Uç noktaya hizmet veren bir modelin durumunu alma

Aşağıdaki not defteri, modeli MozaikML'den Mozaik Yapay Zeka Modeli Sunma'ya geçirmenin kılavuzlu bir llama-13b örneğini sağlar.

MozaikML çıkarımından Mozaik AI Modeli Sunma not defterine geçiş

Not defterini alma

Ek kaynaklar