Model Sunma'ya Geçiş
Bu makalede, çalışma alanınızda Model Sunma'yı etkinleştirme ve modellerinizi sunucusuz işlem üzerinde oluşturulmuş Mozaik Yapay Zeka Model Sunma deneyimine değiştirme işlemleri gösterilmektedir.
Gereksinimler
- MLflow Model Kayıt Defteri'nde kayıtlı model.
- Erişim denetimi kılavuzunda açıklandığı gibi kayıtlı modellerdeki izinler.
- Çalışma alanınızda sunucusuz işlem özelliğini etkinleştirin.
Önemli değişiklikler
- Model Sunma'da uç noktaya isteğin biçimi ve uç noktadan gelen yanıt, Eski MLflow Model Sunma'dan biraz farklıdır. Yeni biçim protokolüyle ilgili ayrıntılar için bkz . Model uç noktasını puanlama.
- Model Sunma'da uç nokta URL'si yerine
model
öğesini içerirserving-endpoints
. - Model Sunma, API iş akışlarıyla kaynakları yönetmeye yönelik tam destek içerir.
- Model Sunma, üretime hazır ve Azure Databricks SLA tarafından desteklenir.
Hizmet veren eski MLflow Model Sunum modellerini Model Sunma'ya geçirme
Eski MLflow Model Sunum'u devre dışı bırakmadan model sunma uç noktası oluşturabilir ve iş akışlarını sunan modeli esnek bir şekilde geçirebilirsiniz.
Aşağıdaki adımlarda bunun kullanıcı arabirimiyle nasıl gerçekleştirilir gösterilmektedir. Eski MLflow Model Sunma özelliğini etkinleştirdiğiniz her model için:
- Modelinizi Unity Kataloğu'na kaydedin.
- Makine öğrenmesi çalışma alanınızın kenar çubuğunda Uç noktaları sunma bölümüne gidin.
- Modelinizle bir sunum uç noktası oluşturma konusunda Özel model sunan uç noktalar oluşturma başlığında açıklanan iş akışını izleyin.
- Uygulamanızı, yeni puanlama biçimiyle birlikte modeli sorgulamak için sunum uç noktası tarafından sağlanan yeni URL'yi kullanacak şekilde geçirin.
- Modelleriniz devredildiğinde makine öğrenmesi çalışma alanınızın kenar çubuğundaKi Modeller'e gidebilirsiniz.
- Eski MLflow Model Sunumunu devre dışı bırakmak istediğiniz modeli seçin.
- Sunum sekmesinde Durdur'u seçin.
- Onaylamak için bir ileti görüntülenir. Sunulmasını Durdur'u seçin.
Dağıtılan model sürümlerini Model Sunma'ya geçirme
Model Sunma işlevinin önceki sürümlerinde, sunum uç noktası kayıtlı model sürümünün aşamasına göre oluşturulmuştur: Staging
veya Production
. Sunulan modellerinizi bu deneyimden geçirmek için bu davranışı yeni Model Sunma deneyiminde çoğaltabilirsiniz.
Bu bölümde, model sürümleri ve Production
model sürümleri için Staging
ayrı model sunum uç noktalarının nasıl oluşturulacağı gösterilmektedir. Aşağıdaki adımlar, sunulan modellerinizin her biri için hizmet veren uç noktalar API'siyle bunu nasıl gerçekleştireceğini gösterir.
Örnekte, kayıtlı model adının modelA
model aşamasında sürüm 1 ve model aşamasında Production
2 Staging
sürümü vardır.
Kayıtlı modeliniz için biri model sürümleri, diğeri
Staging
de model sürümleri içinProduction
iki uç nokta oluşturun.Model sürümleri için
Staging
:POST /api/2.0/serving-endpoints { "name":"modelA-Staging" "config": { "served_entities": [ { "entity_name":"model-A", "entity_version":"2", // Staging Model Version "workload_size":"Small", "scale_to_zero_enabled":true }, ], }, }
Model sürümleri için
Production
:POST /api/2.0/serving-endpoints { "name":"modelA-Production" "config": { "served_entities": [ { "entity_name":"model-A", "entity_version":"1", // Production Model Version "workload_size":"Small", "scale_to_zero_enabled":true }, ], }, }
Uç noktaların durumunu doğrulayın.
Hazırlama uç noktası için:
GET /api/2.0/serving-endpoints/modelA-Staging
Üretim uç noktası için:
GET /api/2.0/serving-endpoints/modelA-Production
Uç noktalar hazır olduktan sonra aşağıdakileri kullanarak uç noktayı sorgula:
Hazırlama uç noktası için:
POST /serving-endpoints/modelA-Staging/invocations
Üretim uç noktası için:
POST /serving-endpoints/modelA-Production/invocations
Uç noktayı model sürümü geçişlerine göre güncelleştirin.
Yeni model sürüm 3'in oluşturulduğu senaryoda, model sürüm 2'ye
Production
geçiş yapabilirken model sürüm 3'eStaging
geçiş yapabilir ve model sürüm 1'eArchived
geçebilirsiniz. Bu değişiklikler, uç noktaları sunan ayrı bir modele aşağıdaki gibi yansıtılabilir:Uç nokta için
Staging
uç noktayı içindeki yeni model sürümünü kullanacak şekilde güncelleştirinStaging
.PUT /api/2.0/serving-endpoints/modelA-Staging/config { "served_entities": [ { "entity_name":"model-A", "entity_version":"3", // New Staging model version "workload_size":"Small", "scale_to_zero_enabled":true }, ], }
Uç nokta için
Production
uç noktayı içindeki yeni model sürümünü kullanacak şekilde güncelleştirinProduction
.PUT /api/2.0/serving-endpoints/modelA-Production/config { "served_entities": [ { "entity_name":"model-A", "entity_version":"2", // New Production model version "workload_size":"Small", "scale_to_zero_enabled":true }, ], }
MozaikML çıkarım iş akışlarını Model Sunma'ya geçirme
Bu bölümde, MozaikML çıkarım dağıtımlarınızı Mozaik Yapay Zeka Modeli Sunma'ya geçirme hakkında rehberlik sağlanır ve bir not defteri örneği bulunur.
Aşağıdaki tabloda, MozaikML çıkarımı ile Azure Databricks'te hizmet veren model arasındaki eşlik özetlemektedir.
MozaikML Çıkarımı | Mozaik AI Modeli Sunma |
---|---|
create_inference_deployment | Uç nokta sunan bir model oluşturma |
update_inference_deployment | Uç noktaya hizmet veren modeli güncelleştirme |
delete_inference_deployment | Model sunma uç noktasını silme |
get_inference_deployment | Uç noktaya hizmet veren bir modelin durumunu alma |
Aşağıdaki not defteri, modeli MozaikML'den Mozaik Yapay Zeka Modeli Sunma'ya geçirmenin kılavuzlu bir llama-13b
örneğini sağlar.