AksWebservice Sınıf
Azure Kubernetes Service üzerinde web hizmeti uç noktası olarak dağıtılan bir makine öğrenmesi modelini temsil eder.
Dağıtılan hizmet model, betik ve ilişkili dosyalardan oluşturulur. Sonuçta elde edilen web hizmeti, REST API'ye sahip yük dengeli bir HTTP uç noktasıdır. Bu API'ye veri gönderebilir ve model tarafından döndürülen tahmini alabilirsiniz.
AksWebservice tek bir uç noktaya tek bir hizmet dağıtır. Bir uç noktaya birden çok hizmet dağıtmak için sınıfını AksEndpoint kullanın.
Daha fazla bilgi için bkz. Azure Kubernetes Service kümesine model dağıtma.
Web hizmeti örneğini başlatın.
Web hizmeti oluşturucu, sağlanan çalışma alanıyla ilişkili bir Web hizmeti nesnesinin bulut gösterimini alır. Alınan Web hizmeti nesnesinin belirli türüne karşılık gelen bir alt sınıfın örneğini döndürür.
- Devralma
-
AksWebservice
Oluşturucu
AksWebservice(workspace, name)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Alınacak Web hizmeti nesnesini içeren çalışma alanı nesnesi. |
name
Gerekli
|
Alınacak Web hizmeti nesnesinin adı. |
Açıklamalar
Önerilen dağıtım düzeni, yöntemiyle deploy_configuration
bir dağıtım yapılandırma nesnesi oluşturmak ve ardından aşağıda gösterildiği gibi sınıfın Model yöntemiyle deploy
kullanmaktır.
# Set the web service configuration (using default here)
aks_config = AksWebservice.deploy_configuration()
# # Enable token auth and disable (key) auth on the webservice
# aks_config = AksWebservice.deploy_configuration(token_auth_enabled=True, auth_enabled=False)
Tam örnek şu kaynaktan edinilebilir: https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/deployment/production-deploy-to-aks/production-deploy-to-aks.ipynb
Modeli web hizmeti olarak dağıtmak için aşağıdakiler dahil olmak üzere çeşitli yollar vardır:
deploy
Model çalışma alanında zaten kayıtlı olan modeller için yöntemi.deploy_from_image
yöntemi.Webservicedeploy_from_model
Webservice çalışma alanında kayıtlı olan modeller için yöntemi. Bu yöntem bir görüntü oluşturur.deploy
Webservicemodeli kaydedecek ve bir görüntü oluşturacak olan yöntemini kullanır.
Web hizmetleriyle çalışma hakkında bilgi için bkz.
Değişkenler bölümünde, bulut AksWebservice nesnesinin yerel gösteriminin öznitelikleri listelenir. Bu değişkenler salt okunur olarak kabul edilmelidir. Değerlerinin değiştirilmesi ilgili bulut nesnesine yansıtılmaz.
Değişkenler
Name | Description |
---|---|
enable_app_insights
|
Web hizmeti için AppInsights günlüğünün etkinleştirilip etkinleştirilmediği. |
autoscaler
|
Web hizmeti için Otomatik Ölçeklendirici nesnesi. |
compute_name
|
Webhizmetinin dağıtılacağı ComputeTarget'in adı. |
container_resource_requirements
|
Web hizmeti için kapsayıcı kaynak gereksinimleri. |
liveness_probe_requirements
|
Web hizmeti için canlılık yoklaması gereksinimleri. |
data_collection
|
Web hizmeti için DataCollection nesnesi. |
max_concurrent_requests_per_container
|
Web hizmeti için kapsayıcı başına en fazla eşzamanlı istek sayısı. |
max_request_wait_time
|
Web hizmeti için milisaniye cinsinden istek bekleme süresi üst sınırı. |
num_replicas
|
Web hizmeti için çoğaltma sayısı. Her çoğaltma bir AKS pod'una karşılık gelir. |
scoring_timeout_ms
|
Web hizmeti için milisaniye cinsinden puanlama zaman aşımı. |
azureml.core.webservice.AksWebservice.scoring_uri
|
Web hizmeti için puanlama uç noktası |
is_default
|
Web hizmeti üst AksEndpoint için varsayılan sürümse. |
traffic_percentile
|
Üst AksEndpoint'te Web hizmetine yönlendirecek trafiğin yüzdesi. |
version_type
|
Üst AksEndpoint'teki Web hizmeti için sürüm türü. |
token_auth_enabled
|
Web hizmeti için belirteç kimlik doğrulamasının etkinleştirilip etkinleştirilmediği. |
environment
|
Web hizmetini oluşturmak için kullanılan Ortam nesnesi. |
azureml.core.webservice.AksWebservice.models
|
Webservice'e dağıtılan Modellerin listesi. |
deployment_status
|
Web hizmeti dağıtım durumu. |
namespace
|
Web hizmeti AKS ad alanı. |
azureml.core.webservice.AksWebservice.swagger_uri
|
Web hizmeti için swagger uç noktası. |
Yöntemler
add_properties |
Bu Web hizmeti özellikleri sözlüğüne anahtar değer çiftleri ekleyin. |
add_tags |
Bu Web hizmeti etiketleri sözlüğüne anahtar değer çiftleri ekleyin. bir WebserviceExceptionoluşturur. |
deploy_configuration |
AKS işlem hedefine dağıtmak için bir yapılandırma nesnesi oluşturun. |
get_access_token |
Bu Web hizmeti için kimlik doğrulama belirtecini alın. |
get_token |
KALDIRIL -MIŞ. Bunun yerine yöntemini kullanın Bu Web hizmeti için kimlik doğrulama belirtecini alın. |
remove_tags |
Belirtilen anahtarları bu Web hizmetindeki etiket sözlüğünden kaldırın. |
run |
Sağlanan girişle bu Web hizmetini çağırın. |
serialize |
Bu Web hizmetini JSON serileştirilmiş sözlüğüne dönüştürün. |
update |
Web hizmetini sağlanan özelliklerle güncelleştirin. Hiçbiri olarak bırakılan değerler bu Web hizmetindeki değişmeden kalır. |
add_properties
Bu Web hizmeti özellikleri sözlüğüne anahtar değer çiftleri ekleyin.
add_properties(properties)
Parametreler
Name | Description |
---|---|
properties
Gerekli
|
Eklenecek özelliklerin sözlüğü. |
add_tags
Bu Web hizmeti etiketleri sözlüğüne anahtar değer çiftleri ekleyin.
bir WebserviceExceptionoluşturur.
add_tags(tags)
Parametreler
Name | Description |
---|---|
tags
Gerekli
|
Eklenecek etiketlerin sözlüğü. |
Özel durumlar
Tür | Description |
---|---|
deploy_configuration
AKS işlem hedefine dağıtmak için bir yapılandırma nesnesi oluşturun.
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None, blobfuse_enabled=None)
Parametreler
Name | Description |
---|---|
autoscale_enabled
|
Bu Web hizmeti için otomatik ölçeklendirmenin etkinleştirilip etkinleştirilmeyileceği. num_replicas Yok ise varsayılan olarak True olur. Default value: None
|
autoscale_min_replicas
|
Bu Web hizmetini otomatik olarak ölçeklerken kullanılacak en az kapsayıcı sayısı. Varsayılan değer 1'tir. Default value: None
|
autoscale_max_replicas
|
Bu Web hizmetini otomatik ölçeklendirme sırasında kullanılacak kapsayıcı sayısı üst sınırı. Varsayılan değer 10'dır. Default value: None
|
autoscale_refresh_seconds
|
Otomatik ölçeklendiricinin bu Web hizmetini ölçeklendirmeye çalışma sıklıkları. Varsayılan değer 1'tir. Default value: None
|
autoscale_target_utilization
|
Otomatik ölçeklendiricinin bu Web hizmeti için korumayı denemesi gereken hedef kullanım (100'ün yüzdesinde). Varsayılan değer 70'tir. Default value: None
|
collect_model_data
|
Bu Web hizmeti için model veri toplamanın etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer False'tur. Default value: None
|
auth_enabled
|
Bu Web hizmeti için anahtar kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer True'dır. Default value: None
|
cpu_cores
|
Bu Web hizmeti için ayrılacak cpu çekirdeği sayısı. Ondalık olabilir. Varsayılan olarak 0.1'i kullanır. Azure Kubernetes Service'daki sınıra değil pod çekirdeği isteğine karşılık gelir. Default value: None
|
memory_gb
|
Bu Web hizmeti için ayrılacak bellek miktarı (GB cinsinden). Ondalık olabilir. Varsayılan değer 0,5'tir. Azure Kubernetes Service'daki sınıra değil pod bellek isteğine karşılık gelir. Default value: None
|
enable_app_insights
|
Bu Web hizmeti için Application Insights günlüğünün etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer False'tur. Default value: None
|
scoring_timeout_ms
|
Bu Web hizmetine yapılan puanlama çağrıları için zorlanması gereken zaman aşımı. Varsayılan değer 60000'tir. Default value: None
|
replica_max_concurrent_requests
|
Bu Web hizmeti için izin verilen çoğaltma başına en fazla eşzamanlı istek sayısı. Varsayılan değer 1'tir. Microsoft Teknik Destek veya Azure Machine Learning ekibinin bir üyesi tarafından belirtilmediği sürece bu ayarı varsayılan değer olan 1'den değiştirmeyin. Default value: None
|
max_request_wait_time
|
Bir isteğin 503 hatası döndürmeden önce kuyrukta kalacağı (milisaniye cinsinden) maksimum süre. Varsayılan değer 500'dır. Default value: None
|
num_replicas
|
Bu Web hizmeti için ayrılacak kapsayıcı sayısı. Varsayılan değildir, bu parametre ayarlanmadıysa otomatik ölçeklendirici varsayılan olarak etkinleştirilir. Default value: None
|
primary_key
|
Bu Web hizmeti için kullanılacak birincil kimlik doğrulama anahtarı. Default value: None
|
secondary_key
|
Bu Web hizmeti için kullanılacak ikincil kimlik doğrulama anahtarı. Default value: None
|
tags
|
Bu Web hizmetini vermek için anahtar değer etiketleri sözlüğü. Default value: None
|
properties
|
Bu Web hizmetini vermek için anahtar değeri özelliklerinin sözlüğü. Bu özellikler dağıtımdan sonra değiştirilemez, ancak yeni anahtar değer çiftleri eklenebilir. Default value: None
|
description
|
Bu Web hizmetini vermek için bir açıklama. Default value: None
|
gpu_cores
|
Bu Web hizmeti için ayrılacak GPU çekirdeği sayısı. Varsayılan değer 0'dır. Default value: None
|
period_seconds
|
Canlılık araştırmasını gerçekleştirme sıklığı (saniye cinsinden). Varsayılan olarak 10 saniyedir. En düşük değer 1'dir. Default value: None
|
initial_delay_seconds
|
Canlılık yoklamaları başlatılmadan önce kapsayıcı başlatıldıktan sonraki saniye sayısı. Varsayılan değer 310'dır. Default value: None
|
timeout_seconds
|
Canlılık araştırmasının zaman aşımına uğradıktan sonra geçmesi gereken saniye sayısı. Varsayılan değer 2 saniyedir. En düşük değer 1'dir. Default value: None
|
success_threshold
|
Canlılık araştırması için ardışık en düşük başarılar başarısız olduktan sonra başarılı olarak kabul edilir. Varsayılan değer 1'tir. En düşük değer 1'dir. Default value: None
|
failure_threshold
|
Bir Pod başlatıldığında ve canlılık yoklaması başarısız olduğunda Kubernetes vazgeçmeden önce failureThreshold sürelerini dener. Varsayılan değer 3'tir. En düşük değer 1'dir. Default value: None
|
namespace
|
Bu Web hizmetinin dağıtılacağı Kubernetes ad alanı: en fazla 63 küçük harf alfasayısal ('a'-'z', '0'-'9') ve kısa çizgi ('-') karakter. İlk ve son karakterler kısa çizgi olamaz. Default value: None
|
token_auth_enabled
|
Bu Web hizmeti için Belirteç kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Bu etkinleştirilirse, kullanıcılar Azure Active Directory kimlik bilgilerini kullanarak bir erişim belirteci getirerek bu Web hizmeti'ne erişebilir. Varsayılan değer False'tur. Default value: None
|
compute_target_name
|
Dağıtılacak işlem hedefinin adı Default value: None
|
cpu_cores_limit
|
Bu Web hizmetini kullanmasına izin verilen en fazla cpu çekirdeği sayısı. Ondalık olabilir. Default value: None
|
memory_gb_limit
|
Bu Web hizmeti için en fazla bellek miktarı (GB cinsinden) kullanılabilir. Ondalık olabilir. Default value: None
|
blobfuse_enabled
|
Bu Web hizmeti için model indirme için blobfuse'un etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer True'dır Default value: None
|
Döndürülenler
Tür | Description |
---|---|
AksWebservice dağıtırken kullanılacak yapılandırma nesnesi. |
Özel durumlar
Tür | Description |
---|---|
get_access_token
Bu Web hizmeti için kimlik doğrulama belirtecini alın.
get_access_token()
Döndürülenler
Tür | Description |
---|---|
Bu Web hizmeti için kimlik doğrulama belirtecini açıklayan bir nesne. |
Özel durumlar
Tür | Description |
---|---|
get_token
KALDIRIL -MIŞ. Bunun yerine yöntemini kullanın get_access_token
.
Bu Web hizmeti için kimlik doğrulama belirtecini alın.
get_token()
Döndürülenler
Tür | Description |
---|---|
Bu Web hizmeti için kimlik doğrulama belirteci ve ne zaman yenilenmesi gerekir. |
Özel durumlar
Tür | Description |
---|---|
remove_tags
Belirtilen anahtarları bu Web hizmetindeki etiket sözlüğünden kaldırın.
remove_tags(tags)
Parametreler
Name | Description |
---|---|
tags
Gerekli
|
Kaldırılacak anahtarların listesi |
run
Sağlanan girişle bu Web hizmetini çağırın.
run(input_data)
Parametreler
Name | Description |
---|---|
input_data
Gerekli
|
<xref:varies>
Ile Web hizmetini çağırmak için giriş |
Döndürülenler
Tür | Description |
---|---|
Web hizmetini çağırmanın sonucu |
Özel durumlar
Tür | Description |
---|---|
serialize
Bu Web hizmetini JSON serileştirilmiş sözlüğüne dönüştürün.
serialize()
Döndürülenler
Tür | Description |
---|---|
Bu Web hizmetini JSON gösterimi. |
update
Web hizmetini sağlanan özelliklerle güncelleştirin.
Hiçbiri olarak bırakılan değerler bu Web hizmetindeki değişmeden kalır.
update(image=None, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, cpu_cores_limit=None, memory_gb_limit=None, **kwargs)
Parametreler
Name | Description |
---|---|
image
|
Webservice'e dağıtılacak yeni görüntü Default value: None
|
autoscale_enabled
|
Bu Web hizmetini otomatik ölçeklendirmeyi etkinleştirme veya devre dışı bırakma Default value: None
|
autoscale_min_replicas
|
Bu Web hizmetini otomatik ölçeklendirme sırasında kullanılacak en az kapsayıcı sayısı Default value: None
|
autoscale_max_replicas
|
Bu Web hizmetini otomatik ölçeklendirme sırasında kullanılacak kapsayıcı sayısı üst sınırı Default value: None
|
autoscale_refresh_seconds
|
Otomatik ölçeklendiricinin bu Web hizmetini ölçeklendirmeye çalışma sıklıkları Default value: None
|
autoscale_target_utilization
|
Otomatik ölçeklendiricinin bu Web hizmeti için korumayı denemesi gereken hedef kullanım (100'ün yüzdesinde) Default value: None
|
collect_model_data
|
Bu Web hizmeti için model veri toplamayı etkinleştir veya devre dışı bırak Default value: None
|
auth_enabled
|
Bu Web hizmeti için kimlik doğrulamasının etkinleştirilip etkinleştirilmeydiği Default value: None
|
cpu_cores
|
Bu Web hizmeti için ayrılacak cpu çekirdeği sayısı. Ondalık olabilir Default value: None
|
memory_gb
|
Bu Web hizmeti için ayrılacak bellek miktarı (GB cinsinden). Ondalık olabilir Default value: None
|
enable_app_insights
|
Bu Web hizmeti için Application Insights günlüğünün etkinleştirilip etkinleştirilmeydiği Default value: None
|
scoring_timeout_ms
|
Bu Web hizmetine yapılan puanlama çağrılarını zorlamak için zaman aşımı Default value: None
|
replica_max_concurrent_requests
|
Bu Web hizmeti için izin verilen çoğaltma başına en fazla eşzamanlı istek sayısı. Default value: None
|
max_request_wait_time
|
Bir isteğin 503 hatası döndürmeden önce kuyrukta kalacağı (milisaniye cinsinden) maksimum süre Default value: None
|
num_replicas
|
Bu Web hizmeti için ayrılacak kapsayıcı sayısı Default value: None
|
tags
|
Bu Web hizmetini vermek için anahtar değer etiketleri sözlüğü. Mevcut etiketlerin yerini alır. Default value: None
|
properties
|
Mevcut özellikler sözlüğüne eklenecek anahtar değeri özellikleri sözlüğü Default value: None
|
description
|
Bu Web hizmetini vermek için bir açıklama Default value: None
|
models
|
Güncelleştirilmiş hizmetle paketlenecek Model nesnelerinin listesi Default value: None
|
inference_config
|
Gerekli model dağıtım özelliklerini sağlamak için kullanılan bir InferenceConfig nesnesi. Default value: None
|
gpu_cores
|
Bu Web hizmeti için ayrılacak gpu çekirdeği sayısı Default value: None
|
period_seconds
|
Canlılık araştırmasını gerçekleştirme sıklığı (saniye cinsinden). Varsayılan olarak 10 saniyedir. En düşük değer 1'dir. Default value: None
|
initial_delay_seconds
|
Canlılık yoklamaları başlatılmadan önce kapsayıcı başlatıldıktan sonraki saniye sayısı. Default value: None
|
timeout_seconds
|
Canlılık araştırmasının zaman aşımına uğradıktan sonra geçmesi gereken saniye sayısı. Varsayılan değer 1 saniyedir. En düşük değer 1'dir. Default value: None
|
success_threshold
|
Canlılık araştırması için ardışık en düşük başarılar başarısız olduktan sonra başarılı olarak kabul edilir. Varsayılan değer 1'tir. En düşük değer 1'dir. Default value: None
|
failure_threshold
|
Bir Pod başlatıldığında ve canlılık yoklaması başarısız olduğunda Kubernetes vazgeçmeden önce failureThreshold sürelerini dener. Varsayılan değer 3'tir. En düşük değer 1'dir. Default value: None
|
namespace
|
Bu Web hizmetinin dağıtılacağı Kubernetes ad alanı: en fazla 63 küçük harf alfasayısal ('a'-'z', '0'-'9') ve kısa çizgi ('-') karakter. İlk ve son karakterler kısa çizgi olamaz. Default value: None
|
token_auth_enabled
|
Bu Web hizmeti için Belirteç kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Bu etkinleştirilirse, kullanıcılar Azure Active Directory kimlik bilgilerini kullanarak erişim belirtecini getirerek bu Web hizmeti'ne erişebilir. Varsayılan değer False'tur Default value: None
|
cpu_cores_limit
|
Bu Web hizmetini kullanmasına izin verilen en fazla cpu çekirdeği sayısı. Ondalık olabilir. Default value: None
|
memory_gb_limit
|
Bu Web hizmeti için en fazla bellek miktarı (GB cinsinden) kullanılabilir. Ondalık olabilir. Default value: None
|
kwargs
Gerekli
|
<xref:varies>
AKS web hizmetinin Kubernetes çevrimiçi uç noktasına ve dağıtımına geçirilmesini desteklemek için parametreleri dahil edin. is_migration=Doğru| False, compute_target=. |
Özel durumlar
Tür | Description |
---|---|