Aracılığıyla paylaş


AksWebservice Sınıf

Azure Kubernetes Service'da web hizmeti uç noktası olarak dağıtılan makine öğrenmesi modelini temsil eder.

Dağıtılan hizmet model, betik ve ilişkili dosyalardan oluşturulur. Sonuçta elde edilen web hizmeti, REST API'ye sahip yük dengeli bir HTTP uç noktasıdır. Bu API'ye veri gönderebilir ve model tarafından döndürülen tahmini alabilirsiniz.

AksWebservice tek bir uç noktaya tek bir hizmet dağıtır. Bir uç noktaya birden çok hizmet dağıtmak için sınıfını AksEndpoint kullanın.

Daha fazla bilgi için bkz. Modeli Azure Kubernetes Service kümesine dağıtma.

Web hizmeti örneğini başlatın.

Web hizmeti oluşturucu, sağlanan çalışma alanıyla ilişkili bir Web hizmeti nesnesinin bulut gösterimini alır. Alınan Web hizmeti nesnesinin belirli türüne karşılık gelen bir alt sınıfın örneğini döndürür.

Devralma
AksWebservice

Oluşturucu

AksWebservice(workspace, name)

Parametreler

workspace
Workspace
Gerekli

Alınacak Web hizmeti nesnesini içeren çalışma alanı nesnesi.

name
str
Gerekli

Alınacak Web hizmeti nesnesinin adı.

Açıklamalar

Önerilen dağıtım düzeni, yöntemiyle deploy_configuration bir dağıtım yapılandırma nesnesi oluşturmak ve ardından aşağıda gösterildiği gibi sınıfın Model yöntemiyle deploy kullanmaktır.


   # Set the web service configuration (using default here)
   aks_config = AksWebservice.deploy_configuration()

   # # Enable token auth and disable (key) auth on the webservice
   # aks_config = AksWebservice.deploy_configuration(token_auth_enabled=True, auth_enabled=False)

Tam örnek şu kaynaktan edinilebilir: https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/deployment/production-deploy-to-aks/production-deploy-to-aks.ipynb

Modeli web hizmeti olarak dağıtmanın çeşitli yolları vardır; örneğin:

  • deployModel çalışma alanında kayıtlı olan modeller için yöntemi.

  • deploy_from_imageyöntemi.Webservice

  • deploy_from_modelWebservice çalışma alanında zaten kayıtlı olan modeller için yöntemi. Bu yöntem bir görüntü oluşturur.

  • deployWebservicemodeli kaydedecek ve bir görüntü oluşturacak olan yöntemini kullanır.

Web hizmetleriyle çalışma hakkında bilgi için bkz.

Değişkenler bölümünde, bulut AksWebservice nesnesinin yerel gösteriminin öznitelikleri listelenir. Bu değişkenler salt okunur olarak kabul edilmelidir. Değerlerinin değiştirilmesi ilgili bulut nesnesine yansıtılmaz.

Değişkenler

enable_app_insights
bool

Web hizmeti için AppInsights günlüğünün etkinleştirilip etkinleştirilmediği.

autoscaler
AutoScaler

Web hizmeti için Otomatik Ölçeklendirici nesnesi.

compute_name
str

Webhizmetinin dağıtılacağı ComputeTarget'in adı.

container_resource_requirements
ContainerResourceRequirements

Web hizmeti için kapsayıcı kaynak gereksinimleri.

liveness_probe_requirements
LivenessProbeRequirements

Web hizmeti için canlılık yoklaması gereksinimleri.

data_collection
DataCollection

Web hizmeti için DataCollection nesnesi.

max_concurrent_requests_per_container
int

Web hizmeti için kapsayıcı başına en fazla eşzamanlı istek sayısı.

max_request_wait_time
int

Web hizmeti için milisaniye cinsinden maksimum istek bekleme süresi.

num_replicas
int

Web hizmeti için çoğaltma sayısı. Her çoğaltma bir AKS pod'una karşılık gelir.

scoring_timeout_ms
int

Web hizmeti için milisaniye cinsinden puanlama zaman aşımı.

azureml.core.webservice.AksWebservice.scoring_uri
str

Web hizmeti için puanlama uç noktası

is_default
bool

Web hizmeti üst AksEndpoint için varsayılan sürümse.

traffic_percentile
int

Üst AksEndpoint'te Web hizmetine yönlendirecek trafiğin yüzdesi.

version_type
VersionType

Üst AksEndpoint'teki Web hizmeti için sürüm türü.

token_auth_enabled
bool

Web hizmeti için belirteç kimlik doğrulamasının etkinleştirilip etkinleştirilmediği.

environment
Environment

Web hizmetini oluşturmak için kullanılan Ortam nesnesi.

azureml.core.webservice.AksWebservice.models
list[Model]

Webservice'e dağıtılan Modellerin listesi.

deployment_status
str

Web hizmeti dağıtım durumu.

namespace
str

Web hizmeti AKS ad alanı.

azureml.core.webservice.AksWebservice.swagger_uri
str

Web hizmeti için swagger uç noktası.

Yöntemler

add_properties

Bu Web hizmeti özellikleri sözlüğüne anahtar değer çiftleri ekleyin.

add_tags

Bu Web hizmeti etiketleri sözlüğüne anahtar değer çiftleri ekleyin.

bir WebserviceExceptionoluşturur.

deploy_configuration

AKS işlem hedefine dağıtmak için bir yapılandırma nesnesi oluşturun.

get_access_token

Bu Web hizmeti için kimlik doğrulama belirtecini alın.

get_token

KALDIRIL -MIŞ. Bunun yerine yöntemini kullanın get_access_token .

Bu Web hizmeti için kimlik doğrulama belirtecini alın.

remove_tags

Belirtilen anahtarları bu Web hizmetindeki etiket sözlüğünden kaldırın.

run

Sağlanan girişle bu Web hizmetini çağırın.

serialize

Bu Web hizmetini JSON serileştirilmiş sözlüğe dönüştürün.

update

Sağlanan özelliklerle Web hizmetini güncelleştirin.

Hiçbiri olarak bırakılan değerler bu Web hizmetindeki değişmeden kalır.

add_properties

Bu Web hizmeti özellikleri sözlüğüne anahtar değer çiftleri ekleyin.

add_properties(properties)

Parametreler

properties
dict[str, str]
Gerekli

Eklenecek özelliklerin sözlüğü.

add_tags

Bu Web hizmeti etiketleri sözlüğüne anahtar değer çiftleri ekleyin.

bir WebserviceExceptionoluşturur.

add_tags(tags)

Parametreler

tags
dict[str, str]
Gerekli

Eklenecek etiketlerin sözlüğü.

Özel durumlar

deploy_configuration

AKS işlem hedefine dağıtmak için bir yapılandırma nesnesi oluşturun.

static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None, blobfuse_enabled=None)

Parametreler

autoscale_enabled
bool
varsayılan değer: None

Bu Web hizmeti için otomatik ölçeklendirmenin etkinleştirilip etkinleştirilmeyileceği. num_replicas Yok ise varsayılan olarak True olur.

autoscale_min_replicas
int
varsayılan değer: None

Bu Web hizmetini otomatik olarak ölçeklerken kullanılacak en az kapsayıcı sayısı. Varsayılan değer 1'tir.

autoscale_max_replicas
int
varsayılan değer: None

Bu Web hizmetini otomatik ölçeklendirme sırasında kullanılacak kapsayıcı sayısı üst sınırı. Varsayılan değer 10'dır.

autoscale_refresh_seconds
int
varsayılan değer: None

Otomatik ölçeklendiricinin bu Web hizmetini ölçeklendirmeye çalışma sıklıkları. Varsayılan değer 1'tir.

autoscale_target_utilization
int
varsayılan değer: None

Otomatik ölçeklendiricinin bu Web hizmeti için korumayı denemesi gereken hedef kullanım (100'ün yüzdesinde). Varsayılan değer 70'tir.

collect_model_data
bool
varsayılan değer: None

Bu Web hizmeti için model veri toplamanın etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer False'tur.

auth_enabled
bool
varsayılan değer: None

Bu Web hizmeti için anahtar kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer True'dır.

cpu_cores
float
varsayılan değer: None

Bu Web hizmeti için ayrılacak cpu çekirdeği sayısı. Ondalık olabilir. Varsayılan olarak 0.1'i kullanır. Azure Kubernetes Service'daki sınıra değil pod çekirdeği isteğine karşılık gelir.

memory_gb
float
varsayılan değer: None

Bu Web hizmeti için ayrılacak bellek miktarı (GB cinsinden). Ondalık olabilir. Varsayılan değer 0,5'tir. Azure Kubernetes Service'daki sınıra değil pod bellek isteğine karşılık gelir.

enable_app_insights
bool
varsayılan değer: None

Bu Web hizmeti için Application Insights günlüğünün etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer False'tur.

scoring_timeout_ms
int
varsayılan değer: None

Bu Web hizmetine yapılan puanlama çağrıları için zorlanması gereken zaman aşımı. Varsayılan değer 60000'tir.

replica_max_concurrent_requests
int
varsayılan değer: None

Bu Web hizmeti için izin verilen çoğaltma başına en fazla eşzamanlı istek sayısı. Varsayılan değer 1'tir. Microsoft Teknik Destek veya Azure Machine Learning ekibinin bir üyesi tarafından belirtilmediği sürece bu ayarı varsayılan değer olan 1'den değiştirmeyin.

max_request_wait_time
int
varsayılan değer: None

Bir isteğin 503 hatası döndürmeden önce kuyrukta kalacağı (milisaniye cinsinden) maksimum süre. Varsayılan değer 500'dır.

num_replicas
int
varsayılan değer: None

Bu Web hizmeti için ayrılacak kapsayıcı sayısı. Varsayılan değildir, bu parametre ayarlanmadıysa otomatik ölçeklendirici varsayılan olarak etkinleştirilir.

primary_key
str
varsayılan değer: None

Bu Web hizmeti için kullanılacak birincil kimlik doğrulama anahtarı.

secondary_key
str
varsayılan değer: None

Bu Web hizmeti için kullanılacak ikincil kimlik doğrulama anahtarı.

tags
dict[str, str]
varsayılan değer: None

Bu Web hizmetini vermek için anahtar değer etiketleri sözlüğü.

properties
dict[str, str]
varsayılan değer: None

Bu Web hizmetini vermek için anahtar değeri özelliklerinin sözlüğü. Bu özellikler dağıtımdan sonra değiştirilemez, ancak yeni anahtar değer çiftleri eklenebilir.

description
str
varsayılan değer: None

Bu Web hizmetini vermek için bir açıklama.

gpu_cores
int
varsayılan değer: None

Bu Web hizmeti için ayrılacak GPU çekirdeği sayısı. Varsayılan değer 0'dır.

period_seconds
int
varsayılan değer: None

Canlılık araştırmasını gerçekleştirme sıklığı (saniye cinsinden). Varsayılan olarak 10 saniyedir. En düşük değer 1'dir.

initial_delay_seconds
int
varsayılan değer: None

Canlılık yoklamaları başlatılmadan önce kapsayıcı başlatıldıktan sonraki saniye sayısı. Varsayılan değer 310'dır.

timeout_seconds
int
varsayılan değer: None

Canlılık araştırmasının zaman aşımına uğradıktan sonra geçmesi gereken saniye sayısı. Varsayılan değer 2 saniyedir. En düşük değer 1'dir.

success_threshold
int
varsayılan değer: None

Canlılık araştırması için ardışık en düşük başarılar başarısız olduktan sonra başarılı olarak kabul edilir. Varsayılan değer 1'tir. En düşük değer 1'dir.

failure_threshold
int
varsayılan değer: None

Bir Pod başlatıldığında ve canlılık yoklaması başarısız olduğunda Kubernetes vazgeçmeden önce failureThreshold sürelerini dener. Varsayılan değer 3'tir. En düşük değer 1'dir.

namespace
str
varsayılan değer: None

Bu Web hizmetinin dağıtılacağı Kubernetes ad alanı: en fazla 63 küçük harf alfasayısal ('a'-'z', '0'-'9') ve kısa çizgi ('-') karakter. İlk ve son karakterler kısa çizgi olamaz.

token_auth_enabled
bool
varsayılan değer: None

Bu Web hizmeti için Belirteç kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Bu etkinleştirilirse, kullanıcılar Azure Active Directory kimlik bilgilerini kullanarak bir erişim belirteci getirerek bu Web hizmeti'ne erişebilir. Varsayılan değer False'tur.

compute_target_name
str
varsayılan değer: None

Dağıtılacak işlem hedefinin adı

cpu_cores_limit
float
varsayılan değer: None

Bu Web hizmetini kullanmasına izin verilen en fazla cpu çekirdeği sayısı. Ondalık olabilir.

memory_gb_limit
float
varsayılan değer: None

Bu Web hizmetini kullanmasına izin verilen maksimum bellek miktarı (GB cinsinden). Ondalık olabilir.

blobfuse_enabled
bool
varsayılan değer: None

Bu Web hizmeti için model indirme için blobfuse'un etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer True'dır

Döndürülenler

AksWebservice dağıtırken kullanılacak yapılandırma nesnesi.

Dönüş türü

Özel durumlar

get_access_token

Bu Web hizmeti için kimlik doğrulama belirtecini alın.

get_access_token()

Döndürülenler

Bu Web hizmeti için kimlik doğrulama belirtecini açıklayan bir nesne.

Dönüş türü

Özel durumlar

get_token

KALDIRIL -MIŞ. Bunun yerine yöntemini kullanın get_access_token .

Bu Web hizmeti için kimlik doğrulama belirtecini alın.

get_token()

Döndürülenler

Bu Web hizmeti için kimlik doğrulama belirteci ve ne zaman yenilenmesi gerekir.

Dönüş türü

Özel durumlar

remove_tags

Belirtilen anahtarları bu Web hizmetindeki etiket sözlüğünden kaldırın.

remove_tags(tags)

Parametreler

tags
list[str]
Gerekli

Kaldırılacak anahtarların listesi

run

Sağlanan girişle bu Web hizmetini çağırın.

run(input_data)

Parametreler

input_data
<xref:varies>
Gerekli

Ile Web hizmetini çağırmak için giriş

Döndürülenler

Web hizmetini çağırmanın sonucu

Dönüş türü

Özel durumlar

serialize

Bu Web hizmetini JSON serileştirilmiş sözlüğe dönüştürün.

serialize()

Döndürülenler

Bu Web hizmetini JSON gösterimi.

Dönüş türü

update

Sağlanan özelliklerle Web hizmetini güncelleştirin.

Hiçbiri olarak bırakılan değerler bu Web hizmetindeki değişmeden kalır.

update(image=None, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, cpu_cores_limit=None, memory_gb_limit=None, **kwargs)

Parametreler

image
Image
varsayılan değer: None

Webhizmetine dağıtılacak yeni görüntü

autoscale_enabled
bool
varsayılan değer: None

Bu Web hizmetini otomatik ölçeklendirmeyi etkinleştir veya devre dışı bırak

autoscale_min_replicas
int
varsayılan değer: None

Bu Web hizmetini otomatik olarak ölçeklerken kullanılacak en az kapsayıcı sayısı

autoscale_max_replicas
int
varsayılan değer: None

Bu Web hizmetini otomatik ölçeklerken kullanılacak kapsayıcı sayısı üst sınırı

autoscale_refresh_seconds
int
varsayılan değer: None

Otomatik ölçeklendiricinin bu Web hizmetini ölçeklendirmeyi ne sıklıkta denemesi gerekir?

autoscale_target_utilization
int
varsayılan değer: None

Otomatik ölçeklendiricinin bu Web hizmeti için korumayı denemesi gereken hedef kullanım (yüzde 100'de)

collect_model_data
bool
varsayılan değer: None

Bu Web hizmeti için model veri toplamayı etkinleştirme veya devre dışı bırakma

auth_enabled
bool
varsayılan değer: None

Bu Web hizmeti için kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği

cpu_cores
float
varsayılan değer: None

Bu Web hizmeti için ayrılacak cpu çekirdeği sayısı. Ondalık olabilir

memory_gb
float
varsayılan değer: None

Bu Web hizmeti için ayrılacak bellek miktarı (GB cinsinden). Ondalık olabilir

enable_app_insights
bool
varsayılan değer: None

Bu Web hizmeti için Application Insights günlüğünün etkinleştirilip etkinleştirilmeyileceği

scoring_timeout_ms
int
varsayılan değer: None

Bu Web hizmetine yapılan puanlama çağrıları için zorunlu kılınacak zaman aşımı

replica_max_concurrent_requests
int
varsayılan değer: None

Bu Web hizmeti için izin verilen çoğaltma başına en fazla eşzamanlı istek sayısı.

max_request_wait_time
int
varsayılan değer: None

Bir isteğin 503 hatası döndürmeden önce kuyrukta (milisaniye cinsinden) kalacağı en uzun süre

num_replicas
int
varsayılan değer: None

Bu Web hizmeti için ayrılacak kapsayıcı sayısı

tags
dict[str, str]
varsayılan değer: None

Bu Web hizmetini vermek için anahtar değer etiketleri sözlüğü. Mevcut etiketlerin yerini alır.

properties
dict[str, str]
varsayılan değer: None

Var olan özellikler sözlüğüne eklenecek anahtar değeri özellikleri sözlüğü

description
str
varsayılan değer: None

Bu Web hizmetini vermek için bir açıklama

models
list[Model]
varsayılan değer: None

Güncelleştirilmiş hizmetle paketlenecek Model nesnelerinin listesi

inference_config
InferenceConfig
varsayılan değer: None

Gerekli model dağıtım özelliklerini sağlamak için kullanılan inferenceConfig nesnesi.

gpu_cores
int
varsayılan değer: None

Bu Web hizmeti için ayrılacak gpu çekirdeği sayısı

period_seconds
int
varsayılan değer: None

Canlılık araştırmasını gerçekleştirme sıklığını (saniye olarak). Varsayılan olarak 10 saniyedir. En düşük değer 1'dir.

initial_delay_seconds
int
varsayılan değer: None

Canlılık yoklamaları başlatılmadan önce kapsayıcı başlatıldıktan sonraki saniye sayısı.

timeout_seconds
int
varsayılan değer: None

Canlılık yoklamasının zaman aşımına uğradıktan sonraki saniye sayısı. Varsayılan değer 1 saniyedir. En düşük değer 1'dir.

success_threshold
int
varsayılan değer: None

Canlılık araştırmasının başarısız olduktan sonra başarılı olarak kabul edilmesi için en düşük ardışık başarılar. Varsayılan olarak 1'e ayarlanır. En düşük değer 1'dir.

failure_threshold
int
varsayılan değer: None

Pod başlatıldığında ve canlılık yoklaması başarısız olduğunda Kubernetes, vazgeçmeden önce failureThreshold sürelerini dener. Varsayılan değer 3'tir. En düşük değer 1'dir.

namespace
str
varsayılan değer: None

Bu Web hizmetinin dağıtılacağı Kubernetes ad alanı: en fazla 63 küçük alfasayısal ('a'-'z', '0'-'9') ve kısa çizgi ('-') karakterleri. İlk ve son karakterler kısa çizgi olamaz.

token_auth_enabled
bool
varsayılan değer: None

Bu Web hizmeti için Belirteç kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Bu etkinleştirilirse, kullanıcılar Azure Active Directory kimlik bilgilerini kullanarak erişim belirtecini getirerek bu Web hizmeti'ne erişebilir. Varsayılan değer False'tur

cpu_cores_limit
float
varsayılan değer: None

Bu Web hizmetini kullanmasına izin verilen en fazla cpu çekirdeği sayısı. Ondalık olabilir.

memory_gb_limit
float
varsayılan değer: None

Bu Web hizmetini kullanmasına izin verilen maksimum bellek miktarı (GB cinsinden). Ondalık olabilir.

kwargs
<xref:varies>
Gerekli

AKS web hizmetinin Kubernetes çevrimiçi uç noktasına ve dağıtımına geçirilmesini desteklemek için parametreleri dahil edin. is_migration=Doğru| False, compute_target=.

Özel durumlar