AksEndpoint Sınıf
Not
Bu deneysel bir sınıftır ve herhangi bir zamanda değişebilir. Daha fazla bilgi için lütfen bkz. https://aka.ms/azuremlexperimental.
Azure Kubernetes Service üzerinde çalışan aynı uç noktanın arkasındaki web hizmeti sürümlerinin bir koleksiyonunu temsil eder.
tek AksWebservice bir puanlama uç noktasıyla tek bir hizmet dağıtırken, AksEndpoint sınıfı aynı puanlama uç noktasının arkasında birden çok web hizmeti sürümü dağıtmanızı sağlar. Her web hizmeti sürümü trafiğin bir yüzdesine hizmet vermek üzere yapılandırılabilir, böylece modelleri denetimli bir şekilde dağıtabilirsiniz( örneğin, A/B testi için). AksEndpoint, AksWebservice'e benzer bir model nesnesinden dağıtıma izin verir.
Web hizmeti örneğini başlatın.
Web hizmeti oluşturucu, sağlanan çalışma alanıyla ilişkili bir Web hizmeti nesnesinin bulut gösterimini alır. Alınan Web hizmeti nesnesinin belirli türüne karşılık gelen bir alt sınıfın örneğini döndürür.
- Devralma
-
AksEndpoint
Oluşturucu
AksEndpoint(workspace, name)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Alınacak Web hizmeti nesnesini içeren çalışma alanı nesnesi. |
name
Gerekli
|
Alınacak Web hizmeti nesnesinin adı. |
Değişkenler
Name | Description |
---|---|
versions
|
Sürüm nesnesine sürüm adı sözlüğü. Bu Uç Noktanın bir parçası olarak dağıtılan tüm sürümleri içerir. |
Yöntemler
create_version |
Sağlanan özelliklerle uç noktaya yeni bir sürüm ekleyin. |
delete_version |
Uç Nokta'daki bir sürümü silin. |
deploy_configuration |
AKS işlem hedefine dağıtmak için bir yapılandırma nesnesi oluşturun. |
serialize |
Bu Web hizmetini JSON serileştirilmiş sözlüğe dönüştürün. |
update |
Uç Noktayı sağlanan özelliklerle güncelleştirin. Hiçbiri olarak bırakılan değerler bu Uç Noktada değişmeden kalır |
update_version |
Sağlanan özelliklerle Uç Nokta'daki mevcut bir sürümü güncelleştirin. Hiçbiri olarak bırakılan değerler bu sürümde değişmeden kalır. |
create_version
Sağlanan özelliklerle uç noktaya yeni bir sürüm ekleyin.
create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
Parametreler
Name | Description |
---|---|
version_name
Gerekli
|
Uç noktaya eklenecek sürümün adı. |
autoscale_enabled
|
Bir Uç Noktada bu sürüm için otomatik ölçeklendirmenin etkinleştirilip etkinleştirilmeyileceği.
Varsayılan değer Yok ise Default value: None
|
autoscale_min_replicas
|
Bir Uç Noktada bu sürümü otomatik ölçeklerken kullanılacak en az kapsayıcı sayısı. Varsayılan değer: 1 Default value: None
|
autoscale_max_replicas
|
Bir Uç Noktada bu sürümü otomatik ölçeklerken kullanılacak kapsayıcı sayısı üst sınırı. Varsayılan değer 10'dır Default value: None
|
autoscale_refresh_seconds
|
Otomatik ölçeklendiricinin bu sürümü bir Uç Noktada ölçeklendirmeye çalışma sıklıkları. Varsayılan değer: 1 Default value: None
|
autoscale_target_utilization
|
Otomatik ölçeklendiricinin hedef kullanımı (100'ün yüzdesinde) uç noktada bu sürüm için korumayı denemesi gerekir. Varsayılan değer 70'tir Default value: None
|
collect_model_data
|
Bir Uç Noktada bu sürüm için model veri toplamanın etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer False'tur Default value: None
|
cpu_cores
|
Bir Uç Noktada bu sürüm için ayrılacak CPU çekirdeği sayısı. Ondalık olabilir. Varsayılan değer: 0.1 Default value: None
|
memory_gb
|
Bir Uç Noktada bu sürüm için ayrılacak bellek miktarı (GB cinsinden). Ondalık olabilir. Varsayılan değer 0,5'tir Default value: None
|
scoring_timeout_ms
|
Bir Uç Noktada bu sürüme yapılan puanlama çağrılarını zorlamak için zaman aşımı. Varsayılan değer 60000'tir. Default value: None
|
replica_max_concurrent_requests
|
Bir Uç Noktada bu sürüme izin vermek için çoğaltma başına en fazla eşzamanlı istek sayısı. Varsayılan değer 1'tir. Microsoft Teknik Destek veya Azure Machine Learning ekibinin bir üyesi tarafından belirtilmediği sürece bu ayarı varsayılan değer olan 1'den değiştirmeyin. Default value: None
|
max_request_wait_time
|
Bir isteğin 503 hatası döndürmeden önce kuyrukta kalacağı (milisaniye cinsinden) maksimum süre. Varsayılan değer 500'dır. Default value: None
|
num_replicas
|
Bir Uç Noktada bu sürüm için ayrılacak kapsayıcı sayısı. Varsayılan değildir, bu parametre ayarlanmadıysa otomatik ölçeklendirici varsayılan olarak etkinleştirilir. Default value: None
|
tags
|
Bu Uç Noktaya vermek için anahtar değeri etiketleri sözlüğü. Default value: None
|
properties
|
Bu Uç Noktaya vermek için anahtar değeri özelliklerinin sözlüğü. Bu özellikler dağıtımdan sonra değiştirilemez, ancak yeni anahtar değer çiftleri eklenebilir. Default value: None
|
description
|
Bu Uç Noktaya vermek için bir açıklama. Default value: None
|
models
|
Güncelleştirilmiş hizmetle paketlenecek Model nesnelerinin listesi. Default value: None
|
inference_config
|
Gerekli model dağıtım özelliklerini sağlamak için kullanılan bir InferenceConfig nesnesi. Default value: None
|
gpu_cores
|
Bir Uç Noktada bu sürüm için ayrılacak GPU çekirdeklerinin sayısı. Varsayılan değer 0'dır. Default value: None
|
period_seconds
|
Canlılık araştırmasını gerçekleştirme sıklığı (saniye cinsinden). Varsayılan olarak 10 saniyedir. En düşük değer 1'dir. Default value: None
|
initial_delay_seconds
|
Canlılık yoklamaları başlatılmadan önce kapsayıcı başlatıldıktan sonraki saniye sayısı. Varsayılan değer 310'dır. Default value: None
|
timeout_seconds
|
Canlılık araştırmasının zaman aşımına uğradıktan sonra geçmesi gereken saniye sayısı. Varsayılan değer 2 saniyedir. En düşük değer 1'dir. Default value: None
|
success_threshold
|
Canlılık araştırması için ardışık en düşük başarılar başarısız olduktan sonra başarılı olarak kabul edilir. Varsayılan değer 1'tir. En düşük değer 1'dir. Default value: None
|
failure_threshold
|
Bir Pod başlatıldığında ve canlılık yoklaması başarısız olduğunda Kubernetes vazgeçmeden önce failureThreshold sürelerini dener. Varsayılan değer 3'tir. En düşük değer 1'dir. Default value: None
|
traffic_percentile
|
Sürümün bir uç noktada aldığı trafik miktarı. Default value: None
|
is_default
|
Bu sürümün bir Uç Noktada varsayılan sürüm olarak yapılıp yapılmaymayacağı. Varsayılan değer False'tur. Default value: None
|
is_control_version_type
|
Bu sürümün bir Uç Noktada denetim sürümü olarak yapılıp yapılmaymayacağı. Varsayılan değer False'tur. Default value: None
|
cpu_cores_limit
|
Bu Web Hizmeti'nin kullanmasına izin verilen en fazla cpu çekirdeği sayısı. Ondalık olabilir. Default value: None
|
memory_gb_limit
|
Bu Web hizmeti için en fazla bellek miktarı (GB cinsinden) kullanılabilir. Ondalık olabilir. Default value: None
|
Özel durumlar
Tür | Description |
---|---|
delete_version
Uç Nokta'daki bir sürümü silin.
delete_version(version_name)
Parametreler
Name | Description |
---|---|
version_name
Gerekli
|
Silinecek uç noktadaki sürümün adı. |
Özel durumlar
Tür | Description |
---|---|
deploy_configuration
AKS işlem hedefine dağıtmak için bir yapılandırma nesnesi oluşturun.
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)
Parametreler
Name | Description |
---|---|
autoscale_enabled
|
Uç Nokta'da bu sürüm için otomatik ölçeklendirmenin etkinleştirilip etkinleştirilmeyileceği.
Varsayılan değer Yok ise Default value: None
|
autoscale_min_replicas
|
Bir Uç Noktada bu sürümü otomatik olarak ölçeklerken kullanılacak en az kapsayıcı sayısı. Varsayılan olarak 1'e ayarlanır. Default value: None
|
autoscale_max_replicas
|
Bir Uç Noktada bu sürümü otomatik olarak ölçeklerken kullanılacak kapsayıcı sayısı üst sınırı. Varsayılan değer 10'dır. Default value: None
|
autoscale_refresh_seconds
|
Otomatik ölçeklendiricinin bu sürümü bir Uç Noktada ölçeklendirmeye çalışma sıklıkları. Varsayılan olarak 1'e ayarlanır. Default value: None
|
autoscale_target_utilization
|
Otomatik ölçeklendiricinin hedef kullanımı (yüzde 100'de) uç noktada bu sürüm için korumayı denemesi gerekir. Varsayılan değer 70'tir. Default value: None
|
collect_model_data
|
Uç Nokta'da bu sürüm için model veri toplamayı etkinleştirip etkinleştirmeme. Varsayılan değer False'tur. Default value: None
|
auth_enabled
|
Uç Noktada bu sürüm için anahtar kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer True'dır. Default value: None
|
cpu_cores
|
Bir Uç Noktada bu sürüm için ayrılacak cpu çekirdeği sayısı. Ondalık olabilir. Varsayılan değer: 0.1 Default value: None
|
memory_gb
|
Bir Uç Noktada bu sürüm için ayrılacak bellek miktarı (GB cinsinden). Ondalık olabilir. Varsayılan değer 0,5'tir Default value: None
|
enable_app_insights
|
Bir Uç Noktada bu sürüm için ApplicationInsights günlüğünün etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer False'tur. Default value: None
|
scoring_timeout_ms
|
Bir Uç Noktada bu sürüme puanlama çağrılarını zorunlu kılma zaman aşımı. Varsayılan değer: 60000 Default value: None
|
replica_max_concurrent_requests
|
Bir Uç Noktada bu sürüme izin vermek için çoğaltma başına en fazla eşzamanlı istek sayısı. Varsayılan olarak 1'e ayarlanır. Microsoft Teknik Destek veya Azure Machine Learning ekibinin bir üyesi tarafından belirtilmedikçe bu ayarı varsayılan değer olan 1'den değiştirmeyin. Default value: None
|
max_request_wait_time
|
Bir isteğin 503 hatası döndürmeden önce kuyrukta (milisaniye cinsinden) kalacağı en uzun süre. Varsayılan değer 500'dır. Default value: None
|
num_replicas
|
Bir Uç Noktada bu sürüm için ayrılacak kapsayıcı sayısı. Varsayılan yoktur, bu parametre ayarlanmadıysa otomatik ölçeklendirici varsayılan olarak etkinleştirilir. Default value: None
|
primary_key
|
Bu Uç Nokta için kullanılacak birincil kimlik doğrulama anahtarı. Default value: None
|
secondary_key
|
Bu Uç Nokta için kullanılacak ikincil kimlik doğrulama anahtarı. Default value: None
|
tags
|
Bu Uç Noktaya vermek için anahtar değer etiketleri sözlüğü. Default value: None
|
properties
|
Bu Uç Noktaya vermek için anahtar değer özelliklerinin sözlüğü. Bu özellikler dağıtımdan sonra değiştirilemez, ancak yeni anahtar değer çiftleri eklenebilir Default value: None
|
description
|
Bu Uç Noktaya vermek için bir açıklama. Default value: None
|
gpu_cores
|
Bir Uç Noktada bu sürüm için ayrılacak GPU çekirdeği sayısı. Varsayılan değer 0'dır. Default value: None
|
period_seconds
|
Canlılık araştırmasını gerçekleştirme sıklığını (saniye olarak). Varsayılan olarak 10 saniyedir. En düşük değer 1'dir. Default value: None
|
initial_delay_seconds
|
Canlılık yoklamaları başlatılmadan önce kapsayıcı başlatıldıktan sonraki saniye sayısı. Varsayılan değer 310'dır. Default value: None
|
timeout_seconds
|
Canlılık yoklamasının zaman aşımına uğradıktan sonraki saniye sayısı. Varsayılan değer 2 saniyedir. En düşük değer 1'dir. Default value: None
|
success_threshold
|
Canlılık araştırmasının başarısız olduktan sonra başarılı olarak kabul edilmesi için en düşük ardışık başarılar. Varsayılan olarak 1'e ayarlanır. En düşük değer 1'dir. Default value: None
|
failure_threshold
|
Pod başlatıldığında ve canlılık yoklaması başarısız olduğunda Kubernetes, vazgeçmeden önce zamanları dener Default value: None
|
namespace
|
Bu Uç Noktanın dağıtılacağı Kubernetes ad alanı: en fazla 63 küçük harf alfasayısal ('a'-'z', '0'-'9') ve kısa çizgi ('-') karakterleri. İlk ve son karakterler kısa çizgi olamaz. Default value: None
|
token_auth_enabled
|
Bu Uç Nokta için Belirteç kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Bu etkinleştirilirse, kullanıcılar Azure Active Directory kimlik bilgilerini kullanarak erişim belirtecini getirerek bu Uç Noktaya erişebilir. Varsayılan değer False'tur. Default value: None
|
version_name
|
Uç noktadaki sürümün adı. Default value: None
|
traffic_percentile
|
sürümün bir uç noktada aldığı trafik miktarı. Default value: None
|
compute_target_name
|
Dağıtılacak işlem hedefinin adı Default value: None
|
cpu_cores_limit
|
Bu Web hizmetini kullanmasına izin verilen en fazla cpu çekirdeği sayısı. Ondalık olabilir. Default value: None
|
memory_gb_limit
|
Bu Web hizmetini kullanmasına izin verilen maksimum bellek miktarı (GB cinsinden). Ondalık olabilir. Default value: None
|
Döndürülenler
Tür | Description |
---|---|
Özel durumlar
Tür | Description |
---|---|
serialize
Bu Web hizmetini JSON serileştirilmiş sözlüğe dönüştürün.
serialize()
Döndürülenler
Tür | Description |
---|---|
Bu Web hizmetini JSON gösterimi. |
Özel durumlar
Tür | Description |
---|---|
update
Uç Noktayı sağlanan özelliklerle güncelleştirin.
Hiçbiri olarak bırakılan değerler bu Uç Noktada değişmeden kalır
update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)
Parametreler
Name | Description |
---|---|
auth_enabled
|
Uç Noktada bu sürüm için anahtar kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer True'dır. Default value: None
|
token_auth_enabled
|
Bu Uç Nokta için Belirteç kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Bu etkinleştirilirse, kullanıcılar Azure Active Directory kimlik bilgilerini kullanarak erişim belirtecini getirerek bu Uç Noktaya erişebilir. Varsayılan değer False'tur. Default value: None
|
enable_app_insights
|
Uç Noktada bu sürüm için Application Insights günlüğünün etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer False'tur. Default value: None
|
description
|
Bu Uç Noktaya vermek için bir açıklama. Default value: None
|
tags
|
Bu Uç Noktaya vermek için anahtar değer etiketleri sözlüğü. Default value: None
|
properties
|
Bu Uç Noktaya vermek için anahtar değer özelliklerinin sözlüğü. Bu özellikler dağıtımdan sonra değiştirilemez, ancak yeni anahtar değer çiftleri eklenebilir. Default value: None
|
Özel durumlar
Tür | Description |
---|---|
update_version
Sağlanan özelliklerle Uç Nokta'daki mevcut bir sürümü güncelleştirin.
Hiçbiri olarak bırakılan değerler bu sürümde değişmeden kalır.
update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
Parametreler
Name | Description |
---|---|
version_name
Gerekli
|
Uç noktadaki sürümün adı. |
autoscale_enabled
|
Uç Nokta'da bu sürüm için otomatik ölçeklendirmenin etkinleştirilip etkinleştirilmeyileceği. num_replicas Yok olduğunda varsayılan değer True olur. Default value: None
|
autoscale_min_replicas
|
Bir Uç Noktada bu sürümü otomatik olarak ölçeklerken kullanılacak en az kapsayıcı sayısı. Varsayılan olarak 1'e ayarlanır. Default value: None
|
autoscale_max_replicas
|
Bir Uç Noktada bu sürümü otomatik olarak ölçeklerken kullanılacak kapsayıcı sayısı üst sınırı. Varsayılan değer 10'dır. Default value: None
|
autoscale_refresh_seconds
|
Otomatik ölçeklendiricinin bu sürümü bir Uç Noktada ölçeklendirmeye çalışma sıklıkları. Varsayılan olarak 1'e ayarlanır Default value: None
|
autoscale_target_utilization
|
Otomatik ölçeklendiricinin hedef kullanımı (yüzde 100'de) uç noktada bu sürüm için korumayı denemesi gerekir. Varsayılan değer 70'tir. Default value: None
|
collect_model_data
|
Uç Nokta'da bu sürüm için model veri toplamayı etkinleştirip etkinleştirmeme. Varsayılan değer False'tur. Default value: None
|
cpu_cores
|
Bir Uç Noktada bu sürüm için ayrılacak cpu çekirdeği sayısı. Ondalık olabilir. Varsayılan değer: 0.1 Default value: None
|
memory_gb
|
Bir Uç Noktada bu sürüm için ayrılacak bellek miktarı (GB cinsinden). Ondalık olabilir. Varsayılan değer 0,5'tir Default value: None
|
scoring_timeout_ms
|
Bir Uç Noktada bu sürüme yapılan puanlama çağrıları için zorunlu kılınacak zaman aşımı. Varsayılan değer 60000'tir. Default value: None
|
replica_max_concurrent_requests
|
Bir Uç Noktada bu sürüme izin vermek için çoğaltma başına en fazla eşzamanlı istek sayısı. Varsayılan olarak 1'e ayarlanır. Microsoft Teknik Destek veya Azure Machine Learning ekibinin bir üyesi tarafından belirtilmedikçe bu ayarı varsayılan değer olan 1'den değiştirmeyin. Default value: None
|
max_request_wait_time
|
Bir isteğin 503 hatası döndürmeden önce kuyrukta (milisaniye cinsinden) kalacağı en uzun süre. Varsayılan değer 500'dır. Default value: None
|
num_replicas
|
Bir Uç Noktada bu sürüm için ayrılacak kapsayıcı sayısı. Varsayılan yoktur, bu parametre ayarlanmadıysa otomatik ölçeklendirici varsayılan olarak etkinleştirilir. Default value: None
|
tags
|
Bu Uç Noktaya vermek için anahtar değer etiketleri sözlüğü. Default value: None
|
properties
|
Bu Uç Noktaya vermek için anahtar değer özelliklerinin sözlüğü. Bu özellikler dağıtımdan sonra değiştirilemez, ancak yeni anahtar değer çiftleri eklenebilir. Default value: None
|
description
|
Bu Uç Noktaya vermek için bir açıklama Default value: None
|
models
|
Güncelleştirilmiş hizmetle paketlenecek Model nesnelerinin listesi Default value: None
|
inference_config
|
Gerekli model dağıtım özelliklerini sağlamak için kullanılan inferenceConfig nesnesi. Default value: None
|
gpu_cores
|
Bir Uç Noktada bu sürüm için ayrılacak GPU çekirdeği sayısı. Varsayılan değer 0'dır. Default value: None
|
period_seconds
|
Canlılık araştırmasını gerçekleştirme sıklığını (saniye olarak). Varsayılan olarak 10 saniyedir. En düşük değer 1'dir. Default value: None
|
initial_delay_seconds
|
Canlılık yoklamaları başlatılmadan önce kapsayıcı başlatıldıktan sonraki saniye sayısı. Varsayılan değer 310'dır. Default value: None
|
timeout_seconds
|
Canlılık yoklamasının zaman aşımına uğradıktan sonraki saniye sayısı. Varsayılan değer 2 saniyedir. En düşük değer 1'dir. Default value: None
|
success_threshold
|
Canlılık yoklaması için ardışık en düşük başarılar başarısız olduktan sonra başarılı olarak kabul edilir. Varsayılan olarak 1'e ayarlanır. En düşük değer 1'dir. Default value: None
|
failure_threshold
|
Pod başlatıldığında ve canlılık yoklaması başarısız olduğunda Kubernetes vazgeçmeden önce failureThreshold sürelerini dener. Varsayılan değer 3'tir. En düşük değer 1'dir. Default value: None
|
traffic_percentile
|
Sürümün bir uç noktada aldığı trafik miktarı. Default value: None
|
is_default
|
Bu sürümün bir Uç Nokta'da varsayılan sürüm olarak yapılıp yapılmaydığı. Varsayılan değer False'tur. Default value: None
|
is_control_version_type
|
Bu sürümün bir Uç Noktada denetim sürümü olarak yapılıp yapılmaymayacağı. Varsayılan değer False'tur. Default value: None
|
cpu_cores_limit
|
Bu Web hizmetini kullanmasına izin verilen en fazla cpu çekirdeği sayısı. Ondalık olabilir. Default value: None
|
memory_gb_limit
|
Bu Web hizmetini kullanmasına izin verilen maksimum bellek miktarı (GB cinsinden). Ondalık olabilir. Default value: None
|
Özel durumlar
Tür | Description |
---|---|