Aracılığıyla paylaş


AksEndpoint Sınıf

Not

Bu deneysel bir sınıftır ve herhangi bir zamanda değişebilir. Daha fazla bilgi için lütfen bkz. https://aka.ms/azuremlexperimental.

Azure Kubernetes Service üzerinde çalışan aynı uç noktanın arkasındaki web hizmeti sürümlerinin bir koleksiyonunu temsil eder.

tek AksWebservice bir puanlama uç noktasıyla tek bir hizmet dağıtırken, AksEndpoint sınıfı aynı puanlama uç noktasının arkasında birden çok web hizmeti sürümü dağıtmanızı sağlar. Her web hizmeti sürümü trafiğin bir yüzdesine hizmet vermek üzere yapılandırılabilir, böylece modelleri denetimli bir şekilde dağıtabilirsiniz( örneğin, A/B testi için). AksEndpoint, AksWebservice'e benzer bir model nesnesinden dağıtıma izin verir.

Web hizmeti örneğini başlatın.

Web hizmeti oluşturucu, sağlanan çalışma alanıyla ilişkili bir Web hizmeti nesnesinin bulut gösterimini alır. Alınan Web hizmeti nesnesinin belirli türüne karşılık gelen bir alt sınıfın örneğini döndürür.

Devralma
AksEndpoint

Oluşturucu

AksEndpoint(workspace, name)

Parametreler

Name Description
workspace
Gerekli

Alınacak Web hizmeti nesnesini içeren çalışma alanı nesnesi.

name
Gerekli
str

Alınacak Web hizmeti nesnesinin adı.

Değişkenler

Name Description
versions

Sürüm nesnesine sürüm adı sözlüğü. Bu Uç Noktanın bir parçası olarak dağıtılan tüm sürümleri içerir.

Yöntemler

create_version

Sağlanan özelliklerle uç noktaya yeni bir sürüm ekleyin.

delete_version

Uç Nokta'daki bir sürümü silin.

deploy_configuration

AKS işlem hedefine dağıtmak için bir yapılandırma nesnesi oluşturun.

serialize

Bu Web hizmetini JSON serileştirilmiş sözlüğe dönüştürün.

update

Uç Noktayı sağlanan özelliklerle güncelleştirin.

Hiçbiri olarak bırakılan değerler bu Uç Noktada değişmeden kalır

update_version

Sağlanan özelliklerle Uç Nokta'daki mevcut bir sürümü güncelleştirin.

Hiçbiri olarak bırakılan değerler bu sürümde değişmeden kalır.

create_version

Sağlanan özelliklerle uç noktaya yeni bir sürüm ekleyin.

create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

Parametreler

Name Description
version_name
Gerekli
str

Uç noktaya eklenecek sürümün adı.

autoscale_enabled

Bir Uç Noktada bu sürüm için otomatik ölçeklendirmenin etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer Yok ise num_replicas True olarak ayarlanır.

Default value: None
autoscale_min_replicas
int

Bir Uç Noktada bu sürümü otomatik ölçeklerken kullanılacak en az kapsayıcı sayısı. Varsayılan değer: 1

Default value: None
autoscale_max_replicas
int

Bir Uç Noktada bu sürümü otomatik ölçeklerken kullanılacak kapsayıcı sayısı üst sınırı. Varsayılan değer 10'dır

Default value: None
autoscale_refresh_seconds
int

Otomatik ölçeklendiricinin bu sürümü bir Uç Noktada ölçeklendirmeye çalışma sıklıkları. Varsayılan değer: 1

Default value: None
autoscale_target_utilization
int

Otomatik ölçeklendiricinin hedef kullanımı (100'ün yüzdesinde) uç noktada bu sürüm için korumayı denemesi gerekir. Varsayılan değer 70'tir

Default value: None
collect_model_data

Bir Uç Noktada bu sürüm için model veri toplamanın etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer False'tur

Default value: None
cpu_cores

Bir Uç Noktada bu sürüm için ayrılacak CPU çekirdeği sayısı. Ondalık olabilir. Varsayılan değer: 0.1

Default value: None
memory_gb

Bir Uç Noktada bu sürüm için ayrılacak bellek miktarı (GB cinsinden). Ondalık olabilir. Varsayılan değer 0,5'tir

Default value: None
scoring_timeout_ms
int

Bir Uç Noktada bu sürüme yapılan puanlama çağrılarını zorlamak için zaman aşımı. Varsayılan değer 60000'tir.

Default value: None
replica_max_concurrent_requests
int

Bir Uç Noktada bu sürüme izin vermek için çoğaltma başına en fazla eşzamanlı istek sayısı. Varsayılan değer 1'tir. Microsoft Teknik Destek veya Azure Machine Learning ekibinin bir üyesi tarafından belirtilmediği sürece bu ayarı varsayılan değer olan 1'den değiştirmeyin.

Default value: None
max_request_wait_time
int

Bir isteğin 503 hatası döndürmeden önce kuyrukta kalacağı (milisaniye cinsinden) maksimum süre. Varsayılan değer 500'dır.

Default value: None
num_replicas
int

Bir Uç Noktada bu sürüm için ayrılacak kapsayıcı sayısı. Varsayılan değildir, bu parametre ayarlanmadıysa otomatik ölçeklendirici varsayılan olarak etkinleştirilir.

Default value: None
tags

Bu Uç Noktaya vermek için anahtar değeri etiketleri sözlüğü.

Default value: None
properties

Bu Uç Noktaya vermek için anahtar değeri özelliklerinin sözlüğü. Bu özellikler dağıtımdan sonra değiştirilemez, ancak yeni anahtar değer çiftleri eklenebilir.

Default value: None
description
str

Bu Uç Noktaya vermek için bir açıklama.

Default value: None
models

Güncelleştirilmiş hizmetle paketlenecek Model nesnelerinin listesi.

Default value: None
inference_config

Gerekli model dağıtım özelliklerini sağlamak için kullanılan bir InferenceConfig nesnesi.

Default value: None
gpu_cores
int

Bir Uç Noktada bu sürüm için ayrılacak GPU çekirdeklerinin sayısı. Varsayılan değer 0'dır.

Default value: None
period_seconds
int

Canlılık araştırmasını gerçekleştirme sıklığı (saniye cinsinden). Varsayılan olarak 10 saniyedir. En düşük değer 1'dir.

Default value: None
initial_delay_seconds
int

Canlılık yoklamaları başlatılmadan önce kapsayıcı başlatıldıktan sonraki saniye sayısı. Varsayılan değer 310'dır.

Default value: None
timeout_seconds
int

Canlılık araştırmasının zaman aşımına uğradıktan sonra geçmesi gereken saniye sayısı. Varsayılan değer 2 saniyedir. En düşük değer 1'dir.

Default value: None
success_threshold
int

Canlılık araştırması için ardışık en düşük başarılar başarısız olduktan sonra başarılı olarak kabul edilir. Varsayılan değer 1'tir. En düşük değer 1'dir.

Default value: None
failure_threshold
int

Bir Pod başlatıldığında ve canlılık yoklaması başarısız olduğunda Kubernetes vazgeçmeden önce failureThreshold sürelerini dener. Varsayılan değer 3'tir. En düşük değer 1'dir.

Default value: None
traffic_percentile

Sürümün bir uç noktada aldığı trafik miktarı.

Default value: None
is_default

Bu sürümün bir Uç Noktada varsayılan sürüm olarak yapılıp yapılmaymayacağı. Varsayılan değer False'tur.

Default value: None
is_control_version_type

Bu sürümün bir Uç Noktada denetim sürümü olarak yapılıp yapılmaymayacağı. Varsayılan değer False'tur.

Default value: None
cpu_cores_limit

Bu Web Hizmeti'nin kullanmasına izin verilen en fazla cpu çekirdeği sayısı. Ondalık olabilir.

Default value: None
memory_gb_limit

Bu Web hizmeti için en fazla bellek miktarı (GB cinsinden) kullanılabilir. Ondalık olabilir.

Default value: None

Özel durumlar

Tür Description

delete_version

Uç Nokta'daki bir sürümü silin.

delete_version(version_name)

Parametreler

Name Description
version_name
Gerekli
str

Silinecek uç noktadaki sürümün adı.

Özel durumlar

Tür Description

deploy_configuration

AKS işlem hedefine dağıtmak için bir yapılandırma nesnesi oluşturun.

static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)

Parametreler

Name Description
autoscale_enabled

Uç Nokta'da bu sürüm için otomatik ölçeklendirmenin etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer Yok ise num_replicas True olarak ayarlanır.

Default value: None
autoscale_min_replicas
int

Bir Uç Noktada bu sürümü otomatik olarak ölçeklerken kullanılacak en az kapsayıcı sayısı. Varsayılan olarak 1'e ayarlanır.

Default value: None
autoscale_max_replicas
int

Bir Uç Noktada bu sürümü otomatik olarak ölçeklerken kullanılacak kapsayıcı sayısı üst sınırı. Varsayılan değer 10'dır.

Default value: None
autoscale_refresh_seconds
int

Otomatik ölçeklendiricinin bu sürümü bir Uç Noktada ölçeklendirmeye çalışma sıklıkları. Varsayılan olarak 1'e ayarlanır.

Default value: None
autoscale_target_utilization
int

Otomatik ölçeklendiricinin hedef kullanımı (yüzde 100'de) uç noktada bu sürüm için korumayı denemesi gerekir. Varsayılan değer 70'tir.

Default value: None
collect_model_data

Uç Nokta'da bu sürüm için model veri toplamayı etkinleştirip etkinleştirmeme. Varsayılan değer False'tur.

Default value: None
auth_enabled

Uç Noktada bu sürüm için anahtar kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer True'dır.

Default value: None
cpu_cores

Bir Uç Noktada bu sürüm için ayrılacak cpu çekirdeği sayısı. Ondalık olabilir. Varsayılan değer: 0.1

Default value: None
memory_gb

Bir Uç Noktada bu sürüm için ayrılacak bellek miktarı (GB cinsinden). Ondalık olabilir. Varsayılan değer 0,5'tir

Default value: None
enable_app_insights

Bir Uç Noktada bu sürüm için ApplicationInsights günlüğünün etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer False'tur.

Default value: None
scoring_timeout_ms
int

Bir Uç Noktada bu sürüme puanlama çağrılarını zorunlu kılma zaman aşımı. Varsayılan değer: 60000

Default value: None
replica_max_concurrent_requests
int

Bir Uç Noktada bu sürüme izin vermek için çoğaltma başına en fazla eşzamanlı istek sayısı. Varsayılan olarak 1'e ayarlanır. Microsoft Teknik Destek veya Azure Machine Learning ekibinin bir üyesi tarafından belirtilmedikçe bu ayarı varsayılan değer olan 1'den değiştirmeyin.

Default value: None
max_request_wait_time
int

Bir isteğin 503 hatası döndürmeden önce kuyrukta (milisaniye cinsinden) kalacağı en uzun süre. Varsayılan değer 500'dır.

Default value: None
num_replicas
int

Bir Uç Noktada bu sürüm için ayrılacak kapsayıcı sayısı. Varsayılan yoktur, bu parametre ayarlanmadıysa otomatik ölçeklendirici varsayılan olarak etkinleştirilir.

Default value: None
primary_key
str

Bu Uç Nokta için kullanılacak birincil kimlik doğrulama anahtarı.

Default value: None
secondary_key
str

Bu Uç Nokta için kullanılacak ikincil kimlik doğrulama anahtarı.

Default value: None
tags

Bu Uç Noktaya vermek için anahtar değer etiketleri sözlüğü.

Default value: None
properties

Bu Uç Noktaya vermek için anahtar değer özelliklerinin sözlüğü. Bu özellikler dağıtımdan sonra değiştirilemez, ancak yeni anahtar değer çiftleri eklenebilir

Default value: None
description
str

Bu Uç Noktaya vermek için bir açıklama.

Default value: None
gpu_cores
int

Bir Uç Noktada bu sürüm için ayrılacak GPU çekirdeği sayısı. Varsayılan değer 0'dır.

Default value: None
period_seconds
int

Canlılık araştırmasını gerçekleştirme sıklığını (saniye olarak). Varsayılan olarak 10 saniyedir. En düşük değer 1'dir.

Default value: None
initial_delay_seconds
int

Canlılık yoklamaları başlatılmadan önce kapsayıcı başlatıldıktan sonraki saniye sayısı. Varsayılan değer 310'dır.

Default value: None
timeout_seconds
int

Canlılık yoklamasının zaman aşımına uğradıktan sonraki saniye sayısı. Varsayılan değer 2 saniyedir. En düşük değer 1'dir.

Default value: None
success_threshold
int

Canlılık araştırmasının başarısız olduktan sonra başarılı olarak kabul edilmesi için en düşük ardışık başarılar. Varsayılan olarak 1'e ayarlanır. En düşük değer 1'dir.

Default value: None
failure_threshold
int

Pod başlatıldığında ve canlılık yoklaması başarısız olduğunda Kubernetes, vazgeçmeden önce zamanları dener failureThreshold . Varsayılan değer 3'tir. En düşük değer 1'dir.

Default value: None
namespace
str

Bu Uç Noktanın dağıtılacağı Kubernetes ad alanı: en fazla 63 küçük harf alfasayısal ('a'-'z', '0'-'9') ve kısa çizgi ('-') karakterleri. İlk ve son karakterler kısa çizgi olamaz.

Default value: None
token_auth_enabled

Bu Uç Nokta için Belirteç kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Bu etkinleştirilirse, kullanıcılar Azure Active Directory kimlik bilgilerini kullanarak erişim belirtecini getirerek bu Uç Noktaya erişebilir. Varsayılan değer False'tur.

Default value: None
version_name
str

Uç noktadaki sürümün adı.

Default value: None
traffic_percentile

sürümün bir uç noktada aldığı trafik miktarı.

Default value: None
compute_target_name
str

Dağıtılacak işlem hedefinin adı

Default value: None
cpu_cores_limit

Bu Web hizmetini kullanmasına izin verilen en fazla cpu çekirdeği sayısı. Ondalık olabilir.

Default value: None
memory_gb_limit

Bu Web hizmetini kullanmasına izin verilen maksimum bellek miktarı (GB cinsinden). Ondalık olabilir.

Default value: None

Döndürülenler

Tür Description

Özel durumlar

Tür Description

serialize

Bu Web hizmetini JSON serileştirilmiş sözlüğe dönüştürün.

serialize()

Döndürülenler

Tür Description

Bu Web hizmetini JSON gösterimi.

Özel durumlar

Tür Description

update

Uç Noktayı sağlanan özelliklerle güncelleştirin.

Hiçbiri olarak bırakılan değerler bu Uç Noktada değişmeden kalır

update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)

Parametreler

Name Description
auth_enabled

Uç Noktada bu sürüm için anahtar kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer True'dır.

Default value: None
token_auth_enabled

Bu Uç Nokta için Belirteç kimlik doğrulamasının etkinleştirilip etkinleştirilmeyileceği. Bu etkinleştirilirse, kullanıcılar Azure Active Directory kimlik bilgilerini kullanarak erişim belirtecini getirerek bu Uç Noktaya erişebilir. Varsayılan değer False'tur.

Default value: None
enable_app_insights

Uç Noktada bu sürüm için Application Insights günlüğünün etkinleştirilip etkinleştirilmeyileceği. Varsayılan değer False'tur.

Default value: None
description
str

Bu Uç Noktaya vermek için bir açıklama.

Default value: None
tags

Bu Uç Noktaya vermek için anahtar değer etiketleri sözlüğü.

Default value: None
properties

Bu Uç Noktaya vermek için anahtar değer özelliklerinin sözlüğü. Bu özellikler dağıtımdan sonra değiştirilemez, ancak yeni anahtar değer çiftleri eklenebilir.

Default value: None

Özel durumlar

Tür Description

update_version

Sağlanan özelliklerle Uç Nokta'daki mevcut bir sürümü güncelleştirin.

Hiçbiri olarak bırakılan değerler bu sürümde değişmeden kalır.

update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

Parametreler

Name Description
version_name
Gerekli
str

Uç noktadaki sürümün adı.

autoscale_enabled

Uç Nokta'da bu sürüm için otomatik ölçeklendirmenin etkinleştirilip etkinleştirilmeyileceği. num_replicas Yok olduğunda varsayılan değer True olur.

Default value: None
autoscale_min_replicas
int

Bir Uç Noktada bu sürümü otomatik olarak ölçeklerken kullanılacak en az kapsayıcı sayısı. Varsayılan olarak 1'e ayarlanır.

Default value: None
autoscale_max_replicas
int

Bir Uç Noktada bu sürümü otomatik olarak ölçeklerken kullanılacak kapsayıcı sayısı üst sınırı. Varsayılan değer 10'dır.

Default value: None
autoscale_refresh_seconds
int

Otomatik ölçeklendiricinin bu sürümü bir Uç Noktada ölçeklendirmeye çalışma sıklıkları. Varsayılan olarak 1'e ayarlanır

Default value: None
autoscale_target_utilization
int

Otomatik ölçeklendiricinin hedef kullanımı (yüzde 100'de) uç noktada bu sürüm için korumayı denemesi gerekir. Varsayılan değer 70'tir.

Default value: None
collect_model_data

Uç Nokta'da bu sürüm için model veri toplamayı etkinleştirip etkinleştirmeme. Varsayılan değer False'tur.

Default value: None
cpu_cores

Bir Uç Noktada bu sürüm için ayrılacak cpu çekirdeği sayısı. Ondalık olabilir. Varsayılan değer: 0.1

Default value: None
memory_gb

Bir Uç Noktada bu sürüm için ayrılacak bellek miktarı (GB cinsinden). Ondalık olabilir. Varsayılan değer 0,5'tir

Default value: None
scoring_timeout_ms
int

Bir Uç Noktada bu sürüme yapılan puanlama çağrıları için zorunlu kılınacak zaman aşımı. Varsayılan değer 60000'tir.

Default value: None
replica_max_concurrent_requests
int

Bir Uç Noktada bu sürüme izin vermek için çoğaltma başına en fazla eşzamanlı istek sayısı. Varsayılan olarak 1'e ayarlanır. Microsoft Teknik Destek veya Azure Machine Learning ekibinin bir üyesi tarafından belirtilmedikçe bu ayarı varsayılan değer olan 1'den değiştirmeyin.

Default value: None
max_request_wait_time
int

Bir isteğin 503 hatası döndürmeden önce kuyrukta (milisaniye cinsinden) kalacağı en uzun süre. Varsayılan değer 500'dır.

Default value: None
num_replicas
int

Bir Uç Noktada bu sürüm için ayrılacak kapsayıcı sayısı. Varsayılan yoktur, bu parametre ayarlanmadıysa otomatik ölçeklendirici varsayılan olarak etkinleştirilir.

Default value: None
tags

Bu Uç Noktaya vermek için anahtar değer etiketleri sözlüğü.

Default value: None
properties

Bu Uç Noktaya vermek için anahtar değer özelliklerinin sözlüğü. Bu özellikler dağıtımdan sonra değiştirilemez, ancak yeni anahtar değer çiftleri eklenebilir.

Default value: None
description
str

Bu Uç Noktaya vermek için bir açıklama

Default value: None
models

Güncelleştirilmiş hizmetle paketlenecek Model nesnelerinin listesi

Default value: None
inference_config

Gerekli model dağıtım özelliklerini sağlamak için kullanılan inferenceConfig nesnesi.

Default value: None
gpu_cores
int

Bir Uç Noktada bu sürüm için ayrılacak GPU çekirdeği sayısı. Varsayılan değer 0'dır.

Default value: None
period_seconds
int

Canlılık araştırmasını gerçekleştirme sıklığını (saniye olarak). Varsayılan olarak 10 saniyedir. En düşük değer 1'dir.

Default value: None
initial_delay_seconds
int

Canlılık yoklamaları başlatılmadan önce kapsayıcı başlatıldıktan sonraki saniye sayısı. Varsayılan değer 310'dır.

Default value: None
timeout_seconds
int

Canlılık yoklamasının zaman aşımına uğradıktan sonraki saniye sayısı. Varsayılan değer 2 saniyedir. En düşük değer 1'dir.

Default value: None
success_threshold
int

Canlılık yoklaması için ardışık en düşük başarılar başarısız olduktan sonra başarılı olarak kabul edilir. Varsayılan olarak 1'e ayarlanır. En düşük değer 1'dir.

Default value: None
failure_threshold
int

Pod başlatıldığında ve canlılık yoklaması başarısız olduğunda Kubernetes vazgeçmeden önce failureThreshold sürelerini dener. Varsayılan değer 3'tir. En düşük değer 1'dir.

Default value: None
traffic_percentile

Sürümün bir uç noktada aldığı trafik miktarı.

Default value: None
is_default

Bu sürümün bir Uç Nokta'da varsayılan sürüm olarak yapılıp yapılmaydığı. Varsayılan değer False'tur.

Default value: None
is_control_version_type

Bu sürümün bir Uç Noktada denetim sürümü olarak yapılıp yapılmaymayacağı. Varsayılan değer False'tur.

Default value: None
cpu_cores_limit

Bu Web hizmetini kullanmasına izin verilen en fazla cpu çekirdeği sayısı. Ondalık olabilir.

Default value: None
memory_gb_limit

Bu Web hizmetini kullanmasına izin verilen maksimum bellek miktarı (GB cinsinden). Ondalık olabilir.

Default value: None

Özel durumlar

Tür Description