Sdílet prostřednictvím


AksEndpoint Třída

Poznámka:

Jedná se o experimentální třídu a může se kdykoli změnit. Další informace najdete tady: https://aka.ms/acr/connected-registry.

Představuje kolekci verzí webové služby za stejným koncovým bodem spuštěným ve službě Azure Kubernetes Service.

AksWebservice Zatímco nasadí jednu službu s jedním bodovacím koncovým bodem, třída AksEndpoint umožňuje nasadit více verzí webové služby za stejným bodovacím koncovým bodem. Každá verze webové služby je možné nakonfigurovat tak, aby sloužila procentuálně provozu, abyste mohli nasadit modely řízeným způsobem, například pro testování A/B. AksEndpoint umožňuje nasazení z objektu modelu podobného AksWebservice.

Inicializuje instanci webové služby.

Konstruktor webservice načte cloudovou reprezentaci objektu webové služby přidruženého k poskytnutému pracovnímu prostoru. Vrátí instanci podřízené třídy odpovídající určitému typu načteného objektu webservice.

Konstruktor

AksEndpoint(workspace, name)

Parametry

Name Description
workspace
Vyžadováno

Objekt pracovního prostoru obsahující objekt webové služby, který se má načíst.

name
Vyžadováno
str

Název objektu webové služby, který se má načíst.

Proměnné

Name Description
versions

Slovník názvu verze pro objekt verze. Obsahuje všechny verze nasazené jako součást tohoto koncového bodu.

Metody

create_version

Přidejte do koncového bodu novou verzi s poskytnutými vlastnostmi.

delete_version

Odstranění verze v koncovém bodu

deploy_configuration

Vytvořte objekt konfigurace pro nasazení do cílového výpočetního objektu AKS.

serialize

Převeďte tuto webovou službu na serializovaný slovník JSON.

update

Aktualizujte koncový bod s poskytnutými vlastnostmi.

Hodnoty ponechané jako Žádné zůstanou v tomto koncovém bodu beze změny.

update_version

Aktualizujte existující verzi v koncovém bodu s poskytnutými vlastnostmi.

Hodnoty ponechané jako Žádné zůstanou v této verzi beze změny.

create_version

Přidejte do koncového bodu novou verzi s poskytnutými vlastnostmi.

create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

Parametry

Name Description
version_name
Vyžadováno
str

Název verze, která se má přidat do koncového bodu.

autoscale_enabled

Jestli chcete povolit automatické škálování pro tuto verzi v koncovém bodu, nebo ne. Výchozí hodnota je True, pokud num_replicas je žádná.

Default value: None
autoscale_min_replicas
int

Minimální počet kontejnerů, které se mají použít při automatickém škálování této verze v koncovém bodu. Výchozí hodnota je 1.

Default value: None
autoscale_max_replicas
int

Maximální počet kontejnerů, které se mají použít při automatickém škálování této verze v koncovém bodu. Výchozí hodnota 10

Default value: None
autoscale_refresh_seconds
int

Jak často se má automatické škálování pokusit škálovat tuto verzi v koncovém bodu. Výchozí hodnota je 1.

Default value: None
autoscale_target_utilization
int

Cílové využití (v procentech z 100) by se automatické škálování mělo pokusit zachovat pro tuto verzi v koncovém bodu. Výchozí hodnota 70

Default value: None
collect_model_data

Jestli chcete povolit shromažďování dat modelu pro tuto verzi v koncovém bodu, nebo ne. Výchozí hodnota je False

Default value: None
cpu_cores

Počet jader procesoru, která se mají přidělit pro tuto verzi v koncovém bodu. Může to být desetinné číslo. Výchozí hodnota je 0.1.

Default value: None
memory_gb

Velikost paměti (v GB) pro přidělení této verze v koncovém bodu Může to být desetinné číslo. Výchozí hodnota je 0,5.

Default value: None
scoring_timeout_ms
int

Vypršení časového limitu pro volání bodování do této verze v koncovém bodu Výchozí hodnota je 60000.

Default value: None
replica_max_concurrent_requests
int

Počet maximálních souběžných požadavků na repliku, které umožní tuto verzi v koncovém bodu. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud nemáte pokyn technické podpory Microsoftu nebo člena týmu Azure Machine Learning.

Default value: None
max_request_wait_time
int

Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.

Default value: None
num_replicas
int

Početkontejnerůch Bez výchozího nastavení, pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.

Default value: None
tags

Slovník značek klíč-hodnota pro poskytnutí tohoto koncového bodu

Default value: None
properties

Slovník vlastností klíč-hodnota pro poskytnutí tohoto koncového bodu Tyto vlastnosti nelze po nasazení změnit, ale je možné přidat nové páry klíč-hodnota.

Default value: None
description
str

Popis pro poskytnutí tohoto koncového bodu.

Default value: None
models

Seznam objektů modelu, které se mají zabalit s aktualizovanou službou.

Default value: None
inference_config

Objekt InferenceConfig použitý k poskytnutí požadovaných vlastností nasazení modelu.

Default value: None
gpu_cores
int

Počet jader GPU, která se mají přidělit pro tuto verzi v koncovém bodu. Výchozí nastavení je 0.

Default value: None
period_seconds
int

Jak často (v sekundách) se má provést sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.

Default value: None
initial_delay_seconds
int

Počet sekund po spuštění kontejneru před zahájením sondy aktivity Výchozí hodnota je 310.

Default value: None
timeout_seconds
int

Počet sekund, po kterých vyprší časový limit sondy živé aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.

Default value: None
success_threshold
int

Minimální počet po sobě jdoucích úspěchů sondy aktivity, které se mají považovat za úspěšné po selhání. Výchozí hodnota je 1. Minimální hodnota je 1.

Default value: None
failure_threshold
int

Když se pod spustí a sonda aktivity selže, Kubernetes zkusí před ukončením neúspěšné doby. Výchozí hodnota je 3. Minimální hodnota je 1.

Default value: None
traffic_percentile

Objem provozu, který verze přebírá v koncovém bodu.

Default value: None
is_default

Jestli chcete tuto verzi nastavit jako výchozí verzi v koncovém bodu, nebo ne. Výchozí nastavení je 'False'.

Default value: None
is_control_version_type

Jestli chcete tuto verzi nastavit jako verzi ovládacího prvku v koncovém bodu, nebo ne. Výchozí nastavení je 'False'.

Default value: None
cpu_cores_limit

Maximální počet jader procesoru, které tato webová služba může používat. Může to být desetinné číslo.

Default value: None
memory_gb_limit

Maximální velikost paměti (v GB), kterou tato webová služba může používat. Může to být desetinné číslo.

Default value: None

Výjimky

Typ Description

delete_version

Odstranění verze v koncovém bodu

delete_version(version_name)

Parametry

Name Description
version_name
Vyžadováno
str

Název verze v koncovém bodu, který chcete odstranit.

Výjimky

Typ Description

deploy_configuration

Vytvořte objekt konfigurace pro nasazení do cílového výpočetního objektu AKS.

static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)

Parametry

Name Description
autoscale_enabled

Jestli chcete povolit automatické škálování pro tuto verzi v koncovém bodu, nebo ne. Výchozí hodnota je True, pokud num_replicas je žádná.

Default value: None
autoscale_min_replicas
int

Minimální počet kontejnerů, které se mají použít při automatickém škálování této verze v koncovém bodu. Výchozí hodnota je 1.

Default value: None
autoscale_max_replicas
int

Maximální počet kontejnerů, které se mají použít při automatickém škálování této verze v koncovém bodu. Výchozí nastavení je 10.

Default value: None
autoscale_refresh_seconds
int

Jak často se má automatické škálování pokusit škálovat tuto verzi v koncovém bodu. Výchozí hodnota je 1.

Default value: None
autoscale_target_utilization
int

Cílové využití (v procentech z 100) by se automatické škálování mělo pokusit zachovat pro tuto verzi v koncovém bodu. Výchozí hodnota je 70.

Default value: None
collect_model_data

Jestli chcete povolit shromažďování dat modelu pro tuto verzi v koncovém bodu, nebo ne. Výchozí nastavení je 'False'.

Default value: None
auth_enabled

Jestli chcete v koncovém bodu povolit ověřování pomocí klíče pro tuto verzi, nebo ne. Výchozí hodnota je True.

Default value: None
cpu_cores

Počet jader procesoru, která se mají přidělit pro tuto verzi v koncovém bodu. Může to být desetinné číslo. Výchozí hodnota je 0.1.

Default value: None
memory_gb

Velikost paměti (v GB) pro přidělení této verze v koncovém bodu Může to být desetinné číslo. Výchozí hodnota je 0,5.

Default value: None
enable_app_insights

Jestli chcete povolit protokolování ApplicationInsights pro tuto verzi v koncovém bodu, nebo ne. Výchozí nastavení je 'False'.

Default value: None
scoring_timeout_ms
int

Časový limit pro vynucení volání bodování pro tuto verzi v koncovém bodu Výchozí hodnota je 60000

Default value: None
replica_max_concurrent_requests
int

Počet maximálních souběžných požadavků na repliku, které umožní tuto verzi v koncovém bodu. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud nemáte pokyn technické podpory Microsoftu nebo člena týmu Azure Machine Learning.

Default value: None
max_request_wait_time
int

Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.

Default value: None
num_replicas
int

Početkontejnerůch Bez výchozího nastavení, pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.

Default value: None
primary_key
str

Primární ověřovací klíč, který se má použít pro tento koncový bod.

Default value: None
secondary_key
str

Sekundární ověřovací klíč, který se má použít pro tento koncový bod.

Default value: None
tags

Slovník značek klíč-hodnota pro poskytnutí tohoto koncového bodu

Default value: None
properties

Slovník vlastností klíč-hodnota pro poskytnutí tohoto koncového bodu Tyto vlastnosti nelze po nasazení změnit, ale je možné přidat nové páry klíč-hodnota.

Default value: None
description
str

Popis pro poskytnutí tohoto koncového bodu.

Default value: None
gpu_cores
int

Počet jader GPU, která se mají přidělit pro tuto verzi v koncovém bodu. Výchozí nastavení je 0.

Default value: None
period_seconds
int

Jak často (v sekundách) se má provést sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.

Default value: None
initial_delay_seconds
int

Počet sekund po spuštění kontejneru před inicializováním sondy aktivity Výchozí hodnota je 310.

Default value: None
timeout_seconds
int

Počet sekund, po kterých vyprší časový limit sondy aktivity Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.

Default value: None
success_threshold
int

Minimální počet po sobě jdoucích úspěchů pro sondu aktivity, které se mají považovat za úspěšné po selhání. Výchozí hodnota je 1. Minimální hodnota je 1.

Default value: None
failure_threshold
int

Když se pod spustí a sonda aktivity selže, Kubernetes zkusí časy failureThreshold , než se vzdá. Výchozí hodnota je 3. Minimální hodnota je 1.

Default value: None
namespace
str

Obor názvů Kubernetes, ve kterém se má tento koncový bod nasadit: až 63 malých alfanumerických znaků (a-,-, 0-9) a pomlček (-). První a poslední znaky nesmí být pomlčky.

Default value: None
token_auth_enabled

Jestli chcete pro tento koncový bod povolit ověřování tokenů, nebo ne. Pokud je tato možnost povolená, můžou uživatelé získat přístup k tomuto koncovému bodu načtením přístupového tokenu pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí nastavení je 'False'.

Default value: None
version_name
str

Název verze v koncovém bodu

Default value: None
traffic_percentile

objem provozu, který verze přebírá v koncovém bodu.

Default value: None
compute_target_name
str

Název cílového výpočetního objektu, do které se má nasadit

Default value: None
cpu_cores_limit

Maximální počet jader procesoru, které tato webová služba může používat. Může to být desetinné číslo.

Default value: None
memory_gb_limit

Maximální velikost paměti (v GB), kterou tato webová služba může používat. Může to být desetinné číslo.

Default value: None

Návraty

Typ Description

Výjimky

Typ Description

serialize

Převeďte tuto webovou službu na serializovaný slovník JSON.

serialize()

Návraty

Typ Description

Reprezentace této webové služby ve formátu JSON.

update

Aktualizujte koncový bod s poskytnutými vlastnostmi.

Hodnoty ponechané jako Žádné zůstanou v tomto koncovém bodu beze změny.

update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)

Parametry

Name Description
auth_enabled

Jestli chcete v koncovém bodu povolit ověřování pomocí klíče pro tuto verzi, nebo ne. Výchozí hodnota je True.

Default value: None
token_auth_enabled

Jestli chcete pro tento koncový bod povolit ověřování tokenů, nebo ne. Pokud je tato možnost povolená, můžou uživatelé získat přístup k tomuto koncovému bodu načtením přístupového tokenu pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí nastavení je 'False'.

Default value: None
enable_app_insights

Jestli chcete povolit protokolování Application Insights pro tuto verzi v koncovém bodu, nebo ne. Výchozí nastavení je 'False'.

Default value: None
description
str

Popis pro poskytnutí tohoto koncového bodu.

Default value: None
tags

Slovník značek klíč-hodnota pro poskytnutí tohoto koncového bodu

Default value: None
properties

Slovník vlastností klíč-hodnota pro poskytnutí tohoto koncového bodu Tyto vlastnosti nelze po nasazení změnit, ale je možné přidat nové páry klíč-hodnota.

Default value: None

Výjimky

Typ Description

update_version

Aktualizujte existující verzi v koncovém bodu s poskytnutými vlastnostmi.

Hodnoty ponechané jako Žádné zůstanou v této verzi beze změny.

update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

Parametry

Name Description
version_name
Vyžadováno
str

Název verze v koncovém bodu

autoscale_enabled

Jestli chcete povolit automatické škálování pro tuto verzi v koncovém bodu, nebo ne. Pokud num_replicas není žádná, výchozí hodnota je True.

Default value: None
autoscale_min_replicas
int

Minimální počet kontejnerů, které se mají použít při automatickém škálování této verze v koncovém bodu. Výchozí hodnota je 1.

Default value: None
autoscale_max_replicas
int

Maximální počet kontejnerů, které se mají použít při automatickém škálování této verze v koncovém bodu. Výchozí nastavení je 10.

Default value: None
autoscale_refresh_seconds
int

Jak často se má automatické škálování pokusit škálovat tuto verzi v koncovém bodu. Výchozí hodnota je 1.

Default value: None
autoscale_target_utilization
int

Cílové využití (v procentech z 100) by se automatické škálování mělo pokusit zachovat pro tuto verzi v koncovém bodu. Výchozí hodnota je 70.

Default value: None
collect_model_data

Jestli chcete povolit shromažďování dat modelu pro tuto verzi v koncovém bodu, nebo ne. Výchozí nastavení je 'False'.

Default value: None
cpu_cores

Počet jader procesoru, která se mají přidělit pro tuto verzi v koncovém bodu. Může to být desetinné číslo. Výchozí hodnota je 0.1.

Default value: None
memory_gb

Velikost paměti (v GB) pro přidělení této verze v koncovém bodu Může to být desetinné číslo. Výchozí hodnota je 0,5.

Default value: None
scoring_timeout_ms
int

Vypršení časového limitu pro volání bodování do této verze v koncovém bodu Výchozí hodnota je 60000.

Default value: None
replica_max_concurrent_requests
int

Počet maximálních souběžných požadavků na repliku, které umožní tuto verzi v koncovém bodu. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud nemáte pokyn technické podpory Microsoftu nebo člena týmu Azure Machine Learning.

Default value: None
max_request_wait_time
int

Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.

Default value: None
num_replicas
int

Početkontejnerůch Bez výchozího nastavení, pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.

Default value: None
tags

Slovník značek klíč-hodnota pro poskytnutí tohoto koncového bodu

Default value: None
properties

Slovník vlastností klíč-hodnota pro poskytnutí tohoto koncového bodu Tyto vlastnosti nelze po nasazení změnit, ale je možné přidat nové páry klíč-hodnota.

Default value: None
description
str

Popis pro poskytnutí tohoto koncového bodu

Default value: None
models

Seznam objektů modelu, které se mají zabalit s aktualizovanou službou

Default value: None
inference_config

Objekt InferenceConfig použitý k poskytnutí požadovaných vlastností nasazení modelu.

Default value: None
gpu_cores
int

Počet jader GPU, která se mají přidělit pro tuto verzi v koncovém bodu. Výchozí nastavení je 0.

Default value: None
period_seconds
int

Jak často (v sekundách) se má provést sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.

Default value: None
initial_delay_seconds
int

Počet sekund po spuštění kontejneru před zahájením sondy aktivity Výchozí hodnota je 310.

Default value: None
timeout_seconds
int

Počet sekund, po kterých vyprší časový limit sondy živé aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.

Default value: None
success_threshold
int

Minimální počet po sobě jdoucích úspěchů sondy aktivity, které se mají považovat za úspěšné po selhání. Výchozí hodnota je 1. Minimální hodnota je 1.

Default value: None
failure_threshold
int

Když se pod spustí a sonda aktivity selže, Kubernetes zkusí před ukončením neúspěšné doby. Výchozí hodnota je 3. Minimální hodnota je 1.

Default value: None
traffic_percentile

Objem provozu, který verze přebírá v koncovém bodu.

Default value: None
is_default

Jestli chcete tuto verzi nastavit jako výchozí verzi v koncovém bodu, nebo ne. Výchozí nastavení je 'False'.

Default value: None
is_control_version_type

Jestli chcete tuto verzi nastavit jako verzi ovládacího prvku v koncovém bodu, nebo ne. Výchozí nastavení je 'False'.

Default value: None
cpu_cores_limit

Maximální počet jader procesoru, které tato webová služba může používat. Může to být desetinné číslo.

Default value: None
memory_gb_limit

Maximální velikost paměti (v GB), kterou tato webová služba může používat. Může to být desetinné číslo.

Default value: None

Výjimky

Typ Description