AksEndpoint Třída
Poznámka:
Jedná se o experimentální třídu a může se kdykoli změnit. Další informace najdete tady: https://aka.ms/acr/connected-registry.
Představuje kolekci verzí webové služby za stejným koncovým bodem spuštěným ve službě Azure Kubernetes Service.
AksWebservice Zatímco nasadí jednu službu s jedním bodovacím koncovým bodem, třída AksEndpoint umožňuje nasadit více verzí webové služby za stejným bodovacím koncovým bodem. Každá verze webové služby je možné nakonfigurovat tak, aby sloužila procentuálně provozu, abyste mohli nasadit modely řízeným způsobem, například pro testování A/B. AksEndpoint umožňuje nasazení z objektu modelu podobného AksWebservice.
Inicializuje instanci webové služby.
Konstruktor webservice načte cloudovou reprezentaci objektu webové služby přidruženého k poskytnutému pracovnímu prostoru. Vrátí instanci podřízené třídy odpovídající určitému typu načteného objektu webservice.
Konstruktor
AksEndpoint(workspace, name)
Parametry
| Name | Description |
|---|---|
|
workspace
Vyžadováno
|
Objekt pracovního prostoru obsahující objekt webové služby, který se má načíst. |
|
name
Vyžadováno
|
Název objektu webové služby, který se má načíst. |
Proměnné
| Name | Description |
|---|---|
|
versions
|
Slovník názvu verze pro objekt verze. Obsahuje všechny verze nasazené jako součást tohoto koncového bodu. |
Metody
| create_version |
Přidejte do koncového bodu novou verzi s poskytnutými vlastnostmi. |
| delete_version |
Odstranění verze v koncovém bodu |
| deploy_configuration |
Vytvořte objekt konfigurace pro nasazení do cílového výpočetního objektu AKS. |
| serialize |
Převeďte tuto webovou službu na serializovaný slovník JSON. |
| update |
Aktualizujte koncový bod s poskytnutými vlastnostmi. Hodnoty ponechané jako Žádné zůstanou v tomto koncovém bodu beze změny. |
| update_version |
Aktualizujte existující verzi v koncovém bodu s poskytnutými vlastnostmi. Hodnoty ponechané jako Žádné zůstanou v této verzi beze změny. |
create_version
Přidejte do koncového bodu novou verzi s poskytnutými vlastnostmi.
create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
Parametry
| Name | Description |
|---|---|
|
version_name
Vyžadováno
|
Název verze, která se má přidat do koncového bodu. |
|
autoscale_enabled
|
Jestli chcete povolit automatické škálování pro tuto verzi v koncovém bodu, nebo ne.
Výchozí hodnota je True, pokud Default value: None
|
|
autoscale_min_replicas
|
Minimální počet kontejnerů, které se mají použít při automatickém škálování této verze v koncovém bodu. Výchozí hodnota je 1. Default value: None
|
|
autoscale_max_replicas
|
Maximální počet kontejnerů, které se mají použít při automatickém škálování této verze v koncovém bodu. Výchozí hodnota 10 Default value: None
|
|
autoscale_refresh_seconds
|
Jak často se má automatické škálování pokusit škálovat tuto verzi v koncovém bodu. Výchozí hodnota je 1. Default value: None
|
|
autoscale_target_utilization
|
Cílové využití (v procentech z 100) by se automatické škálování mělo pokusit zachovat pro tuto verzi v koncovém bodu. Výchozí hodnota 70 Default value: None
|
|
collect_model_data
|
Jestli chcete povolit shromažďování dat modelu pro tuto verzi v koncovém bodu, nebo ne. Výchozí hodnota je False Default value: None
|
|
cpu_cores
|
Počet jader procesoru, která se mají přidělit pro tuto verzi v koncovém bodu. Může to být desetinné číslo. Výchozí hodnota je 0.1. Default value: None
|
|
memory_gb
|
Velikost paměti (v GB) pro přidělení této verze v koncovém bodu Může to být desetinné číslo. Výchozí hodnota je 0,5. Default value: None
|
|
scoring_timeout_ms
|
Vypršení časového limitu pro volání bodování do této verze v koncovém bodu Výchozí hodnota je 60000. Default value: None
|
|
replica_max_concurrent_requests
|
Počet maximálních souběžných požadavků na repliku, které umožní tuto verzi v koncovém bodu. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud nemáte pokyn technické podpory Microsoftu nebo člena týmu Azure Machine Learning. Default value: None
|
|
max_request_wait_time
|
Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500. Default value: None
|
|
num_replicas
|
Početkontejnerůch Bez výchozího nastavení, pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené. Default value: None
|
|
tags
|
Slovník značek klíč-hodnota pro poskytnutí tohoto koncového bodu Default value: None
|
|
properties
|
Slovník vlastností klíč-hodnota pro poskytnutí tohoto koncového bodu Tyto vlastnosti nelze po nasazení změnit, ale je možné přidat nové páry klíč-hodnota. Default value: None
|
|
description
|
Popis pro poskytnutí tohoto koncového bodu. Default value: None
|
|
models
|
Seznam objektů modelu, které se mají zabalit s aktualizovanou službou. Default value: None
|
|
inference_config
|
Objekt InferenceConfig použitý k poskytnutí požadovaných vlastností nasazení modelu. Default value: None
|
|
gpu_cores
|
Počet jader GPU, která se mají přidělit pro tuto verzi v koncovém bodu. Výchozí nastavení je 0. Default value: None
|
|
period_seconds
|
Jak často (v sekundách) se má provést sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1. Default value: None
|
|
initial_delay_seconds
|
Počet sekund po spuštění kontejneru před zahájením sondy aktivity Výchozí hodnota je 310. Default value: None
|
|
timeout_seconds
|
Počet sekund, po kterých vyprší časový limit sondy živé aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1. Default value: None
|
|
success_threshold
|
Minimální počet po sobě jdoucích úspěchů sondy aktivity, které se mají považovat za úspěšné po selhání. Výchozí hodnota je 1. Minimální hodnota je 1. Default value: None
|
|
failure_threshold
|
Když se pod spustí a sonda aktivity selže, Kubernetes zkusí před ukončením neúspěšné doby. Výchozí hodnota je 3. Minimální hodnota je 1. Default value: None
|
|
traffic_percentile
|
Objem provozu, který verze přebírá v koncovém bodu. Default value: None
|
|
is_default
|
Jestli chcete tuto verzi nastavit jako výchozí verzi v koncovém bodu, nebo ne. Výchozí nastavení je 'False'. Default value: None
|
|
is_control_version_type
|
Jestli chcete tuto verzi nastavit jako verzi ovládacího prvku v koncovém bodu, nebo ne. Výchozí nastavení je 'False'. Default value: None
|
|
cpu_cores_limit
|
Maximální počet jader procesoru, které tato webová služba může používat. Může to být desetinné číslo. Default value: None
|
|
memory_gb_limit
|
Maximální velikost paměti (v GB), kterou tato webová služba může používat. Může to být desetinné číslo. Default value: None
|
Výjimky
| Typ | Description |
|---|---|
delete_version
Odstranění verze v koncovém bodu
delete_version(version_name)
Parametry
| Name | Description |
|---|---|
|
version_name
Vyžadováno
|
Název verze v koncovém bodu, který chcete odstranit. |
Výjimky
| Typ | Description |
|---|---|
deploy_configuration
Vytvořte objekt konfigurace pro nasazení do cílového výpočetního objektu AKS.
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)
Parametry
| Name | Description |
|---|---|
|
autoscale_enabled
|
Jestli chcete povolit automatické škálování pro tuto verzi v koncovém bodu, nebo ne.
Výchozí hodnota je True, pokud Default value: None
|
|
autoscale_min_replicas
|
Minimální počet kontejnerů, které se mají použít při automatickém škálování této verze v koncovém bodu. Výchozí hodnota je 1. Default value: None
|
|
autoscale_max_replicas
|
Maximální počet kontejnerů, které se mají použít při automatickém škálování této verze v koncovém bodu. Výchozí nastavení je 10. Default value: None
|
|
autoscale_refresh_seconds
|
Jak často se má automatické škálování pokusit škálovat tuto verzi v koncovém bodu. Výchozí hodnota je 1. Default value: None
|
|
autoscale_target_utilization
|
Cílové využití (v procentech z 100) by se automatické škálování mělo pokusit zachovat pro tuto verzi v koncovém bodu. Výchozí hodnota je 70. Default value: None
|
|
collect_model_data
|
Jestli chcete povolit shromažďování dat modelu pro tuto verzi v koncovém bodu, nebo ne. Výchozí nastavení je 'False'. Default value: None
|
|
auth_enabled
|
Jestli chcete v koncovém bodu povolit ověřování pomocí klíče pro tuto verzi, nebo ne. Výchozí hodnota je True. Default value: None
|
|
cpu_cores
|
Počet jader procesoru, která se mají přidělit pro tuto verzi v koncovém bodu. Může to být desetinné číslo. Výchozí hodnota je 0.1. Default value: None
|
|
memory_gb
|
Velikost paměti (v GB) pro přidělení této verze v koncovém bodu Může to být desetinné číslo. Výchozí hodnota je 0,5. Default value: None
|
|
enable_app_insights
|
Jestli chcete povolit protokolování ApplicationInsights pro tuto verzi v koncovém bodu, nebo ne. Výchozí nastavení je 'False'. Default value: None
|
|
scoring_timeout_ms
|
Časový limit pro vynucení volání bodování pro tuto verzi v koncovém bodu Výchozí hodnota je 60000 Default value: None
|
|
replica_max_concurrent_requests
|
Počet maximálních souběžných požadavků na repliku, které umožní tuto verzi v koncovém bodu. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud nemáte pokyn technické podpory Microsoftu nebo člena týmu Azure Machine Learning. Default value: None
|
|
max_request_wait_time
|
Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500. Default value: None
|
|
num_replicas
|
Početkontejnerůch Bez výchozího nastavení, pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené. Default value: None
|
|
primary_key
|
Primární ověřovací klíč, který se má použít pro tento koncový bod. Default value: None
|
|
secondary_key
|
Sekundární ověřovací klíč, který se má použít pro tento koncový bod. Default value: None
|
|
tags
|
Slovník značek klíč-hodnota pro poskytnutí tohoto koncového bodu Default value: None
|
|
properties
|
Slovník vlastností klíč-hodnota pro poskytnutí tohoto koncového bodu Tyto vlastnosti nelze po nasazení změnit, ale je možné přidat nové páry klíč-hodnota. Default value: None
|
|
description
|
Popis pro poskytnutí tohoto koncového bodu. Default value: None
|
|
gpu_cores
|
Počet jader GPU, která se mají přidělit pro tuto verzi v koncovém bodu. Výchozí nastavení je 0. Default value: None
|
|
period_seconds
|
Jak často (v sekundách) se má provést sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1. Default value: None
|
|
initial_delay_seconds
|
Počet sekund po spuštění kontejneru před inicializováním sondy aktivity Výchozí hodnota je 310. Default value: None
|
|
timeout_seconds
|
Počet sekund, po kterých vyprší časový limit sondy aktivity Výchozí hodnota je 2 sekundy. Minimální hodnota je 1. Default value: None
|
|
success_threshold
|
Minimální počet po sobě jdoucích úspěchů pro sondu aktivity, které se mají považovat za úspěšné po selhání. Výchozí hodnota je 1. Minimální hodnota je 1. Default value: None
|
|
failure_threshold
|
Když se pod spustí a sonda aktivity selže, Kubernetes zkusí časy Default value: None
|
|
namespace
|
Obor názvů Kubernetes, ve kterém se má tento koncový bod nasadit: až 63 malých alfanumerických znaků (a-,-, 0-9) a pomlček (-). První a poslední znaky nesmí být pomlčky. Default value: None
|
|
token_auth_enabled
|
Jestli chcete pro tento koncový bod povolit ověřování tokenů, nebo ne. Pokud je tato možnost povolená, můžou uživatelé získat přístup k tomuto koncovému bodu načtením přístupového tokenu pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí nastavení je 'False'. Default value: None
|
|
version_name
|
Název verze v koncovém bodu Default value: None
|
|
traffic_percentile
|
objem provozu, který verze přebírá v koncovém bodu. Default value: None
|
|
compute_target_name
|
Název cílového výpočetního objektu, do které se má nasadit Default value: None
|
|
cpu_cores_limit
|
Maximální počet jader procesoru, které tato webová služba může používat. Může to být desetinné číslo. Default value: None
|
|
memory_gb_limit
|
Maximální velikost paměti (v GB), kterou tato webová služba může používat. Může to být desetinné číslo. Default value: None
|
Návraty
| Typ | Description |
|---|---|
Výjimky
| Typ | Description |
|---|---|
serialize
Převeďte tuto webovou službu na serializovaný slovník JSON.
serialize()
Návraty
| Typ | Description |
|---|---|
|
Reprezentace této webové služby ve formátu JSON. |
update
Aktualizujte koncový bod s poskytnutými vlastnostmi.
Hodnoty ponechané jako Žádné zůstanou v tomto koncovém bodu beze změny.
update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)
Parametry
| Name | Description |
|---|---|
|
auth_enabled
|
Jestli chcete v koncovém bodu povolit ověřování pomocí klíče pro tuto verzi, nebo ne. Výchozí hodnota je True. Default value: None
|
|
token_auth_enabled
|
Jestli chcete pro tento koncový bod povolit ověřování tokenů, nebo ne. Pokud je tato možnost povolená, můžou uživatelé získat přístup k tomuto koncovému bodu načtením přístupového tokenu pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí nastavení je 'False'. Default value: None
|
|
enable_app_insights
|
Jestli chcete povolit protokolování Application Insights pro tuto verzi v koncovém bodu, nebo ne. Výchozí nastavení je 'False'. Default value: None
|
|
description
|
Popis pro poskytnutí tohoto koncového bodu. Default value: None
|
|
tags
|
Slovník značek klíč-hodnota pro poskytnutí tohoto koncového bodu Default value: None
|
|
properties
|
Slovník vlastností klíč-hodnota pro poskytnutí tohoto koncového bodu Tyto vlastnosti nelze po nasazení změnit, ale je možné přidat nové páry klíč-hodnota. Default value: None
|
Výjimky
| Typ | Description |
|---|---|
update_version
Aktualizujte existující verzi v koncovém bodu s poskytnutými vlastnostmi.
Hodnoty ponechané jako Žádné zůstanou v této verzi beze změny.
update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
Parametry
| Name | Description |
|---|---|
|
version_name
Vyžadováno
|
Název verze v koncovém bodu |
|
autoscale_enabled
|
Jestli chcete povolit automatické škálování pro tuto verzi v koncovém bodu, nebo ne. Pokud num_replicas není žádná, výchozí hodnota je True. Default value: None
|
|
autoscale_min_replicas
|
Minimální počet kontejnerů, které se mají použít při automatickém škálování této verze v koncovém bodu. Výchozí hodnota je 1. Default value: None
|
|
autoscale_max_replicas
|
Maximální počet kontejnerů, které se mají použít při automatickém škálování této verze v koncovém bodu. Výchozí nastavení je 10. Default value: None
|
|
autoscale_refresh_seconds
|
Jak často se má automatické škálování pokusit škálovat tuto verzi v koncovém bodu. Výchozí hodnota je 1. Default value: None
|
|
autoscale_target_utilization
|
Cílové využití (v procentech z 100) by se automatické škálování mělo pokusit zachovat pro tuto verzi v koncovém bodu. Výchozí hodnota je 70. Default value: None
|
|
collect_model_data
|
Jestli chcete povolit shromažďování dat modelu pro tuto verzi v koncovém bodu, nebo ne. Výchozí nastavení je 'False'. Default value: None
|
|
cpu_cores
|
Počet jader procesoru, která se mají přidělit pro tuto verzi v koncovém bodu. Může to být desetinné číslo. Výchozí hodnota je 0.1. Default value: None
|
|
memory_gb
|
Velikost paměti (v GB) pro přidělení této verze v koncovém bodu Může to být desetinné číslo. Výchozí hodnota je 0,5. Default value: None
|
|
scoring_timeout_ms
|
Vypršení časového limitu pro volání bodování do této verze v koncovém bodu Výchozí hodnota je 60000. Default value: None
|
|
replica_max_concurrent_requests
|
Počet maximálních souběžných požadavků na repliku, které umožní tuto verzi v koncovém bodu. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud nemáte pokyn technické podpory Microsoftu nebo člena týmu Azure Machine Learning. Default value: None
|
|
max_request_wait_time
|
Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500. Default value: None
|
|
num_replicas
|
Početkontejnerůch Bez výchozího nastavení, pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené. Default value: None
|
|
tags
|
Slovník značek klíč-hodnota pro poskytnutí tohoto koncového bodu Default value: None
|
|
properties
|
Slovník vlastností klíč-hodnota pro poskytnutí tohoto koncového bodu Tyto vlastnosti nelze po nasazení změnit, ale je možné přidat nové páry klíč-hodnota. Default value: None
|
|
description
|
Popis pro poskytnutí tohoto koncového bodu Default value: None
|
|
models
|
Seznam objektů modelu, které se mají zabalit s aktualizovanou službou Default value: None
|
|
inference_config
|
Objekt InferenceConfig použitý k poskytnutí požadovaných vlastností nasazení modelu. Default value: None
|
|
gpu_cores
|
Počet jader GPU, která se mají přidělit pro tuto verzi v koncovém bodu. Výchozí nastavení je 0. Default value: None
|
|
period_seconds
|
Jak často (v sekundách) se má provést sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1. Default value: None
|
|
initial_delay_seconds
|
Počet sekund po spuštění kontejneru před zahájením sondy aktivity Výchozí hodnota je 310. Default value: None
|
|
timeout_seconds
|
Počet sekund, po kterých vyprší časový limit sondy živé aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1. Default value: None
|
|
success_threshold
|
Minimální počet po sobě jdoucích úspěchů sondy aktivity, které se mají považovat za úspěšné po selhání. Výchozí hodnota je 1. Minimální hodnota je 1. Default value: None
|
|
failure_threshold
|
Když se pod spustí a sonda aktivity selže, Kubernetes zkusí před ukončením neúspěšné doby. Výchozí hodnota je 3. Minimální hodnota je 1. Default value: None
|
|
traffic_percentile
|
Objem provozu, který verze přebírá v koncovém bodu. Default value: None
|
|
is_default
|
Jestli chcete tuto verzi nastavit jako výchozí verzi v koncovém bodu, nebo ne. Výchozí nastavení je 'False'. Default value: None
|
|
is_control_version_type
|
Jestli chcete tuto verzi nastavit jako verzi ovládacího prvku v koncovém bodu, nebo ne. Výchozí nastavení je 'False'. Default value: None
|
|
cpu_cores_limit
|
Maximální počet jader procesoru, které tato webová služba může používat. Může to být desetinné číslo. Default value: None
|
|
memory_gb_limit
|
Maximální velikost paměti (v GB), kterou tato webová služba může používat. Může to být desetinné číslo. Default value: None
|
Výjimky
| Typ | Description |
|---|---|