Sdílet prostřednictvím


AksServiceDeploymentConfiguration Třída

Představuje informace o konfiguraci nasazení pro službu nasazenou ve službě Azure Kubernetes Service.

Vytvořte objekt AksServiceDeploymentConfiguration pomocí deploy_configuration metody AksWebservice třídy.

Inicializace objektu konfigurace pro nasazení do cílového výpočetního objektu AKS

Konstruktor

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parametry

Name Description
cpu_cores_limit
Vyžadováno

Maximální počet jader procesoru, které tato webová služba může používat. Může to být desetinné číslo.

memory_gb_limit
Vyžadováno

Maximální velikost paměti (v GB), kterou tato webová služba může používat. Může to být desetinné číslo.

autoscale_enabled
Vyžadováno

Určuje, jestli se má pro tuto webovou službu povolit automatické škálování. Výchozí hodnota je True, pokud num_replicas je žádná.

autoscale_min_replicas
Vyžadováno
int

Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1.

autoscale_max_replicas
Vyžadováno
int

Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota 10

autoscale_refresh_seconds
Vyžadováno
int

Jak často se má automatické škálování pokusit tuto webovou službu škálovat. Výchozí hodnota je 1.

autoscale_target_utilization
Vyžadováno
int

Cílové využití (v procentech z 100) by se automatické škálování mělo pokoušet udržovat pro tuto webovou službu. Výchozí hodnota je 70.

collect_model_data
Vyžadováno

Jestli chcete povolit shromažďování dat modelu pro tuto webovou službu, nebo ne. Výchozí nastavení je 'False'.

auth_enabled
Vyžadováno

Jestli chcete povolit ověřování pro tuto webovou službu, nebo ne. Výchozí hodnota je True.

cpu_cores
Vyžadováno

Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může to být desetinné číslo. Výchozí hodnota je 0.1.

memory_gb
Vyžadováno

Velikost paměti (v GB) pro přidělení této webové služby. Může to být desetinné číslo. Výchozí hodnota je 0,5.

enable_app_insights
Vyžadováno

Bez ohledu na to, jestli chcete pro tuto webovou službu povolit protokolování Application Insights. Výchozí hodnota je False

scoring_timeout_ms
Vyžadováno
int

Vypršení časového limitu pro volání bodování této webové služby. Výchozí hodnota je 60000.

replica_max_concurrent_requests
Vyžadováno
int

Počet maximálních souběžných požadavků na repliku, které umožní tuto webovou službu. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud nemáte pokyn technické podpory Microsoftu nebo člena týmu Azure Machine Learning.

max_request_wait_time
Vyžadováno
int

Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.

num_replicas
Vyžadováno
int

Počet kontejnerů, které se mají přidělit pro tuto webovou službu. Bez výchozího nastavení, pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.

primary_key
Vyžadováno
str

Primární ověřovací klíč, který se má použít pro tuto webovou službu.

secondary_key
Vyžadováno
str

Sekundární ověřovací klíč, který se má použít pro tuto webovou službu.

tags
Vyžadováno

Slovník značek klíč-hodnota pro poskytnutí této webové služby

properties
Vyžadováno

Slovník vlastností klíč-hodnota pro poskytnutí této webové služby. Tyto vlastnosti nelze po nasazení změnit, ale je možné přidat nové páry klíč-hodnota.

description
Vyžadováno
str

Popis této webové služby.

gpu_cores
Vyžadováno
int

Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí nastavení je 0.

period_seconds
Vyžadováno
int

Jak často (v sekundách) se má provést sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.

initial_delay_seconds
Vyžadováno
int

Počet sekund po spuštění kontejneru před inicializováním sondy aktivity Výchozí hodnota je 310.

timeout_seconds
Vyžadováno
int

Počet sekund, po kterých vyprší časový limit sondy aktivity Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.

success_threshold
Vyžadováno
int

Minimální počet po sobě jdoucích úspěchů pro sondu aktivity, které se mají považovat za úspěšné po selhání. Výchozí hodnota je 1. Minimální hodnota je 1.

failure_threshold
Vyžadováno
int

Když se pod spustí a sonda aktivity selže, Kubernetes zkusí časy failureThreshold , než se vzdá. Výchozí hodnota je 3. Minimální hodnota je 1.

namespace
Vyžadováno
str

Obor názvů Kubernetes, ve kterém chcete nasadit tuto webovou službu: až 63 malých alfanumerických znaků ('a'-'z', '0'-'9') a pomlček (-'). První a poslední znaky nesmí být pomlčky.

token_auth_enabled
Vyžadováno

Jestli chcete povolit ověřování Azure Active Directory pro tuto webovou službu, nebo ne. Pokud je tato možnost povolená, uživatelé mají přístup k této webové službě načtením přístupového tokenu pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí nastavení je 'False'.

cpu_cores_limit
Vyžadováno

Maximální počet jader procesoru, které tato webová služba může používat. Může to být desetinné číslo.

memory_gb_limit
Vyžadováno

Maximální velikost paměti (v GB), kterou tato webová služba může používat. Může to být desetinné číslo.

blobfuse_enabled

Jestli chcete povolit objekt blobfuse pro stahování modelu pro tuto webovou službu, nebo ne. Výchozí hodnota je True

Default value: None
autoscale_enabled
Vyžadováno

Určuje, jestli se má pro tuto webovou službu povolit automatické škálování. Výchozí hodnota je True, pokud num_replicas je žádná.

autoscale_min_replicas
Vyžadováno
int

Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1.

autoscale_max_replicas
Vyžadováno
int

Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota 10

autoscale_refresh_seconds
Vyžadováno
int

Jak často se má automatické škálování pokusit tuto webovou službu škálovat. Výchozí hodnota je 1.

autoscale_target_utilization
Vyžadováno
int

Cílové využití (v procentech z 100) by se automatické škálování mělo pokoušet udržovat pro tuto webovou službu. Výchozí hodnota je 70.

collect_model_data
Vyžadováno

Jestli chcete povolit shromažďování dat modelu pro tuto webovou službu, nebo ne. Výchozí nastavení je 'False'.

auth_enabled
Vyžadováno

Jestli chcete povolit ověřování pro tuto webovou službu, nebo ne. Výchozí hodnota je True.

cpu_cores
Vyžadováno

Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může to být desetinné číslo. Výchozí hodnota je 0.1.

memory_gb
Vyžadováno

Velikost paměti (v GB) pro přidělení této webové služby. Může to být desetinné číslo. Výchozí hodnota je 0,5.

enable_app_insights
Vyžadováno

Bez ohledu na to, jestli chcete pro tuto webovou službu povolit protokolování Application Insights. Výchozí hodnota je False

scoring_timeout_ms
Vyžadováno
int

Vypršení časového limitu pro volání bodování této webové služby. Výchozí hodnota je 60000.

replica_max_concurrent_requests
Vyžadováno
int

Počet maximálních souběžných požadavků na repliku, které umožní tuto webovou službu. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud nemáte pokyn technické podpory Microsoftu nebo člena týmu Azure Machine Learning.

max_request_wait_time
Vyžadováno
int

Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.

num_replicas
Vyžadováno
int

Počet kontejnerů, které se mají přidělit pro tuto webovou službu. Bez výchozího nastavení, pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.

primary_key
Vyžadováno
str

Primární ověřovací klíč, který se má použít pro tuto webovou službu.

secondary_key
Vyžadováno
str

Sekundární ověřovací klíč, který se má použít pro tuto webovou službu.

tags
Vyžadováno

Slovník značek klíč-hodnota pro poskytnutí této webové služby

properties
Vyžadováno

Slovník vlastností klíč-hodnota pro poskytnutí této webové služby. Tyto vlastnosti nelze po nasazení změnit, ale je možné přidat nové páry klíč-hodnota.

description
Vyžadováno
str

Popis této webové služby.

gpu_cores
Vyžadováno
int

Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí nastavení je 0.

period_seconds
Vyžadováno
int

Jak často (v sekundách) se má provést sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.

initial_delay_seconds
Vyžadováno
int

Počet sekund po spuštění kontejneru před inicializováním sondy aktivity Výchozí hodnota je 310.

timeout_seconds
Vyžadováno
int

Počet sekund, po kterých vyprší časový limit sondy aktivity Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.

success_threshold
Vyžadováno
int

Minimální počet po sobě jdoucích úspěchů pro sondu aktivity, které se mají považovat za úspěšné po selhání. Výchozí hodnota je 1. Minimální hodnota je 1.

failure_threshold
Vyžadováno
int

Když se pod spustí a sonda aktivity selže, Kubernetes zkusí časy failureThreshold , než se vzdá. Výchozí hodnota je 3. Minimální hodnota je 1.

namespace
Vyžadováno
str

Obor názvů Kubernetes, ve kterém chcete nasadit tuto webovou službu: až 63 malých alfanumerických znaků ('a'-'z', '0'-'9') a pomlček (-'). První a poslední znaky nesmí být pomlčky.

token_auth_enabled
Vyžadováno

Jestli chcete povolit ověřování Azure Active Directory pro tuto webovou službu, nebo ne. Pokud je tato možnost povolená, uživatelé mají přístup k této webové službě načtením přístupového tokenu pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí nastavení je 'False'.

compute_target_name
Vyžadováno
str

Název cílového výpočetního objektu, do které se má nasadit

cpu_cores_limit
Vyžadováno

Maximální počet jader procesoru, které tato webová služba může používat. Může to být desetinné číslo.

memory_gb_limit
Vyžadováno

Maximální velikost paměti (v GB), kterou tato webová služba může používat. Může to být desetinné číslo.

blobfuse_enabled
Vyžadováno

Jestli chcete povolit objekt blobfuse pro stahování modelu pro tuto webovou službu, nebo ne. Výchozí hodnota je True

Proměnné

Name Description
autoscale_enabled

Určuje, jestli se má pro tuto webovou službu povolit automatické škálování. Výchozí hodnota je True, pokud num_replicas je žádná.

autoscale_min_replicas
int

Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1.

autoscale_max_replicas
int

Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota 10

autoscale_refresh_seconds
int

Jak často se má automatické škálování pokusit tuto webovou službu škálovat. Výchozí hodnota je 1.

autoscale_target_utilization
int

Cílové využití (v procentech z 100) by se automatické škálování mělo pokoušet udržovat pro tuto webovou službu. Výchozí hodnota je 70.

collect_model_data

Jestli chcete povolit shromažďování dat modelu pro tuto webovou službu, nebo ne. Výchozí nastavení je 'False'.

auth_enabled

Jestli chcete povolit ověřování pro tuto webovou službu, nebo ne. Výchozí hodnota je True.

cpu_cores

Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může to být desetinné číslo. Výchozí hodnota je 0.1.

memory_gb

Velikost paměti (v GB) pro přidělení této webové služby. Může to být desetinné číslo. Výchozí hodnota je 0,5.

enable_app_insights

Bez ohledu na to, jestli chcete pro tuto webovou službu povolit protokolování Application Insights. Výchozí hodnota je False

scoring_timeout_ms
int

Vypršení časového limitu pro volání bodování této webové služby. Výchozí hodnota je 60000.

replica_max_concurrent_requests
int

Počet maximálních souběžných požadavků na repliku, které umožní tuto webovou službu. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud nemáte pokyn technické podpory Microsoftu nebo člena týmu Azure Machine Learning.

max_request_wait_time
int

Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.

num_replicas
int

Počet kontejnerů, které se mají přidělit pro tuto webovou službu. Bez výchozího nastavení, pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.

primary_key
str

Primární ověřovací klíč, který se má použít pro tuto webovou službu.

secondary_key
str

Sekundární ověřovací klíč, který se má použít pro tuto webovou službu.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Slovník značek klíč-hodnota pro poskytnutí této webové služby

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Slovník vlastností klíč-hodnota pro poskytnutí této webové služby. Tyto vlastnosti nelze po nasazení změnit, ale je možné přidat nové páry klíč-hodnota.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

Popis této webové služby.

gpu_cores
int

Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí nastavení je 0.

period_seconds
int

Jak často (v sekundách) se má provést sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.

initial_delay_seconds
int

Počet sekund po spuštění kontejneru před inicializováním sondy aktivity Výchozí hodnota je 310.

timeout_seconds
int

Počet sekund, po kterých vyprší časový limit sondy aktivity Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.

success_threshold
int

Minimální počet po sobě jdoucích úspěchů pro sondu aktivity, které se mají považovat za úspěšné po selhání. Výchozí hodnota je 1. Minimální hodnota je 1.

failure_threshold
int

Když se pod spustí a sonda aktivity selže, Kubernetes zkusí časy failureThreshold , než se vzdá. Výchozí hodnota je 3. Minimální hodnota je 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

Obor názvů Kubernetes, ve kterém chcete nasadit tuto webovou službu: až 63 malých alfanumerických znaků ('a'-'z', '0'-'9') a pomlček (-'). První a poslední znaky nesmí být pomlčky.

token_auth_enabled

Jestli chcete povolit ověřování Azure Active Directory pro tuto webovou službu, nebo ne. Pokud je tato možnost povolená, uživatelé mají přístup k této webové službě načtením přístupového tokenu pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí nastavení je 'False'.

Metody

print_deploy_configuration

Vytiskněte konfiguraci nasazení.

validate_configuration

Zkontrolujte, jestli jsou zadané konfigurační hodnoty platné.

Pokud se ověření nezdaří, vyvolá se výjimka WebserviceException.

print_deploy_configuration

Vytiskněte konfiguraci nasazení.

print_deploy_configuration()

validate_configuration

Zkontrolujte, jestli jsou zadané konfigurační hodnoty platné.

Pokud se ověření nezdaří, vyvolá se výjimka WebserviceException.

validate_configuration()

Výjimky

Typ Description