AksEndpointDeploymentConfiguration Třída
Poznámka
Toto je experimentální třída, která se může kdykoli změnit. Další informace najdete tady: https://aka.ms/azuremlexperimental.
Představuje informace o konfiguraci nasazení pro službu nasazenou na Azure Kubernetes Service.
Vytvořte objekt AksEndpointDeploymentConfiguration pomocí deploy_configuration
metody AksEndpoint třídy.
Inicializace objektu konfigurace pro nasazení koncového bodu do cílového výpočetního objektu AKS
- Dědičnost
-
AksEndpointDeploymentConfiguration
Konstruktor
AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)
Parametry
- autoscale_enabled
- bool
Určuje, jestli se má povolit automatické škálování pro tuto webovou službu.
Výchozí hodnota je Pravda, pokud num_replicas
je hodnota None.
- autoscale_min_replicas
- int
Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1.
- autoscale_max_replicas
- int
Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 10.
- autoscale_refresh_seconds
- int
Jak často se má automatické škálování pokoušet o škálování této webové služby. Výchozí hodnota je 1.
- autoscale_target_utilization
- int
Cílové využití (v procentech ze 100), které by se automatické škálování mělo pokusit zachovat pro tuto webovou službu. Výchozí hodnota je 70.
- collect_model_data
- bool
Určuje, jestli se má povolit shromažďování dat modelu pro tuto webovou službu. Výchozí hodnota je False.
- auth_enabled
- bool
Určuje, jestli se má povolit ověřování pro tuto webovou službu. Výchozí hodnota je True.
- cpu_cores
- float
Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může být desetinná čárka. Výchozí hodnota je 0,1.
- memory_gb
- float
Velikost paměti (v GB), která se má přidělit této webové službě. Může být desetinná čárka. Výchozí hodnota je 0,5.
- enable_app_insights
- bool
Jestli chcete povolit protokolování Application Insights pro tuto webovou službu. Výchozí hodnota je False.
- scoring_timeout_ms
- int
Časový limit pro vynucení bodování volání této webové služby Výchozí hodnota je 60000.
- replica_max_concurrent_requests
- int
Maximální počet souběžných požadavků na repliku, které mají být pro tuto webovou službu povoleny. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud vám k tomu nedá pokyn technická podpora Microsoftu nebo člen týmu Azure Machine Learning.
- max_request_wait_time
- int
Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.
- num_replicas
- int
Počet kontejnerů, které mají být přiděleny pro tuto webovou službu. Žádné výchozí nastavení. Pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.
Slovník vlastností klíčové hodnoty pro tuto webovou službu. Tyto vlastnosti nelze po nasazení změnit, je však možné přidat nové páry hodnot klíčů.
- gpu_cores
- int
Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí hodnota je 0.
- period_seconds
- int
Jak často (v sekundách) se má provádět sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.
- initial_delay_seconds
- int
Počet sekund po spuštění kontejneru, než se spustí sondy aktivity. Výchozí hodnota je 310.
- timeout_seconds
- int
Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.
- success_threshold
- int
Minimální počet po sobě jdoucích úspěchů sondy aktivity, který se má po selhání považovat za úspěšný. Výchozí hodnota je 1. Minimální hodnota je 1.
- failure_threshold
- int
Když se pod spustí a sonda aktivity selže, Kubernetes zkusí failureThreshold
časy, než to vzdá. Výchozí hodnota je 3. Minimální hodnota je 1.
- namespace
- str
Obor názvů Kubernetes, do kterého se má tato webová služba nasadit: až 63 znaků malých alfanumerických znaků (a-z, 0-9) a spojovníku (-). První a poslední znaky nesmí být pomlčky.
- token_auth_enabled
- bool
Určuje, jestli se má pro tuto webovou službu povolit ověřování Azure Active Directory. Pokud je tato možnost povolená, můžou uživatelé přistupovat k této webové službě načtením přístupových tokenů pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False.
- cpu_cores_limit
- float
Maximální počet jader procesoru, které může tato webová služba používat. Může být desetinná čárka.
- memory_gb_limit
- float
Maximální velikost paměti (v GB), kterou může tato webová služba používat. Může být desetinná čárka.
- autoscale_enabled
- bool
Určuje, jestli se má povolit automatické škálování pro tuto webovou službu.
Výchozí hodnota je Pravda, pokud num_replicas
je hodnota None.
- autoscale_min_replicas
- int
Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1.
- autoscale_max_replicas
- int
Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 10.
- autoscale_refresh_seconds
- int
Jak často se má automatické škálování pokoušet o škálování této webové služby. Výchozí hodnota je 1.
- autoscale_target_utilization
- int
Cílové využití (v procentech ze 100), které by se automatické škálování mělo pokusit zachovat pro tuto webovou službu. Výchozí hodnota je 70.
- collect_model_data
- bool
Určuje, jestli se má povolit shromažďování dat modelu pro tuto webovou službu. Výchozí hodnota je False.
- auth_enabled
- bool
Určuje, jestli se má povolit ověřování pro tuto webovou službu. Výchozí hodnota je True.
- cpu_cores
- float
Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může být desetinná čárka. Výchozí hodnota je 0.1.
- memory_gb
- float
Velikost paměti (v GB), která se má přidělit této webové službě. Může to být desetinná čárka. Výchozí hodnota je 0,5.
- enable_app_insights
- bool
Jestli chcete povolit protokolování Application Insights pro tuto webovou službu. Výchozí hodnota je False.
- scoring_timeout_ms
- int
Časový limit, který se má vynutit pro vyhodnocování volání této webové služby. Výchozí hodnota je 60000.
- replica_max_concurrent_requests
- int
Maximální počet souběžných požadavků na repliku, které jsou pro tuto webovou službu povolené. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud vám to nepovolí technická podpora Microsoftu nebo člen týmu Služby Azure Machine Learning.
- max_request_wait_time
- int
Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.
- num_replicas
- int
Počet kontejnerů, které se mají přidělit pro tuto webovou službu. Není výchozí. Pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.
Slovník vlastností klíčové hodnoty pro tuto webovou službu. Tyto vlastnosti nelze po nasazení změnit, je však možné přidat nové páry hodnot klíčů.
- gpu_cores
- int
Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí hodnota je 0.
- period_seconds
- int
Jak často (v sekundách) se má sonda aktivity provádět. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.
- initial_delay_seconds
- int
Počet sekund po spuštění kontejneru, než se zahájí sondy aktivity. Výchozí hodnota je 310.
- timeout_seconds
- int
Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.
- success_threshold
- int
Minimální po sobě jdoucí úspěch sondy živosti, která se má po neúspěchu považovat za úspěšnou. Výchozí hodnota je 1. Minimální hodnota je 1.
- failure_threshold
- int
Když se pod spustí a sonda živosti selže, Kubernetes zkusí failureThreshold
časy, než to vzdát. Výchozí hodnota je 3. Minimální hodnota je 1.
- namespace
- str
Obor názvů Kubernetes, ve kterém se má tato webová služba nasadit: až 63 alfanumerických znaků s malými písmeny ("a"-"z", "0"-"9") a pomlček (-). První a poslední znak nesmí být pomlčky.
- token_auth_enabled
- bool
Jestli se má pro tuto webovou službu povolit ověřování Azure Active Directory. Pokud je tato možnost povolená, uživatelé můžou k této webové službě přistupovat tak, že načítají přístupový token pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False.
- cpu_cores_limit
- float
Maximální počet jader procesoru, která může tato webová služba používat. Může to být desetinná čárka.
- memory_gb_limit
- float
Maximální velikost paměti (v GB) může tato webová služba používat. Může to být desetinná čárka.
Proměnné
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled
Zda se má povolit automatické škálování pro tuto webovou službu. Výchozí hodnota je Pravda, pokud num_replicas
je none.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas
Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas
Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 10.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds
Jak často se má automatické škálování pokoušet škálovat tuto webovou službu. Výchozí hodnota je 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization
Cílové využití (v procentech ze 100) by se automatické škálování mělo pokusit zachovat pro tuto webovou službu. Výchozí hodnota je 70.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data
Zda se má povolit shromažďování dat modelu pro tuto webovou službu. Výchozí hodnota je False.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled
Zda se má povolit ověřování pro tuto webovou službu. Výchozí hodnota je Pravda.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores
Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může to být desetinná čárka. Výchozí hodnota je 0.1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb
Velikost paměti (v GB), která se má přidělit této webové službě. Může to být desetinná čárka. Výchozí hodnota je 0,5.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights
Jestli chcete povolit protokolování Application Insights pro tuto webovou službu. Výchozí hodnota je False.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms
Časový limit, který se má vynutit pro vyhodnocování volání této webové služby. Výchozí hodnota je 60000.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests
Maximální počet souběžných požadavků na repliku, které jsou pro tuto webovou službu povolené. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud vám to nepovolí technická podpora Microsoftu nebo člen týmu Služby Azure Machine Learning.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time
Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas
Počet kontejnerů, které se mají přidělit pro tuto webovou službu. Není výchozí. Pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key
Primární ověřovací klíč, který se má použít pro tuto webovou službu
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key
Sekundární ověřovací klíč, který se má použít pro tuto webovou službu
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags
Slovník značek klíčových hodnot pro tuto webovou službu
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties
Slovník vlastností klíčové hodnoty pro tuto webovou službu. Tyto vlastnosti nelze po nasazení změnit, je však možné přidat nové páry hodnot klíčů.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description
Popis pro tuto webovou službu.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores
Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí hodnota je 0.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds
Jak často (v sekundách) se má sonda aktivity provádět. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds
Počet sekund po spuštění kontejneru, než se zahájí sondy aktivity. Výchozí hodnota je 310.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds
Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold
Minimální počet po sobě jdoucích úspěchů sondy aktivity, který se má po selhání považovat za úspěšný. Výchozí hodnota je 1. Minimální hodnota je 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold
Když se pod spustí a sonda aktivity selže, Kubernetes zkusí failureThreshold
časy, než to vzdá. Výchozí hodnota je 3. Minimální hodnota je 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace
Obor názvů Kubernetes, do kterého se má tato webová služba nasadit: až 63 znaků malých alfanumerických znaků (a-z, 0-9) a spojovníku (-). První a poslední znaky nesmí být pomlčky.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled
Určuje, jestli se má pro tuto webovou službu povolit ověřování Azure Active Directory. Pokud je tato možnost povolená, můžou uživatelé přistupovat k této webové službě načtením přístupových tokenů pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name
Název verze v koncovém bodu.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile
Objem provozu, který verze přijímá v koncovém bodu.
Metody
validate_endpoint_configuration |
Zkontrolujte, jestli jsou zadané hodnoty konfigurace platné. Pokud se ověření nezdaří, vyvolá webserviceException. |
validate_endpoint_configuration
Zkontrolujte, jestli jsou zadané hodnoty konfigurace platné.
Pokud se ověření nezdaří, vyvolá webserviceException.
validate_endpoint_configuration()
Výjimky
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro