AksWebservice Třída
Představuje model strojového učení nasazený jako koncový bod webové služby na Azure Kubernetes Service.
Nasazená služba se vytvoří z modelu, skriptu a přidružených souborů. Výsledná webová služba je koncový bod HTTP s vyrovnáváním zatížení s rozhraním REST API. Do tohoto rozhraní API můžete odesílat data a přijímat předpovědi vrácené modelem.
AksWebservice nasadí jednu službu do jednoho koncového bodu. Pokud chcete nasadit více služeb do jednoho koncového AksEndpoint bodu, použijte třídu .
Další informace najdete v tématu Nasazení modelu do clusteru Azure Kubernetes Service.
Inicializuje instanci webové služby.
Konstruktor webové služby načte cloudovou reprezentaci objektu webové služby přidruženého k poskytnutému pracovnímu prostoru. Vrátí instanci podřízené třídy odpovídající konkrétnímu typu načteného objektu Webové služby.
- Dědičnost
-
AksWebservice
Konstruktor
AksWebservice(workspace, name)
Parametry
Name | Description |
---|---|
workspace
Vyžadováno
|
Objekt pracovního prostoru obsahující objekt webové služby, který se má načíst. |
name
Vyžadováno
|
Název objektu webové služby, který se má načíst. |
Poznámky
Doporučeným vzorem nasazení je vytvořit objekt konfigurace nasazení pomocí deploy_configuration
metody a pak ho použít s metodou deploy
Model třídy, jak je znázorněno níže.
# Set the web service configuration (using default here)
aks_config = AksWebservice.deploy_configuration()
# # Enable token auth and disable (key) auth on the webservice
# aks_config = AksWebservice.deploy_configuration(token_auth_enabled=True, auth_enabled=False)
Úplná ukázka je k dispozici od https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/deployment/production-deploy-to-aks/production-deploy-to-aks.ipynb
Existuje několik způsobů, jak nasadit model jako webovou službu, včetně:
deploy
Model metoda pro modely již zaregistrované v pracovním prostoru.deploy_from_image
metoda .Webservicedeploy_from_model
Webservice pro modely již zaregistrované v pracovním prostoru. Tato metoda vytvoří image.deploy
Webservicemetoda , která zaregistruje model a vytvoří image.
Informace o práci s webovými službami najdete v tématu
Využívání modelu služby Azure Machine Learning nasazeného jako webová služba
Monitorování a shromažďování dat z koncových bodů webové služby ML
V části Variables (Proměnné) jsou uvedeny atributy místní reprezentace objektu AksWebservice cloudu. Tyto proměnné by měly být považovány za jen pro čtení. Změna jejich hodnot se neprojeví v odpovídajícím cloudovém objektu.
Proměnné
Name | Description |
---|---|
enable_app_insights
|
Určuje, jestli je pro webovou službu povolené protokolování AppInsights. |
autoscaler
|
Objekt automatického škálování pro webovou službu. |
compute_name
|
Název computeTarget, do kterého je webová služba nasazená. |
container_resource_requirements
|
Požadavky na prostředky kontejneru pro webovou službu. |
liveness_probe_requirements
|
Požadavky sondy aktivity pro webovou službu. |
data_collection
|
Objekt DataCollection pro Webservice. |
max_concurrent_requests_per_container
|
Maximální počet souběžných požadavků na kontejner pro webovou službu. |
max_request_wait_time
|
Maximální doba čekání požadavku pro webovou službu v milisekundách. |
num_replicas
|
Počet replik pro webovou službu. Každá replika odpovídá podu AKS. |
scoring_timeout_ms
|
Časový limit skóre pro webovou službu v milisekundách |
azureml.core.webservice.AksWebservice.scoring_uri
|
Bodovací koncový bod pro webovou službu |
is_default
|
Pokud je webová služba výchozí verzí pro nadřazený AksEndpoint. |
traffic_percentile
|
Jaké procento provozu se má směrovat do webové služby v nadřazené sadě AksEndpoint. |
version_type
|
Typ verze webové služby v nadřazené AksEndpoint. |
token_auth_enabled
|
Určuje, jestli je pro webovou službu povolené ověřování tokenu. |
environment
|
Prostředí objektu, který byl použit k vytvoření webové služby. |
azureml.core.webservice.AksWebservice.models
|
Seznam modelů nasazených do webové služby. |
deployment_status
|
Stav nasazení webové služby. |
namespace
|
Obor názvů AKS webové služby. |
azureml.core.webservice.AksWebservice.swagger_uri
|
Koncový bod swaggeru pro webovou službu. |
Metody
add_properties |
Přidejte páry klíčových hodnot do slovníku vlastností této webové služby. |
add_tags |
Přidejte páry hodnot klíčů do slovníku značek této webové služby. Vyvolá .WebserviceException |
deploy_configuration |
Vytvořte objekt konfigurace pro nasazení do cílového výpočetního objektu AKS. |
get_access_token |
Načtěte ověřovací token pro tuto webovou službu. |
get_token |
ZASTARALÉ. Místo toho použijte Načtěte ověřovací token pro tuto webovou službu. |
remove_tags |
Odeberte zadané klíče ze slovníku značek této webové služby. |
run |
Zavolejte tuto webovou službu se zadaným vstupem. |
serialize |
Převeďte tuto webovou službu na serializovaný slovník JSON. |
update |
Aktualizujte webovou službu pomocí zadaných vlastností. Hodnoty ponechané jako Žádné zůstanou v této webové službě beze změny. |
add_properties
Přidejte páry klíčových hodnot do slovníku vlastností této webové služby.
add_properties(properties)
Parametry
Name | Description |
---|---|
properties
Vyžadováno
|
Slovník vlastností, které chcete přidat. |
add_tags
Přidejte páry hodnot klíčů do slovníku značek této webové služby.
Vyvolá .WebserviceException
add_tags(tags)
Parametry
Name | Description |
---|---|
tags
Vyžadováno
|
Slovník značek, které chcete přidat. |
Výjimky
Typ | Description |
---|---|
deploy_configuration
Vytvořte objekt konfigurace pro nasazení do cílového výpočetního objektu AKS.
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None, blobfuse_enabled=None)
Parametry
Name | Description |
---|---|
autoscale_enabled
|
Zda se má povolit automatické škálování pro tuto webovou službu. Výchozí hodnota je True, pokud num_replicas je None.) Default value: None
|
autoscale_min_replicas
|
Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1. Default value: None
|
autoscale_max_replicas
|
Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 10. Default value: None
|
autoscale_refresh_seconds
|
Jak často se má automatické škálování pokoušet škálovat tuto webovou službu. Výchozí hodnota je 1. Default value: None
|
autoscale_target_utilization
|
Cílové využití (v procentech ze 100) by se automatické škálování mělo pokusit zachovat pro tuto webovou službu. Výchozí hodnota je 70. Default value: None
|
collect_model_data
|
Zda se má povolit shromažďování dat modelu pro tuto webovou službu. Výchozí hodnota je False. Default value: None
|
auth_enabled
|
Zda se má povolit ověřování klíčů pro tuto webovou službu. Výchozí hodnota je Pravda. Default value: None
|
cpu_cores
|
Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může to být desetinná čárka. Výchozí hodnota je 0.1. Odpovídá požadavku jádra podu, nikoli limitu, ve Azure Kubernetes Service. Default value: None
|
memory_gb
|
Velikost paměti (v GB), která se má přidělit této webové službě. Může to být desetinná čárka. Výchozí hodnota je 0,5. Odpovídá požadavku na paměť podu, nikoli limitu, v Azure Kubernetes Service. Default value: None
|
enable_app_insights
|
Jestli chcete povolit protokolování Application Insights pro tuto webovou službu. Výchozí hodnota je False. Default value: None
|
scoring_timeout_ms
|
Časový limit, který se má vynutit pro vyhodnocování volání této webové služby. Výchozí hodnota je 60000. Default value: None
|
replica_max_concurrent_requests
|
Maximální počet souběžných požadavků na repliku, které jsou pro tuto webovou službu povolené. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud vám to nepovolí technická podpora Microsoftu nebo člen týmu Služby Azure Machine Learning. Default value: None
|
max_request_wait_time
|
Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500. Default value: None
|
num_replicas
|
Počet kontejnerů, které se mají přidělit pro tuto webovou službu. Není výchozí. Pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené. Default value: None
|
primary_key
|
Primární ověřovací klíč, který se má použít pro tuto webovou službu. Default value: None
|
secondary_key
|
Sekundární ověřovací klíč, který se má použít pro tuto webovou službu. Default value: None
|
tags
|
Slovník značek klíčových hodnot pro tuto webovou službu. Default value: None
|
properties
|
Slovník vlastností klíčové hodnoty pro tuto webovou službu. Tyto vlastnosti nelze po nasazení změnit, je však možné přidat nové páry hodnot klíčů. Default value: None
|
description
|
Popis pro tuto webovou službu. Default value: None
|
gpu_cores
|
Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí hodnota je 0. Default value: None
|
period_seconds
|
Jak často (v sekundách) se má sonda aktivity provádět. Výchozí hodnota je 10 sekund. Minimální hodnota je 1. Default value: None
|
initial_delay_seconds
|
Počet sekund po spuštění kontejneru, než se zahájí sondy aktivity. Výchozí hodnota je 310. Default value: None
|
timeout_seconds
|
Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1. Default value: None
|
success_threshold
|
Minimální po sobě jdoucí úspěch sondy živosti, která se má po neúspěchu považovat za úspěšnou. Výchozí hodnota je 1. Minimální hodnota je 1. Default value: None
|
failure_threshold
|
Když se pod spustí a sonda živosti selže, Kubernetes se pokusí o selháníThreshold times, než to vzdát. Výchozí hodnota je 3. Minimální hodnota je 1. Default value: None
|
namespace
|
Obor názvů Kubernetes, ve kterém se má tato webová služba nasadit: až 63 alfanumerických znaků s malými písmeny (a-z, 0-9) a spojovníku (-). První a poslední znak nesmí být pomlčky. Default value: None
|
token_auth_enabled
|
Zda se má povolit ověřování tokenů pro tuto webovou službu. Pokud je tato možnost povolená, můžou uživatelé přistupovat k této webové službě načtením přístupového tokenu pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False. Default value: None
|
compute_target_name
|
Název cílového výpočetního prostředí, do které se má nasadit Default value: None
|
cpu_cores_limit
|
Maximální počet jader procesoru, která může tato webová služba používat. Může to být desetinná čárka. Default value: None
|
memory_gb_limit
|
Maximální velikost paměti (v GB) může tato webová služba používat. Může to být desetinná čárka. Default value: None
|
blobfuse_enabled
|
Jestli chcete povolit blobfuse pro stahování modelů pro tuto webovou službu. Výchozí hodnota je Pravda. Default value: None
|
Návraty
Typ | Description |
---|---|
Objekt konfigurace, který se má použít při nasazování služby AksWebservice. |
Výjimky
Typ | Description |
---|---|
get_access_token
Načtěte ověřovací token pro tuto webovou službu.
get_access_token()
Návraty
Typ | Description |
---|---|
Objekt popisující ověřovací token pro tuto webovou službu. |
Výjimky
Typ | Description |
---|---|
get_token
ZASTARALÉ. Místo toho použijte get_access_token
metodu.
Načtěte ověřovací token pro tuto webovou službu.
get_token()
Návraty
Typ | Description |
---|---|
Ověřovací token pro tuto webovou službu a kdy ji aktualizovat. |
Výjimky
Typ | Description |
---|---|
remove_tags
Odeberte zadané klíče ze slovníku značek této webové služby.
remove_tags(tags)
Parametry
Name | Description |
---|---|
tags
Vyžadováno
|
Seznam klíčů k odebrání |
run
Zavolejte tuto webovou službu se zadaným vstupem.
run(input_data)
Parametry
Name | Description |
---|---|
input_data
Vyžadováno
|
<xref:varies>
Vstup pro volání webové služby pomocí |
Návraty
Typ | Description |
---|---|
Výsledek volání webové služby |
Výjimky
Typ | Description |
---|---|
serialize
Převeďte tuto webovou službu na serializovaný slovník JSON.
serialize()
Návraty
Typ | Description |
---|---|
Reprezentace této webové služby ve formátu JSON. |
update
Aktualizujte webovou službu pomocí zadaných vlastností.
Hodnoty ponechané jako Žádné zůstanou v této webové službě beze změny.
update(image=None, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, cpu_cores_limit=None, memory_gb_limit=None, **kwargs)
Parametry
Name | Description |
---|---|
image
|
Nová image pro nasazení do webové služby Default value: None
|
autoscale_enabled
|
Povolení nebo zakázání automatického škálování této webové služby Default value: None
|
autoscale_min_replicas
|
Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby Default value: None
|
autoscale_max_replicas
|
Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby Default value: None
|
autoscale_refresh_seconds
|
Jak často se má automatické škálování pokoušet škálovat tuto webovou službu Default value: None
|
autoscale_target_utilization
|
Cílové využití (v procentech ze 100), které by se automatické škálování mělo pokusit zachovat pro tuto webovou službu Default value: None
|
collect_model_data
|
Povolení nebo zakázání shromažďování dat modelu pro tuto webovou službu Default value: None
|
auth_enabled
|
Zda se má povolit ověřování pro tuto webovou službu Default value: None
|
cpu_cores
|
Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může to být desetinné číslo. Default value: None
|
memory_gb
|
Velikost paměti (v GB), která se má přidělit této webové službě. Může to být desetinné číslo. Default value: None
|
enable_app_insights
|
Zda povolit protokolování Application Insights pro tuto webovou službu Default value: None
|
scoring_timeout_ms
|
Vypršení časového limitu pro vynucování pro vyhodnocování volání této webové služby Default value: None
|
replica_max_concurrent_requests
|
Maximální počet souběžných požadavků na repliku, které jsou pro tuto webovou službu povolené. Default value: None
|
max_request_wait_time
|
Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503 Default value: None
|
num_replicas
|
Počet kontejnerů, které se mají přidělit pro tuto webovou službu Default value: None
|
tags
|
Slovník značek klíčových hodnot pro tuto webovou službu. Nahradí existující značky. Default value: None
|
properties
|
Slovník vlastností klíčové hodnoty, které se mají přidat do existujícího slovníku vlastností Default value: None
|
description
|
Popis pro tuto webovou službu Default value: None
|
models
|
Seznam objektů modelu, které se mají zabalit s aktualizovanou službou Default value: None
|
inference_config
|
Objekt InferenceConfig, který slouží k poskytnutí požadovaných vlastností nasazení modelu. Default value: None
|
gpu_cores
|
Počet jader GPU, která se mají přidělit pro tuto webovou službu Default value: None
|
period_seconds
|
Jak často (v sekundách) se má sonda aktivity provádět. Výchozí hodnota je 10 sekund. Minimální hodnota je 1. Default value: None
|
initial_delay_seconds
|
Počet sekund po spuštění kontejneru před zahájením sondy živosti Default value: None
|
timeout_seconds
|
Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity. Výchozí hodnota je 1 sekunda. Minimální hodnota je 1. Default value: None
|
success_threshold
|
Minimální počet po sobě jdoucích úspěchů, aby se sonda živosti po neúspěchu považovala za úspěšnou. Výchozí hodnota je 1. Minimální hodnota je 1. Default value: None
|
failure_threshold
|
Když se pod spustí a sonda živosti selže, Kubernetes se pokusí o selháníThreshold times, než to vzdát. Výchozí hodnota je 3. Minimální hodnota je 1. Default value: None
|
namespace
|
Obor názvů Kubernetes, ve kterém se má tato webová služba nasadit: až 63 alfanumerických znaků s malými písmeny (a-z, 0-9) a spojovníku (-). První a poslední znak nesmí být pomlčky. Default value: None
|
token_auth_enabled
|
Zda se má povolit ověřování tokenů pro tuto webovou službu. Pokud je tato možnost povolená, uživatelé můžou k této webové službě přistupovat tak, že načítají přístupový token pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je Nepravda. Default value: None
|
cpu_cores_limit
|
Maximální počet jader procesoru, která může tato webová služba používat. Může to být desetinná čárka. Default value: None
|
memory_gb_limit
|
Maximální velikost paměti (v GB) může tato webová služba používat. Může to být desetinná čárka. Default value: None
|
kwargs
Vyžadováno
|
<xref:varies>
zahrnout parametry pro podporu migrace webové služby AKS do online koncového bodu a nasazení Kubernetes. is_migration=Pravda| False, compute_target=. |
Výjimky
Typ | Description |
---|---|