AksWebservice Klass
Representerar en maskininlärningsmodell som distribuerats som en webbtjänstslutpunkt på Azure Kubernetes Service.
En distribuerad tjänst skapas från en modell, ett skript och associerade filer. Den resulterande webbtjänsten är en belastningsutjämnings-HTTP-slutpunkt med ett REST-API. Du kan skicka data till det här API:et och få förutsägelsen som returneras av modellen.
AksWebservice distribuerar en enda tjänst till en slutpunkt. Om du vill distribuera flera tjänster till en slutpunkt använder du AksEndpoint klassen .
Mer information finns i Distribuera en modell till ett Azure Kubernetes Service kluster.
Initiera webbtjänstinstansen.
Webbtjänstkonstruktorn hämtar en molnrepresentation av ett webbtjänstobjekt som är associerat med den angivna arbetsytan. Den returnerar en instans av en underordnad klass som motsvarar den specifika typen av det hämtade webbtjänstobjektet.
- Arv
-
AksWebservice
Konstruktor
AksWebservice(workspace, name)
Parametrar
Name | Description |
---|---|
workspace
Obligatorisk
|
Arbetsyteobjektet som innehåller webbtjänstobjektet som ska hämtas. |
name
Obligatorisk
|
Namnet på webbtjänstobjektet som ska hämtas. |
Kommentarer
Det rekommenderade distributionsmönstret är att skapa ett distributionskonfigurationsobjekt med deploy_configuration
metoden och sedan använda det med deploy
metoden i Model klassen enligt nedan.
# Set the web service configuration (using default here)
aks_config = AksWebservice.deploy_configuration()
# # Enable token auth and disable (key) auth on the webservice
# aks_config = AksWebservice.deploy_configuration(token_auth_enabled=True, auth_enabled=False)
Fullständigt exempel är tillgängligt från https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/deployment/production-deploy-to-aks/production-deploy-to-aks.ipynb
Det finns ett antal sätt att distribuera en modell som en webbtjänst, bland annat med:
deploy
metoden för för modeller som Model redan är registrerade på arbetsytan.deploy_from_image
-metod för Webservice.deploy_from_model
Webservice metoden för för modeller som redan har registrerats på arbetsytan. Den här metoden skapar en avbildning.deploy
-metoden för Webservice, som registrerar en modell och skapar en avbildning.
Information om hur du arbetar med webbtjänster finns i
Konsumera en Azure Machine Learning-modell som distribuerats som en webbtjänst
Se Övervaka och samla in data från webbtjänstslutpunkter i ML
I avsnittet Variabler visas attribut för en lokal representation av akswebserviceobjektet i molnet. Dessa variabler bör betraktas som skrivskyddade. Att ändra deras värden återspeglas inte i motsvarande molnobjekt.
Variabler
Name | Description |
---|---|
enable_app_insights
|
Om AppInsights-loggning är aktiverat för webbtjänsten eller inte. |
autoscaler
|
Autoskalningsobjektet för webbtjänsten. |
compute_name
|
Namnet på den ComputeTarget som webbtjänsten distribueras till. |
container_resource_requirements
|
Resurskraven för containern för webbtjänsten. |
liveness_probe_requirements
|
Kraven för livenessavsökning för webbtjänsten. |
data_collection
|
DataCollection-objektet för webbtjänsten. |
max_concurrent_requests_per_container
|
Det maximala antalet samtidiga begäranden per container för webbtjänsten. |
max_request_wait_time
|
Den maximala väntetiden för begäran för webbtjänsten, i millisekunder. |
num_replicas
|
Antalet repliker för webbtjänsten. Varje replik motsvarar en AKS-podd. |
scoring_timeout_ms
|
Tidsgränsen för bedömning för webbtjänsten i millisekunder. |
azureml.core.webservice.AksWebservice.scoring_uri
|
Slutpunkten för bedömning för webbtjänsten |
is_default
|
Om webbtjänsten är standardversionen för den överordnade AksEndpoint. |
traffic_percentile
|
Vilken procentandel av trafiken som ska dirigeras till webbtjänsten i den överordnade AksEndpoint. |
version_type
|
Versionstypen för webbtjänsten i den överordnade AksEndpoint. |
token_auth_enabled
|
Huruvida tokenautentisering är aktiverat för webbtjänsten eller inte. |
environment
|
Miljöobjektet som användes för att skapa webbtjänsten. |
azureml.core.webservice.AksWebservice.models
|
En lista över modeller som distribuerats till webbtjänsten. |
deployment_status
|
Distributionsstatus för webbtjänsten. |
namespace
|
AKS-namnområdet för webbtjänsten. |
azureml.core.webservice.AksWebservice.swagger_uri
|
Swagger-slutpunkten för webbtjänsten. |
Metoder
add_properties |
Lägg till nyckelvärdepar i den här webbtjänstens egenskapsordlista. |
add_tags |
Lägg till nyckelvärdepar i ordlistan för den här webbtjänstens taggar. Genererar en WebserviceException. |
deploy_configuration |
Skapa ett konfigurationsobjekt för distribution till ett AKS-beräkningsmål. |
get_access_token |
Hämta autentiseringstoken för den här webbtjänsten. |
get_token |
DEPRECATED. Använd Hämta autentiseringstoken för den här webbtjänsten. |
remove_tags |
Ta bort de angivna nycklarna från den här webbtjänstens ordlista med taggar. |
run |
Anropa den här webbtjänsten med angivna indata. |
serialize |
Konvertera den här webbtjänsten till en JSON-serialiserad ordlista. |
update |
Uppdatera webbtjänsten med angivna egenskaper. Värden kvar som Ingen förblir oförändrade i den här webbtjänsten. |
add_properties
Lägg till nyckelvärdepar i den här webbtjänstens egenskapsordlista.
add_properties(properties)
Parametrar
Name | Description |
---|---|
properties
Obligatorisk
|
Ordlistan med egenskaper som ska läggas till. |
add_tags
Lägg till nyckelvärdepar i ordlistan för den här webbtjänstens taggar.
Genererar en WebserviceException.
add_tags(tags)
Parametrar
Name | Description |
---|---|
tags
Obligatorisk
|
Ordlistan med taggar att lägga till. |
Undantag
Typ | Description |
---|---|
deploy_configuration
Skapa ett konfigurationsobjekt för distribution till ett AKS-beräkningsmål.
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None, blobfuse_enabled=None)
Parametrar
Name | Description |
---|---|
autoscale_enabled
|
Om du vill aktivera automatisk skalning för den här webbtjänsten eller inte. Standardvärdet är Sant om num_replicas är Ingen. Standardvärde: None
|
autoscale_min_replicas
|
Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1. Standardvärde: None
|
autoscale_max_replicas
|
Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10. Standardvärde: None
|
autoscale_refresh_seconds
|
Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1. Standardvärde: None
|
autoscale_target_utilization
|
Målanvändningen (i procent av 100) som autoskalning ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70. Standardvärde: None
|
collect_model_data
|
Om du vill aktivera modelldatainsamling för den här webbtjänsten eller inte. Standardvärdet är Falskt. Standardvärde: None
|
auth_enabled
|
Om du vill aktivera nyckelautentisering för den här webbtjänsten eller inte. Standardvärdet är True. Standardvärde: None
|
cpu_cores
|
Antalet cpu-kärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,1. Motsvarar poddkärnans begäran, inte gränsen, i Azure Kubernetes Service. Standardvärde: None
|
memory_gb
|
Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5. Motsvarar poddminnesbegäran, inte gränsen, i Azure Kubernetes Service. Standardvärde: None
|
enable_app_insights
|
Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är Falskt. Standardvärde: None
|
scoring_timeout_ms
|
En timeout för att framtvinga för bedömning av anrop till den här webbtjänsten. Standardvärdet är 60000. Standardvärde: None
|
replica_max_concurrent_requests
|
Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om inte microsofts tekniska support eller en medlem i Azure Machine Learning-teamet instruerar det. Standardvärde: None
|
max_request_wait_time
|
Den maximala tiden som en begäran stannar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500. Standardvärde: None
|
num_replicas
|
Antalet containrar som ska allokeras för den här webbtjänsten. Ingen standard, om den här parametern inte har angetts aktiveras autoskalningsfunktionen som standard. Standardvärde: None
|
primary_key
|
En primär autentiseringsnyckel som ska användas för den här webbtjänsten. Standardvärde: None
|
secondary_key
|
En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten. Standardvärde: None
|
tags
|
Ordlista med nyckelvärdetaggar för att ge den här webbtjänsten. Standardvärde: None
|
properties
|
Ordlista med nyckelvärdeegenskaper för att ge den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckelvärdepar kan läggas till. Standardvärde: None
|
description
|
En beskrivning för att ge den här webbtjänsten. Standardvärde: None
|
gpu_cores
|
Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0. Standardvärde: None
|
period_seconds
|
Hur ofta (i sekunder) live-avsökningen ska utföras. Standardvärdet är 10 sekunder. Minsta värde är 1. Standardvärde: None
|
initial_delay_seconds
|
Antalet sekunder efter att containern har startats innan liveness-avsökningar initieras. Standardvärdet är 310. Standardvärde: None
|
timeout_seconds
|
Antalet sekunder efter vilken livenessavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minsta värde är 1. Standardvärde: None
|
success_threshold
|
Minsta lyckade resultat i följd för att liveness-avsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minsta värde är 1. Standardvärde: None
|
failure_threshold
|
När en podd startar och live-avsökningen misslyckas, försöker Kubernetes feldådd gånger innan de ger upp. Standardvärdet är 3. Minsta värde är 1. Standardvärde: None
|
namespace
|
Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck. Standardvärde: None
|
token_auth_enabled
|
Om tokenautentisering ska aktiveras eller inte för den här webbtjänsten. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta en åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är Falskt. Standardvärde: None
|
compute_target_name
|
Namnet på beräkningsmålet som ska distribueras till Standardvärde: None
|
cpu_cores_limit
|
Det maximala antalet processorkärnor som den här webbtjänsten tillåts använda. Kan vara en decimal. Standardvärde: None
|
memory_gb_limit
|
Den maximala mängden minne (i GB) som den här webbtjänsten tillåts använda. Kan vara en decimal. Standardvärde: None
|
blobfuse_enabled
|
Om blobfuse ska aktiveras eller inte för modellnedladdning för den här webbtjänsten. Standardvärdet är True Standardvärde: None
|
Returer
Typ | Description |
---|---|
Ett konfigurationsobjekt som ska användas när du distribuerar en AksWebservice. |
Undantag
Typ | Description |
---|---|
get_access_token
Hämta autentiseringstoken för den här webbtjänsten.
get_access_token()
Returer
Typ | Description |
---|---|
Ett objekt som beskriver autentiseringstoken för den här webbtjänsten. |
Undantag
Typ | Description |
---|---|
get_token
DEPRECATED. Använd get_access_token
metoden i stället.
Hämta autentiseringstoken för den här webbtjänsten.
get_token()
Returer
Typ | Description |
---|---|
Autentiseringstoken för den här webbtjänsten och när den ska uppdateras. |
Undantag
Typ | Description |
---|---|
remove_tags
Ta bort de angivna nycklarna från den här webbtjänstens ordlista med taggar.
remove_tags(tags)
Parametrar
Name | Description |
---|---|
tags
Obligatorisk
|
Listan över nycklar som ska tas bort |
run
Anropa den här webbtjänsten med angivna indata.
run(input_data)
Parametrar
Name | Description |
---|---|
input_data
Obligatorisk
|
<xref:varies>
Indata för att anropa webbtjänsten med |
Returer
Typ | Description |
---|---|
Resultatet av att anropa webbtjänsten |
Undantag
Typ | Description |
---|---|
serialize
Konvertera den här webbtjänsten till en JSON-serialiserad ordlista.
serialize()
Returer
Typ | Description |
---|---|
JSON-representationen av den här webbtjänsten. |
update
Uppdatera webbtjänsten med angivna egenskaper.
Värden kvar som Ingen förblir oförändrade i den här webbtjänsten.
update(image=None, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, cpu_cores_limit=None, memory_gb_limit=None, **kwargs)
Parametrar
Name | Description |
---|---|
image
|
En ny avbildning som ska distribueras till webbtjänsten Standardvärde: None
|
autoscale_enabled
|
Aktivera eller inaktivera automatisk skalning av den här webbtjänsten Standardvärde: None
|
autoscale_min_replicas
|
Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten Standardvärde: None
|
autoscale_max_replicas
|
Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten Standardvärde: None
|
autoscale_refresh_seconds
|
Hur ofta autoskalningen ska försöka skala den här webbtjänsten Standardvärde: None
|
autoscale_target_utilization
|
Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten Standardvärde: None
|
collect_model_data
|
Aktivera eller inaktivera modelldatainsamling för den här webbtjänsten Standardvärde: None
|
auth_enabled
|
Om du vill aktivera autentisering för den här webbtjänsten eller inte Standardvärde: None
|
cpu_cores
|
Antalet processorkärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal Standardvärde: None
|
memory_gb
|
Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal Standardvärde: None
|
enable_app_insights
|
Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte Standardvärde: None
|
scoring_timeout_ms
|
En timeout för att framtvinga poängsättning av anrop till den här webbtjänsten Standardvärde: None
|
replica_max_concurrent_requests
|
Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärde: None
|
max_request_wait_time
|
Den maximala tiden som en begäran finns kvar i kön (i millisekunder) innan ett 503-fel returneras Standardvärde: None
|
num_replicas
|
Antalet containrar som ska allokeras för den här webbtjänsten Standardvärde: None
|
tags
|
Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten. Ersätter befintliga taggar. Standardvärde: None
|
properties
|
Ordlista med nyckelvärdesegenskaper som ska läggas till i en befintlig egenskapsordlista Standardvärde: None
|
description
|
En beskrivning för att ge den här webbtjänsten Standardvärde: None
|
models
|
En lista över modellobjekt som ska paketera med den uppdaterade tjänsten Standardvärde: None
|
inference_config
|
Ett InferenceConfig-objekt som används för att tillhandahålla de nödvändiga modelldistributionsegenskaperna. Standardvärde: None
|
gpu_cores
|
Antalet gpu-kärnor som ska allokeras för den här webbtjänsten Standardvärde: None
|
period_seconds
|
Hur ofta (i sekunder) liveavsökningen ska utföras. Standardvärdet är 10 sekunder. Minimivärdet är 1. Standardvärde: None
|
initial_delay_seconds
|
Antal sekunder efter att containern har startats innan liveavsökningar initieras. Standardvärde: None
|
timeout_seconds
|
Antal sekunder varefter liveavsökningen överskrider tidsgränsen. Standardvärdet är 1 sekund. Minimivärdet är 1. Standardvärde: None
|
success_threshold
|
Minsta antal lyckade resultat i följd för att liveavsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1. Standardvärde: None
|
failure_threshold
|
När en podd startar och liveavsökningen misslyckas, kommer Kubernetes att prova failureThreshold gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1. Standardvärde: None
|
namespace
|
Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck. Standardvärde: None
|
token_auth_enabled
|
Om tokenautentisering ska aktiveras eller inte för den här webbtjänsten. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är Falskt Standardvärde: None
|
cpu_cores_limit
|
Det maximala antalet processorkärnor som den här webbtjänsten tillåts använda. Kan vara en decimal. Standardvärde: None
|
memory_gb_limit
|
Den maximala mängden minne (i GB) som den här webbtjänsten tillåts använda. Kan vara en decimal. Standardvärde: None
|
kwargs
Obligatorisk
|
<xref:varies>
inkludera params för att stödja migrering av AKS-webbtjänsten till Kubernetes onlineslutpunkt och -distribution. is_migration=True| False, compute_target=. |
Undantag
Typ | Description |
---|---|