Dela via


AksServiceDeploymentConfiguration Klass

Representerar en distributionskonfigurationsinformation för en tjänst som distribueras på Azure Kubernetes Service.

Skapa ett AksServiceDeploymentConfiguration-objekt med hjälp deploy_configuration av -metoden för AksWebservice klassen.

Initiera ett konfigurationsobjekt för distribution till ett AKS-beräkningsmål.

Arv
AksServiceDeploymentConfiguration

Konstruktor

AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)

Parametrar

Name Description
cpu_cores_limit
Obligatorisk

Det maximala antalet processorkärnor som den här webbtjänsten tillåts använda. Kan vara en decimal.

memory_gb_limit
Obligatorisk

Den maximala mängden minne (i GB) som den här webbtjänsten tillåts använda. Kan vara en decimal.

autoscale_enabled
Obligatorisk

Anger om autoskalning ska aktiveras för den här webbtjänsten. Standardvärdet är Sant om num_replicas är Ingen.

autoscale_min_replicas
Obligatorisk
int

Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.

autoscale_max_replicas
Obligatorisk
int

Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10

autoscale_refresh_seconds
Obligatorisk
int

Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.

autoscale_target_utilization
Obligatorisk
int

Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.

collect_model_data
Obligatorisk

Om du vill aktivera insamling av modelldata för den här webbtjänsten eller inte. Standardvärdet är False.

auth_enabled
Obligatorisk

Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.

cpu_cores
Obligatorisk

Antalet CPU-kärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1

memory_gb
Obligatorisk

Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5

enable_app_insights
Obligatorisk

Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är Falskt

scoring_timeout_ms
Obligatorisk
int

En timeout för att framtvinga poängsättning av anrop till den här webbtjänsten. Standardvärdet är 60000.

replica_max_concurrent_requests
Obligatorisk
int

Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.

max_request_wait_time
Obligatorisk
int

Den maximala tiden som en begäran finns kvar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.

num_replicas
Obligatorisk
int

Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts är autoskalning aktiverad som standard.

primary_key
Obligatorisk
str

En primär autentiseringsnyckel som ska användas för den här webbtjänsten.

secondary_key
Obligatorisk
str

En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten.

tags
Obligatorisk

Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten.

properties
Obligatorisk

Ordlista med nyckelvärdesegenskaper som ger den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckel/värde-par kan läggas till.

description
Obligatorisk
str

En beskrivning som ger den här webbtjänsten.

gpu_cores
Obligatorisk
int

Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.

period_seconds
Obligatorisk
int

Hur ofta (i sekunder) liveavsökningen ska utföras. Standardvärdet är 10 sekunder. Minimivärdet är 1.

initial_delay_seconds
Obligatorisk
int

Antal sekunder efter att containern har startats innan liveavsökningar initieras. Standardvärdet är 310.

timeout_seconds
Obligatorisk
int

Antal sekunder varefter liveavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.

success_threshold
Obligatorisk
int

Minsta antal lyckade resultat i följd för att liveavsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.

failure_threshold
Obligatorisk
int

När en podd startar och liveavsökningen misslyckas försöker failureThreshold Kubernetes gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1.

namespace
Obligatorisk
str

Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.

token_auth_enabled
Obligatorisk

Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.

cpu_cores_limit
Obligatorisk

Det maximala antalet processorkärnor som den här webbtjänsten tillåts använda. Kan vara en decimal.

memory_gb_limit
Obligatorisk

Den maximala mängden minne (i GB) som den här webbtjänsten tillåts använda. Kan vara en decimal.

blobfuse_enabled

Om blobfuse ska aktiveras eller inte för modellnedladdning för den här webbtjänsten. Standardvärdet är True

Standardvärde: None
autoscale_enabled
Obligatorisk

Anger om autoskalning ska aktiveras för den här webbtjänsten. Standardvärdet är Sant om num_replicas är Ingen.

autoscale_min_replicas
Obligatorisk
int

Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.

autoscale_max_replicas
Obligatorisk
int

Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10

autoscale_refresh_seconds
Obligatorisk
int

Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.

autoscale_target_utilization
Obligatorisk
int

Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.

collect_model_data
Obligatorisk

Om du vill aktivera insamling av modelldata för den här webbtjänsten eller inte. Standardvärdet är False.

auth_enabled
Obligatorisk

Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.

cpu_cores
Obligatorisk

Antalet CPU-kärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1

memory_gb
Obligatorisk

Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5

enable_app_insights
Obligatorisk

Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är Falskt

scoring_timeout_ms
Obligatorisk
int

En timeout för att framtvinga för bedömning av anrop till den här webbtjänsten. Standardvärdet är 60000.

replica_max_concurrent_requests
Obligatorisk
int

Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om inte microsofts tekniska support eller en medlem i Azure Machine Learning-teamet instruerar det.

max_request_wait_time
Obligatorisk
int

Den maximala tiden som en begäran stannar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.

num_replicas
Obligatorisk
int

Antalet containrar som ska allokeras för den här webbtjänsten. Ingen standard, om den här parametern inte har angetts aktiveras autoskalningsfunktionen som standard.

primary_key
Obligatorisk
str

En primär autentiseringsnyckel som ska användas för den här webbtjänsten.

secondary_key
Obligatorisk
str

En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten.

tags
Obligatorisk

Ordlista med nyckelvärdetaggar för att ge den här webbtjänsten.

properties
Obligatorisk

Ordlista med nyckelvärdeegenskaper för att ge den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckelvärdepar kan läggas till.

description
Obligatorisk
str

En beskrivning för att ge den här webbtjänsten.

gpu_cores
Obligatorisk
int

Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.

period_seconds
Obligatorisk
int

Hur ofta (i sekunder) live-avsökningen ska utföras. Standardvärdet är 10 sekunder. Minsta värde är 1.

initial_delay_seconds
Obligatorisk
int

Antal sekunder efter att containern har startats innan liveness-avsökningar initieras. Standardvärdet är 310.

timeout_seconds
Obligatorisk
int

Antal sekunder efter vilket livenessavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minsta värde är 1.

success_threshold
Obligatorisk
int

Minsta lyckade resultat i följd för att liveness-avsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minsta värde är 1.

failure_threshold
Obligatorisk
int

När en podd startar och live-avsökningen misslyckas försöker Kubernetes gånger failureThreshold innan de ger upp. Standardvärdet är 3. Minsta värde är 1.

namespace
Obligatorisk
str

Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.

token_auth_enabled
Obligatorisk

Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är Falskt.

compute_target_name
Obligatorisk
str

Namnet på beräkningsmålet som ska distribueras till

cpu_cores_limit
Obligatorisk

Det maximala antalet cpu-kärnor som webbtjänsten tillåts använda. Kan vara en decimal.

memory_gb_limit
Obligatorisk

Den maximala mängden minne (i GB) som den här webbtjänsten får använda. Kan vara en decimal.

blobfuse_enabled
Obligatorisk

Om du vill aktivera blobfuse för modellnedladdning för den här webbtjänsten eller inte. Standardvärdet är True

Variabler

Name Description
autoscale_enabled

Anger om du vill aktivera automatisk skalning för den här webbtjänsten. Standardvärdet är Sant om num_replicas är Ingen.

autoscale_min_replicas
int

Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.

autoscale_max_replicas
int

Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10

autoscale_refresh_seconds
int

Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.

autoscale_target_utilization
int

Målanvändningen (i procent av 100) som autoskalning ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.

collect_model_data

Om du vill aktivera modelldatainsamling för den här webbtjänsten eller inte. Standardvärdet är Falskt.

auth_enabled

Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.

cpu_cores

Antalet CPU-kärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,1

memory_gb

Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5

enable_app_insights

Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är Falskt

scoring_timeout_ms
int

En timeout för att framtvinga för bedömning av anrop till den här webbtjänsten. Standardvärdet är 60000.

replica_max_concurrent_requests
int

Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om inte microsofts tekniska support eller en medlem i Azure Machine Learning-teamet instruerar det.

max_request_wait_time
int

Den maximala tiden som en begäran stannar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.

num_replicas
int

Antalet containrar som ska allokeras för den här webbtjänsten. Ingen standard, om den här parametern inte har angetts aktiveras autoskalningsfunktionen som standard.

primary_key
str

En primär autentiseringsnyckel som ska användas för den här webbtjänsten.

secondary_key
str

En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten.

azureml.core.webservice.AksServiceDeploymentConfiguration.tags

Ordlista med nyckelvärdetaggar för att ge den här webbtjänsten.

azureml.core.webservice.AksServiceDeploymentConfiguration.properties

Ordlista med nyckelvärdeegenskaper för att ge den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckelvärdepar kan läggas till.

azureml.core.webservice.AksServiceDeploymentConfiguration.description

En beskrivning för att ge den här webbtjänsten.

gpu_cores
int

Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.

period_seconds
int

Hur ofta (i sekunder) live-avsökningen ska utföras. Standardvärdet är 10 sekunder. Minsta värde är 1.

initial_delay_seconds
int

Antal sekunder efter att containern har startats innan liveness-avsökningar initieras. Standardvärdet är 310.

timeout_seconds
int

Antal sekunder efter vilket livenessavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minsta värde är 1.

success_threshold
int

Minsta lyckade resultat i följd för att liveness-avsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.

failure_threshold
int

När en podd startar och liveavsökningen misslyckas försöker failureThreshold Kubernetes gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1.

azureml.core.webservice.AksServiceDeploymentConfiguration.namespace

Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.

token_auth_enabled

Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.

Metoder

print_deploy_configuration

Skriv ut distributionskonfigurationen.

validate_configuration

Kontrollera att de angivna konfigurationsvärdena är giltiga.

Genererar en WebserviceException om verifieringen misslyckas.

print_deploy_configuration

Skriv ut distributionskonfigurationen.

print_deploy_configuration()

validate_configuration

Kontrollera att de angivna konfigurationsvärdena är giltiga.

Genererar en WebserviceException om verifieringen misslyckas.

validate_configuration()

Undantag

Typ Description