Dela via


AksEndpointDeploymentConfiguration Klass

Anteckning

Det här är en experimentell klass och kan ändras när som helst. Mer information finns i https://aka.ms/azuremlexperimental.

Representerar distributionskonfigurationsinformation för en tjänst som distribueras på Azure Kubernetes Service.

Skapa ett AksEndpointDeploymentConfiguration-objekt med hjälp deploy_configuration av -metoden i AksEndpoint klassen .

Initiera ett konfigurationsobjekt för att distribuera en slutpunkt till ett AKS-beräkningsmål.

Arv
AksEndpointDeploymentConfiguration

Konstruktor

AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)

Parametrar

autoscale_enabled
bool
Obligatorisk

Om du vill aktivera automatisk skalning för den här webbtjänsten eller inte. Standardvärdet är Sant om num_replicas är Ingen.

autoscale_min_replicas
int
Obligatorisk

Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.

autoscale_max_replicas
int
Obligatorisk

Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10.

autoscale_refresh_seconds
int
Obligatorisk

Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.

autoscale_target_utilization
int
Obligatorisk

Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.

collect_model_data
bool
Obligatorisk

Om du vill aktivera insamling av modelldata för den här webbtjänsten eller inte. Standardvärdet är False.

auth_enabled
bool
Obligatorisk

Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.

cpu_cores
float
Obligatorisk

Antalet processorkärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1

memory_gb
float
Obligatorisk

Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5

enable_app_insights
bool
Obligatorisk

Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är False.

scoring_timeout_ms
int
Obligatorisk

En timeout för att framtvinga poängsättning av anrop till den här webbtjänsten. Standardvärdet är 60000.

replica_max_concurrent_requests
int
Obligatorisk

Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.

max_request_wait_time
int
Obligatorisk

Den maximala tiden som en begäran finns kvar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.

num_replicas
int
Obligatorisk

Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts är autoskalning aktiverad som standard.

primary_key
str
Obligatorisk

En primär autentiseringsnyckel som ska användas för den här webbtjänsten

secondary_key
str
Obligatorisk

En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten

tags
dict[str, str]
Obligatorisk

Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten

properties
dict[str, str]
Obligatorisk

Ordlista med nyckelvärdesegenskaper som ger den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckel/värde-par kan läggas till.

description
str
Obligatorisk

En beskrivning som ger den här webbtjänsten.

gpu_cores
int
Obligatorisk

Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.

period_seconds
int
Obligatorisk

Hur ofta (i sekunder) liveavsökningen ska utföras. Standardvärdet är 10 sekunder. Minimivärdet är 1.

initial_delay_seconds
int
Obligatorisk

Antalet sekunder efter att containern har startats innan liveavsökningar initieras. Standardvärdet är 310.

timeout_seconds
int
Obligatorisk

Antalet sekunder som liveavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.

success_threshold
int
Obligatorisk

Minsta antal lyckade resultat i följd för att liveavsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.

failure_threshold
int
Obligatorisk

När en podd startar och liveavsökningen misslyckas försöker failureThreshold Kubernetes gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1.

namespace
str
Obligatorisk

Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.

token_auth_enabled
bool
Obligatorisk

Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.

version_name
str
Obligatorisk

Namnet på versionen i en slutpunkt.

traffic_percentile
float
Obligatorisk

Mängden trafik som versionen tar i en slutpunkt.

cpu_cores_limit
float
Obligatorisk

Det maximala antalet processorkärnor som den här webbtjänsten tillåts använda. Kan vara en decimal.

memory_gb_limit
float
Obligatorisk

Den maximala mängden minne (i GB) som den här webbtjänsten får använda. Kan vara en decimal.

autoscale_enabled
bool
Obligatorisk

Om du vill aktivera automatisk skalning för den här webbtjänsten eller inte. Standardvärdet är Sant om num_replicas är Ingen.

autoscale_min_replicas
int
Obligatorisk

Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.

autoscale_max_replicas
int
Obligatorisk

Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10.

autoscale_refresh_seconds
int
Obligatorisk

Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.

autoscale_target_utilization
int
Obligatorisk

Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.

collect_model_data
bool
Obligatorisk

Om du vill aktivera insamling av modelldata för den här webbtjänsten eller inte. Standardvärdet är False.

auth_enabled
bool
Obligatorisk

Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.

cpu_cores
float
Obligatorisk

Antalet processorkärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1

memory_gb
float
Obligatorisk

Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5

enable_app_insights
bool
Obligatorisk

Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är False.

scoring_timeout_ms
int
Obligatorisk

En timeout för att framtvinga poängsättning av anrop till den här webbtjänsten. Standardvärdet är 60000.

replica_max_concurrent_requests
int
Obligatorisk

Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.

max_request_wait_time
int
Obligatorisk

Den maximala tiden som en begäran finns kvar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.

num_replicas
int
Obligatorisk

Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts är autoskalning aktiverad som standard.

primary_key
str
Obligatorisk

En primär autentiseringsnyckel som ska användas för den här webbtjänsten

secondary_key
str
Obligatorisk

En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten

tags
dict[str, str]
Obligatorisk

Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten

properties
dict[str, str]
Obligatorisk

Ordlista med nyckelvärdesegenskaper som ger den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckel/värde-par kan läggas till.

description
str
Obligatorisk

En beskrivning som ger den här webbtjänsten.

gpu_cores
int
Obligatorisk

Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.

period_seconds
int
Obligatorisk

Hur ofta (i sekunder) liveavsökningen ska utföras. Standardvärdet är 10 sekunder. Minimivärdet är 1.

initial_delay_seconds
int
Obligatorisk

Antalet sekunder efter att containern har startats innan liveavsökningar initieras. Standardvärdet är 310.

timeout_seconds
int
Obligatorisk

Antalet sekunder som liveavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.

success_threshold
int
Obligatorisk

Minsta antal lyckade resultat i följd för att liveavsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.

failure_threshold
int
Obligatorisk

När en podd startar och liveavsökningen misslyckas försöker failureThreshold Kubernetes gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1.

namespace
str
Obligatorisk

Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.

token_auth_enabled
bool
Obligatorisk

Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.

version_name
str
Obligatorisk

Namnet på versionen i en slutpunkt.

traffic_percentile
float
Obligatorisk

Mängden trafik som versionen tar i en slutpunkt.

compute_target_name
str
Obligatorisk

Namnet på beräkningsmålet som ska distribueras till

cpu_cores_limit
float
Obligatorisk

Det maximala antalet processorkärnor som den här webbtjänsten tillåts använda. Kan vara en decimal.

memory_gb_limit
float
Obligatorisk

Den maximala mängden minne (i GB) som den här webbtjänsten får använda. Kan vara en decimal.

Variabler

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled

Om du vill aktivera automatisk skalning för den här webbtjänsten eller inte. Standardvärdet är Sant om num_replicas är Ingen.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas

Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas

Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds

Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization

Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data

Om du vill aktivera insamling av modelldata för den här webbtjänsten eller inte. Standardvärdet är False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled

Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores

Antalet processorkärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb

Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights

Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms

En timeout för att framtvinga poängsättning av anrop till den här webbtjänsten. Standardvärdet är 60000.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests

Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time

Den maximala tiden som en begäran finns kvar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas

Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts är autoskalning aktiverad som standard.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key

En primär autentiseringsnyckel som ska användas för den här webbtjänsten

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key

En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags

Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties

Ordlista med nyckelvärdesegenskaper som ger den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckel/värde-par kan läggas till.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description

En beskrivning som ger den här webbtjänsten.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores

Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds

Hur ofta (i sekunder) liveavsökningen ska utföras. Standardvärdet är 10 sekunder. Minimivärdet är 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds

Antalet sekunder efter att containern har startats innan liveavsökningar initieras. Standardvärdet är 310.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds

Antalet sekunder som liveavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold

Minsta antal lyckade resultat i följd för att liveavsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold

När en podd startar och liveavsökningen misslyckas försöker failureThreshold Kubernetes gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace

Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled

Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name

Namnet på versionen i en slutpunkt.

azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile

Mängden trafik som versionen tar i en slutpunkt.

Metoder

validate_endpoint_configuration

Kontrollera att de angivna konfigurationsvärdena är giltiga.

Genererar en WebserviceException om verifieringen misslyckas.

validate_endpoint_configuration

Kontrollera att de angivna konfigurationsvärdena är giltiga.

Genererar en WebserviceException om verifieringen misslyckas.

validate_endpoint_configuration()

Undantag