AksEndpointDeploymentConfiguration Klass
Anteckning
Det här är en experimentell klass och kan ändras när som helst. Mer information finns i https://aka.ms/azuremlexperimental.
Representerar distributionskonfigurationsinformation för en tjänst som distribueras på Azure Kubernetes Service.
Skapa ett AksEndpointDeploymentConfiguration-objekt med hjälp deploy_configuration
av -metoden i AksEndpoint klassen .
Initiera ett konfigurationsobjekt för att distribuera en slutpunkt till ett AKS-beräkningsmål.
- Arv
-
AksEndpointDeploymentConfiguration
Konstruktor
AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)
Parametrar
- autoscale_enabled
- bool
Om du vill aktivera automatisk skalning för den här webbtjänsten eller inte.
Standardvärdet är Sant om num_replicas
är Ingen.
- autoscale_min_replicas
- int
Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.
- autoscale_max_replicas
- int
Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10.
- autoscale_refresh_seconds
- int
Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.
- autoscale_target_utilization
- int
Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.
- collect_model_data
- bool
Om du vill aktivera insamling av modelldata för den här webbtjänsten eller inte. Standardvärdet är False.
- auth_enabled
- bool
Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.
- cpu_cores
- float
Antalet processorkärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1
- memory_gb
- float
Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5
- enable_app_insights
- bool
Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är False.
- scoring_timeout_ms
- int
En timeout för att framtvinga poängsättning av anrop till den här webbtjänsten. Standardvärdet är 60000.
- replica_max_concurrent_requests
- int
Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.
- max_request_wait_time
- int
Den maximala tiden som en begäran finns kvar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.
- num_replicas
- int
Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts är autoskalning aktiverad som standard.
- primary_key
- str
En primär autentiseringsnyckel som ska användas för den här webbtjänsten
- secondary_key
- str
En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten
Ordlista med nyckelvärdesegenskaper som ger den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckel/värde-par kan läggas till.
- gpu_cores
- int
Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.
- period_seconds
- int
Hur ofta (i sekunder) liveavsökningen ska utföras. Standardvärdet är 10 sekunder. Minimivärdet är 1.
- initial_delay_seconds
- int
Antalet sekunder efter att containern har startats innan liveavsökningar initieras. Standardvärdet är 310.
- timeout_seconds
- int
Antalet sekunder som liveavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.
- success_threshold
- int
Minsta antal lyckade resultat i följd för att liveavsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.
- failure_threshold
- int
När en podd startar och liveavsökningen misslyckas försöker failureThreshold
Kubernetes gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1.
- namespace
- str
Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.
- token_auth_enabled
- bool
Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.
- cpu_cores_limit
- float
Det maximala antalet processorkärnor som den här webbtjänsten tillåts använda. Kan vara en decimal.
- memory_gb_limit
- float
Den maximala mängden minne (i GB) som den här webbtjänsten får använda. Kan vara en decimal.
- autoscale_enabled
- bool
Om du vill aktivera automatisk skalning för den här webbtjänsten eller inte.
Standardvärdet är Sant om num_replicas
är Ingen.
- autoscale_min_replicas
- int
Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.
- autoscale_max_replicas
- int
Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10.
- autoscale_refresh_seconds
- int
Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.
- autoscale_target_utilization
- int
Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.
- collect_model_data
- bool
Om du vill aktivera insamling av modelldata för den här webbtjänsten eller inte. Standardvärdet är False.
- auth_enabled
- bool
Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.
- cpu_cores
- float
Antalet processorkärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1
- memory_gb
- float
Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5
- enable_app_insights
- bool
Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är False.
- scoring_timeout_ms
- int
En timeout för att framtvinga poängsättning av anrop till den här webbtjänsten. Standardvärdet är 60000.
- replica_max_concurrent_requests
- int
Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.
- max_request_wait_time
- int
Den maximala tiden som en begäran finns kvar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.
- num_replicas
- int
Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts är autoskalning aktiverad som standard.
- primary_key
- str
En primär autentiseringsnyckel som ska användas för den här webbtjänsten
- secondary_key
- str
En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten
Ordlista med nyckelvärdesegenskaper som ger den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckel/värde-par kan läggas till.
- gpu_cores
- int
Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.
- period_seconds
- int
Hur ofta (i sekunder) liveavsökningen ska utföras. Standardvärdet är 10 sekunder. Minimivärdet är 1.
- initial_delay_seconds
- int
Antalet sekunder efter att containern har startats innan liveavsökningar initieras. Standardvärdet är 310.
- timeout_seconds
- int
Antalet sekunder som liveavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.
- success_threshold
- int
Minsta antal lyckade resultat i följd för att liveavsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.
- failure_threshold
- int
När en podd startar och liveavsökningen misslyckas försöker failureThreshold
Kubernetes gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1.
- namespace
- str
Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.
- token_auth_enabled
- bool
Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.
- cpu_cores_limit
- float
Det maximala antalet processorkärnor som den här webbtjänsten tillåts använda. Kan vara en decimal.
- memory_gb_limit
- float
Den maximala mängden minne (i GB) som den här webbtjänsten får använda. Kan vara en decimal.
Variabler
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled
Om du vill aktivera automatisk skalning för den här webbtjänsten eller inte. Standardvärdet är Sant om num_replicas
är Ingen.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas
Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas
Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds
Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization
Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data
Om du vill aktivera insamling av modelldata för den här webbtjänsten eller inte. Standardvärdet är False.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled
Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores
Antalet processorkärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb
Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights
Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är False.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms
En timeout för att framtvinga poängsättning av anrop till den här webbtjänsten. Standardvärdet är 60000.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests
Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time
Den maximala tiden som en begäran finns kvar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas
Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts är autoskalning aktiverad som standard.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key
En primär autentiseringsnyckel som ska användas för den här webbtjänsten
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key
En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags
Ordlista med nyckelvärdestaggar för att ge den här webbtjänsten
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties
Ordlista med nyckelvärdesegenskaper som ger den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckel/värde-par kan läggas till.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description
En beskrivning som ger den här webbtjänsten.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores
Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds
Hur ofta (i sekunder) liveavsökningen ska utföras. Standardvärdet är 10 sekunder. Minimivärdet är 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds
Antalet sekunder efter att containern har startats innan liveavsökningar initieras. Standardvärdet är 310.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds
Antalet sekunder som liveavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold
Minsta antal lyckade resultat i följd för att liveavsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold
När en podd startar och liveavsökningen misslyckas försöker failureThreshold
Kubernetes gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace
Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled
Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name
Namnet på versionen i en slutpunkt.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile
Mängden trafik som versionen tar i en slutpunkt.
Metoder
validate_endpoint_configuration |
Kontrollera att de angivna konfigurationsvärdena är giltiga. Genererar en WebserviceException om verifieringen misslyckas. |
validate_endpoint_configuration
Kontrollera att de angivna konfigurationsvärdena är giltiga.
Genererar en WebserviceException om verifieringen misslyckas.
validate_endpoint_configuration()
Undantag
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för