AksServiceDeploymentConfiguration Klass
Representerar en distributionskonfigurationsinformation för en tjänst som distribueras på Azure Kubernetes Service.
Skapa ett AksServiceDeploymentConfiguration-objekt med hjälp deploy_configuration
av -metoden för AksWebservice klassen.
Initiera ett konfigurationsobjekt för distribution till ett AKS-beräkningsmål.
- Arv
-
AksServiceDeploymentConfiguration
Konstruktor
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parametrar
- cpu_cores_limit
Det maximala antalet processorkärnor som den här webbtjänsten tillåts använda. Kan vara en decimal.
- memory_gb_limit
Den maximala mängden minne (i GB) som den här webbtjänsten tillåts använda. Kan vara en decimal.
- autoscale_enabled
- bool
Anger om autoskalning ska aktiveras för den här webbtjänsten.
Standardvärdet är Sant om num_replicas
är Ingen.
- autoscale_min_replicas
- int
Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.
- autoscale_max_replicas
- int
Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10
- autoscale_refresh_seconds
- int
Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.
- autoscale_target_utilization
- int
Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.
- collect_model_data
- bool
Om du vill aktivera insamling av modelldata för den här webbtjänsten eller inte. Standardvärdet är False.
- auth_enabled
- bool
Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.
- cpu_cores
- float
Antalet CPU-kärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1
- memory_gb
- float
Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5
- enable_app_insights
- bool
Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är Falskt
- scoring_timeout_ms
- int
En timeout för att framtvinga poängsättning av anrop till den här webbtjänsten. Standardvärdet är 60000.
- replica_max_concurrent_requests
- int
Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om du inte instrueras av Microsofts tekniska support eller en medlem i Azure Machine Learning-teamet.
- max_request_wait_time
- int
Den maximala tiden som en begäran finns kvar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.
- num_replicas
- int
Antalet containrar som ska allokeras för den här webbtjänsten. Inget standardvärde, om den här parametern inte har angetts är autoskalning aktiverad som standard.
- primary_key
- str
En primär autentiseringsnyckel som ska användas för den här webbtjänsten.
- secondary_key
- str
En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten.
Ordlista med nyckelvärdesegenskaper som ger den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckel/värde-par kan läggas till.
- gpu_cores
- int
Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.
- period_seconds
- int
Hur ofta (i sekunder) liveavsökningen ska utföras. Standardvärdet är 10 sekunder. Minimivärdet är 1.
- initial_delay_seconds
- int
Antal sekunder efter att containern har startats innan liveavsökningar initieras. Standardvärdet är 310.
- timeout_seconds
- int
Antal sekunder varefter liveavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minimivärdet är 1.
- success_threshold
- int
Minsta antal lyckade resultat i följd för att liveavsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.
- failure_threshold
- int
När en podd startar och liveavsökningen misslyckas försöker failureThreshold
Kubernetes gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1.
- namespace
- str
Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.
- token_auth_enabled
- bool
Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.
- cpu_cores_limit
Det maximala antalet processorkärnor som den här webbtjänsten tillåts använda. Kan vara en decimal.
- memory_gb_limit
Den maximala mängden minne (i GB) som den här webbtjänsten tillåts använda. Kan vara en decimal.
- blobfuse_enabled
- bool
Om blobfuse ska aktiveras eller inte för modellnedladdning för den här webbtjänsten. Standardvärdet är True
- autoscale_enabled
- bool
Anger om autoskalning ska aktiveras för den här webbtjänsten.
Standardvärdet är Sant om num_replicas
är Ingen.
- autoscale_min_replicas
- int
Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.
- autoscale_max_replicas
- int
Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10
- autoscale_refresh_seconds
- int
Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.
- autoscale_target_utilization
- int
Målanvändningen (i procent av 100) som autoskalningen ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.
- collect_model_data
- bool
Om du vill aktivera insamling av modelldata för den här webbtjänsten eller inte. Standardvärdet är False.
- auth_enabled
- bool
Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.
- cpu_cores
- float
Antalet CPU-kärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0.1
- memory_gb
- float
Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5
- enable_app_insights
- bool
Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är Falskt
- scoring_timeout_ms
- int
En timeout för att framtvinga för bedömning av anrop till den här webbtjänsten. Standardvärdet är 60000.
- replica_max_concurrent_requests
- int
Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om inte microsofts tekniska support eller en medlem i Azure Machine Learning-teamet instruerar det.
- max_request_wait_time
- int
Den maximala tiden som en begäran stannar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.
- num_replicas
- int
Antalet containrar som ska allokeras för den här webbtjänsten. Ingen standard, om den här parametern inte har angetts aktiveras autoskalningsfunktionen som standard.
- primary_key
- str
En primär autentiseringsnyckel som ska användas för den här webbtjänsten.
- secondary_key
- str
En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten.
Ordlista med nyckelvärdeegenskaper för att ge den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckelvärdepar kan läggas till.
- gpu_cores
- int
Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.
- period_seconds
- int
Hur ofta (i sekunder) live-avsökningen ska utföras. Standardvärdet är 10 sekunder. Minsta värde är 1.
- initial_delay_seconds
- int
Antal sekunder efter att containern har startats innan liveness-avsökningar initieras. Standardvärdet är 310.
- timeout_seconds
- int
Antal sekunder efter vilket livenessavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minsta värde är 1.
- success_threshold
- int
Minsta lyckade resultat i följd för att liveness-avsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minsta värde är 1.
- failure_threshold
- int
När en podd startar och live-avsökningen misslyckas försöker Kubernetes gånger failureThreshold
innan de ger upp. Standardvärdet är 3. Minsta värde är 1.
- namespace
- str
Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.
- token_auth_enabled
- bool
Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är Falskt.
- cpu_cores_limit
- float
Det maximala antalet cpu-kärnor som webbtjänsten tillåts använda. Kan vara en decimal.
- memory_gb_limit
- float
Den maximala mängden minne (i GB) som den här webbtjänsten får använda. Kan vara en decimal.
- blobfuse_enabled
- bool
Om du vill aktivera blobfuse för modellnedladdning för den här webbtjänsten eller inte. Standardvärdet är True
Variabler
- autoscale_enabled
- bool
Anger om du vill aktivera automatisk skalning för den här webbtjänsten.
Standardvärdet är Sant om num_replicas
är Ingen.
- autoscale_min_replicas
- int
Det minsta antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 1.
- autoscale_max_replicas
- int
Det maximala antalet containrar som ska användas vid automatisk skalning av den här webbtjänsten. Standardvärdet är 10
- autoscale_refresh_seconds
- int
Hur ofta autoskalning ska försöka skala den här webbtjänsten. Standardvärdet är 1.
- autoscale_target_utilization
- int
Målanvändningen (i procent av 100) som autoskalning ska försöka underhålla för den här webbtjänsten. Standardvärdet är 70.
- collect_model_data
- bool
Om du vill aktivera modelldatainsamling för den här webbtjänsten eller inte. Standardvärdet är Falskt.
- auth_enabled
- bool
Om du vill aktivera autentisering för den här webbtjänsten eller inte. Standardvärdet är True.
- cpu_cores
- float
Antalet CPU-kärnor som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,1
- memory_gb
- float
Mängden minne (i GB) som ska allokeras för den här webbtjänsten. Kan vara en decimal. Standardvärdet är 0,5
- enable_app_insights
- bool
Om du vill aktivera Application Insights-loggning för den här webbtjänsten eller inte. Standardvärdet är Falskt
- scoring_timeout_ms
- int
En timeout för att framtvinga för bedömning av anrop till den här webbtjänsten. Standardvärdet är 60000.
- replica_max_concurrent_requests
- int
Antalet samtidiga begäranden per replik som tillåts för den här webbtjänsten. Standardvärdet är 1. Ändra inte den här inställningen från standardvärdet 1 om inte microsofts tekniska support eller en medlem i Azure Machine Learning-teamet instruerar det.
- max_request_wait_time
- int
Den maximala tiden som en begäran stannar i kön (i millisekunder) innan ett 503-fel returneras. Standardvärdet är 500.
- num_replicas
- int
Antalet containrar som ska allokeras för den här webbtjänsten. Ingen standard, om den här parametern inte har angetts aktiveras autoskalningsfunktionen som standard.
- primary_key
- str
En primär autentiseringsnyckel som ska användas för den här webbtjänsten.
- secondary_key
- str
En sekundär autentiseringsnyckel som ska användas för den här webbtjänsten.
- azureml.core.webservice.AksServiceDeploymentConfiguration.tags
Ordlista med nyckelvärdetaggar för att ge den här webbtjänsten.
- azureml.core.webservice.AksServiceDeploymentConfiguration.properties
Ordlista med nyckelvärdeegenskaper för att ge den här webbtjänsten. Dessa egenskaper kan inte ändras efter distributionen, men nya nyckelvärdepar kan läggas till.
- azureml.core.webservice.AksServiceDeploymentConfiguration.description
En beskrivning för att ge den här webbtjänsten.
- gpu_cores
- int
Antalet GPU-kärnor som ska allokeras för den här webbtjänsten. Standardvärdet är 0.
- period_seconds
- int
Hur ofta (i sekunder) live-avsökningen ska utföras. Standardvärdet är 10 sekunder. Minsta värde är 1.
- initial_delay_seconds
- int
Antal sekunder efter att containern har startats innan liveness-avsökningar initieras. Standardvärdet är 310.
- timeout_seconds
- int
Antal sekunder efter vilket livenessavsökningen överskrider tidsgränsen. Standardvärdet är 2 sekunder. Minsta värde är 1.
- success_threshold
- int
Minsta lyckade resultat i följd för att liveness-avsökningen ska anses vara lyckad efter att ha misslyckats. Standardvärdet är 1. Minimivärdet är 1.
- failure_threshold
- int
När en podd startar och liveavsökningen misslyckas försöker failureThreshold
Kubernetes gånger innan den ger upp. Standardvärdet är 3. Minimivärdet är 1.
- azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
Kubernetes-namnområdet där den här webbtjänsten ska distribueras: upp till 63 alfanumeriska gemener ('a'-'z', '0'-'9') och bindestreck ('-') tecken. Det första och sista tecknen får inte vara bindestreck.
- token_auth_enabled
- bool
Om du vill aktivera Azure Active Directory-autentisering för den här webbtjänsten eller inte. Om detta är aktiverat kan användarna komma åt den här webbtjänsten genom att hämta åtkomsttoken med sina Azure Active Directory-autentiseringsuppgifter. Standardvärdet är False.
Metoder
print_deploy_configuration |
Skriv ut distributionskonfigurationen. |
validate_configuration |
Kontrollera att de angivna konfigurationsvärdena är giltiga. Genererar en WebserviceException om verifieringen misslyckas. |
print_deploy_configuration
Skriv ut distributionskonfigurationen.
print_deploy_configuration()
validate_configuration
Kontrollera att de angivna konfigurationsvärdena är giltiga.
Genererar en WebserviceException om verifieringen misslyckas.
validate_configuration()
Undantag
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för