AksEndpointDeploymentConfiguration Classe
Nota
Esta é uma classe experimental e pode mudar em qualquer altura. Para obter mais informações, veja https://aka.ms/azuremlexperimental.
Representa as informações de configuração de implementação de um serviço implementado no Azure Kubernetes Service.
Crie um objeto AksEndpointDeploymentConfiguration com o deploy_configuration
método da AksEndpoint classe.
Inicialize um objeto de configuração para implementar um Ponto Final num destino de computação do AKS.
- Herança
-
AksEndpointDeploymentConfiguration
Construtor
AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)
Parâmetros
- autoscale_enabled
- bool
Se pretende ativar ou não o dimensionamento automático para este webservice.
A predefinição é Verdadeiro se num_replicas
for Nenhum.
- autoscale_min_replicas
- int
O número mínimo de contentores a utilizar ao dimensionar automaticamente este webservice. A predefinição é 1.
- autoscale_max_replicas
- int
O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. A predefinição é 10.
- autoscale_refresh_seconds
- int
Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1.
- autoscale_target_utilization
- int
A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para este webservice. A predefinição é 70.
- collect_model_data
- bool
Se pretende ativar ou não a recolha de dados de modelos para este Webservice. A predefinição é Falso.
- auth_enabled
- bool
Se pretende ativar ou não a autenticação para este webservice. A predefinição é Verdadeiro.
- cpu_cores
- float
O número de núcleos de cpu a alocar para este Webservice. Pode ser um decimal. Predefinições para 0.1
- memory_gb
- float
A quantidade de memória (em GB) a alocar para este webservice. Pode ser um decimal. Predefinições para 0,5
- enable_app_insights
- bool
Se pretende ativar ou não o registo do Application Insights para este Webservice. A predefinição é Falso.
- scoring_timeout_ms
- int
Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000.
- replica_max_concurrent_requests
- int
O número máximo de pedidos simultâneos por réplica para permitir este serviço Web. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.
- max_request_wait_time
- int
A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.
- num_replicas
- int
O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.
Dicionário de propriedades de valor de chave para dar este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.
- gpu_cores
- int
O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0.
- period_seconds
- int
Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.
- initial_delay_seconds
- int
O número de segundos após o início do contentor antes de as pesquisas liveness serem iniciadas. A predefinição é 310.
- timeout_seconds
- int
O número de segundos após o qual a sonda liveness excede o tempo limite. A predefinição é de 2 segundos. O valor mínimo é 1.
- success_threshold
- int
Os êxitos mínimos consecutivos para a sonda liveness serem considerados bem-sucedidos depois de terem falhado. A predefinição é 1. O valor mínimo é 1.
- failure_threshold
- int
Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta failureThreshold
horas antes de desistir. A predefinição é 3. O valor mínimo é 1.
- namespace
- str
O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último carateres não podem ser hífenes.
- token_auth_enabled
- bool
Se pretende ativar ou não a autenticação do Azure Active Directory para este serviço Web. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. A predefinição é Falso.
- cpu_cores_limit
- float
O número máximo de núcleos de cpu que este Webservice tem permissão para utilizar. Pode ser um decimal.
- memory_gb_limit
- float
A quantidade máxima de memória (em GB) que este Webservice tem permissão para utilizar. Pode ser um decimal.
- autoscale_enabled
- bool
Se pretende ativar ou não o dimensionamento automático para este webservice.
A predefinição é Verdadeiro se num_replicas
for Nenhum.
- autoscale_min_replicas
- int
O número mínimo de contentores a utilizar ao dimensionar automaticamente este webservice. A predefinição é 1.
- autoscale_max_replicas
- int
O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. A predefinição é 10.
- autoscale_refresh_seconds
- int
Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1.
- autoscale_target_utilization
- int
A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para este webservice. A predefinição é 70.
- collect_model_data
- bool
Se pretende ativar ou não a recolha de dados de modelos para este Webservice. A predefinição é Falso.
- auth_enabled
- bool
Se pretende ativar ou não a autenticação para este webservice. A predefinição é Verdadeiro.
- cpu_cores
- float
O número de núcleos de cpu a alocar para este Webservice. Pode ser um decimal. Predefinições para 0.1
- memory_gb
- float
A quantidade de memória (em GB) a alocar para este Webservice. Pode ser um decimal. Predefinições para 0,5
- enable_app_insights
- bool
Quer ative ou não o registo do Application Insights para este Webservice. Predefinições para Falso.
- scoring_timeout_ms
- int
Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000.
- replica_max_concurrent_requests
- int
O número máximo de pedidos simultâneos por réplica para permitir este Webservice. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.
- max_request_wait_time
- int
A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.
- num_replicas
- int
O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.
Dicionário de propriedades de valor chave para fornecer este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.
- gpu_cores
- int
O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0.
- period_seconds
- int
Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.
- initial_delay_seconds
- int
O número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310.
- timeout_seconds
- int
O número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1.
- success_threshold
- int
Os êxitos mínimos consecutivos para a sonda de liveness serem considerados bem-sucedidos depois de terem falhado. A predefinição é 1. O valor mínimo é 1.
- failure_threshold
- int
Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta horas failureThreshold
antes de desistir. A predefinição é 3. O valor mínimo é 1.
- namespace
- str
O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e carateres de hífen ('-'). Os primeiros e últimos carateres não podem ser hífenes.
- token_auth_enabled
- bool
Quer ative ou não a autenticação do Azure Active Directory para este webservice. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. Predefinições para Falso.
- cpu_cores_limit
- float
O número máximo de núcleos de cpu que este Webservice pode utilizar. Pode ser um decimal.
- memory_gb_limit
- float
A quantidade máxima de memória (em GB) que este Webservice pode utilizar. Pode ser um decimal.
Variáveis
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled
Quer ative ou não o dimensionamento automático para este Webservice. A predefinição é Verdadeiro se num_replicas
for Nenhuma.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas
O número mínimo de contentores a utilizar ao dimensionar automaticamente este Webservice. A predefinição é 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas
O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. A predefinição é 10.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds
Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization
A utilização de destino (em percentagem em 100) que o dimensionador automático deve tentar manter para este serviço Web. A predefinição é 70.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data
Quer ative ou não a recolha de dados de modelos para este Webservice. Predefinições para Falso.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled
Quer ative ou não a autenticação para este Webservice. Predefinições para Verdadeiro.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores
O número de núcleos de cpu a alocar para este Webservice. Pode ser um decimal. Predefinições para 0.1
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb
A quantidade de memória (em GB) a alocar para este Webservice. Pode ser um decimal. Predefinições para 0,5
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights
Quer ative ou não o registo do Application Insights para este Webservice. Predefinições para Falso.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms
Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests
O número máximo de pedidos simultâneos por réplica para permitir este Webservice. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time
A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas
O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key
Uma chave de autenticação primária a utilizar para este webservice
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key
Uma chave de autenticação secundária a utilizar para este webservice
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags
Dicionário de etiquetas de valor chave para fornecer este Webservice
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties
Dicionário de propriedades de valor chave para fornecer este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description
Uma descrição para fornecer este serviço Web.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores
O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds
Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds
O número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds
O número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold
Os êxitos mínimos consecutivos para a sonda de liveness serem considerados bem-sucedidos depois de terem falhado. A predefinição é 1. O valor mínimo é 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold
Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta horas failureThreshold
antes de desistir. A predefinição é 3. O valor mínimo é 1.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace
O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e carateres de hífen ('-'). Os primeiros e últimos carateres não podem ser hífenes.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled
Quer ative ou não a autenticação do Azure Active Directory para este webservice. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. Predefinições para Falso.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name
O nome da versão num ponto final.
- azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile
A quantidade de tráfego que a versão utiliza num ponto final.
Métodos
validate_endpoint_configuration |
Verifique se os valores de configuração especificados são válidos. Irá gerar um WebserviceException se a validação falhar. |
validate_endpoint_configuration
Verifique se os valores de configuração especificados são válidos.
Irá gerar um WebserviceException se a validação falhar.
validate_endpoint_configuration()
Exceções
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários