AksServiceDeploymentConfiguration Classe
Representa uma informação de configuração de implementação para um serviço implementado no Azure Kubernetes Service.
Crie um objeto AksServiceDeploymentConfiguration com o deploy_configuration
método da AksWebservice classe.
Inicialize um objeto de configuração para implementar num destino de computação do AKS.
- Herança
-
AksServiceDeploymentConfiguration
Construtor
AksServiceDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, compute_target_name, cpu_cores_limit, memory_gb_limit, blobfuse_enabled=None)
Parâmetros
- cpu_cores_limit
O número máximo de núcleos de cpu que este Webservice tem permissão para utilizar. Pode ser um decimal.
- memory_gb_limit
A quantidade máxima de memória (em GB) que este Webservice tem permissão para utilizar. Pode ser um decimal.
- autoscale_enabled
- bool
Indica se pretende ativar o dimensionamento automático para este webservice.
A predefinição é Verdadeiro se num_replicas
for Nenhum.
- autoscale_min_replicas
- int
O número mínimo de contentores a utilizar ao dimensionar automaticamente este webservice. A predefinição é 1.
- autoscale_max_replicas
- int
O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. Predefinições para 10
- autoscale_refresh_seconds
- int
Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1.
- autoscale_target_utilization
- int
A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para este webservice. A predefinição é 70.
- collect_model_data
- bool
Se pretende ativar ou não a recolha de dados de modelos para este Webservice. A predefinição é Falso.
- auth_enabled
- bool
Se pretende ativar ou não a autenticação para este webservice. A predefinição é Verdadeiro.
- cpu_cores
- float
O número de núcleos de CPU a alocar para este webservice. Pode ser um decimal. Predefinições para 0.1
- memory_gb
- float
A quantidade de memória (em GB) a alocar para este webservice. Pode ser um decimal. Predefinições para 0,5
- enable_app_insights
- bool
Se pretende ativar ou não o registo do Application Insights para este Webservice. Predefinições para Falso
- scoring_timeout_ms
- int
Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000.
- replica_max_concurrent_requests
- int
O número máximo de pedidos simultâneos por réplica para permitir este serviço Web. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.
- max_request_wait_time
- int
A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.
- num_replicas
- int
O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.
Dicionário de propriedades de valor de chave para fornecer este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.
- gpu_cores
- int
O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0.
- period_seconds
- int
Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.
- initial_delay_seconds
- int
Número de segundos após o início do contentor antes de as pesquisas de liveness serem iniciadas. A predefinição é 310.
- timeout_seconds
- int
Número de segundos após o qual a sonda de liveness excede o tempo limite. A predefinição é de 2 segundos. O valor mínimo é 1.
- success_threshold
- int
Êxitos mínimos consecutivos para que a sonda liveness seja considerada bem-sucedida depois de ter falhado. A predefinição é 1. O valor mínimo é 1.
- failure_threshold
- int
Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta failureThreshold
horas antes de desistir. A predefinição é 3. O valor mínimo é 1.
- namespace
- str
O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último carateres não podem ser hífenes.
- token_auth_enabled
- bool
Se pretende ativar ou não a autenticação do Azure Active Directory para este serviço Web. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. A predefinição é Falso.
- cpu_cores_limit
O número máximo de núcleos de cpu que este Webservice tem permissão para utilizar. Pode ser um decimal.
- memory_gb_limit
A quantidade máxima de memória (em GB) que este Webservice tem permissão para utilizar. Pode ser um decimal.
- blobfuse_enabled
- bool
Quer ative ou não o blobfuse para transferência de modelos para este Webservice. Predefinições para Verdadeiro
- autoscale_enabled
- bool
Indica se pretende ativar o dimensionamento automático para este webservice.
A predefinição é Verdadeiro se num_replicas
for Nenhum.
- autoscale_min_replicas
- int
O número mínimo de contentores a utilizar ao dimensionar automaticamente este webservice. A predefinição é 1.
- autoscale_max_replicas
- int
O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. Predefinições para 10
- autoscale_refresh_seconds
- int
Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1.
- autoscale_target_utilization
- int
A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para este webservice. A predefinição é 70.
- collect_model_data
- bool
Se pretende ativar ou não a recolha de dados de modelos para este Webservice. A predefinição é Falso.
- auth_enabled
- bool
Se pretende ativar ou não a autenticação para este webservice. A predefinição é Verdadeiro.
- cpu_cores
- float
O número de núcleos de CPU a alocar para este webservice. Pode ser um decimal. Predefinições para 0.1
- memory_gb
- float
A quantidade de memória (em GB) a alocar para este Webservice. Pode ser um decimal. Predefinições para 0,5
- enable_app_insights
- bool
Quer ative ou não o registo do Application Insights para este Webservice. Predefinições para Falso
- scoring_timeout_ms
- int
Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000.
- replica_max_concurrent_requests
- int
O número máximo de pedidos simultâneos por réplica para permitir este Webservice. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.
- max_request_wait_time
- int
A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.
- num_replicas
- int
O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.
Dicionário de etiquetas de valor chave para fornecer este Webservice.
Dicionário de propriedades de valor chave para fornecer este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.
- gpu_cores
- int
O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0.
- period_seconds
- int
Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.
- initial_delay_seconds
- int
Número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310.
- timeout_seconds
- int
Número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1.
- success_threshold
- int
Êxitos mínimos consecutivos para que a sonda liveness seja considerada com êxito depois de ter falhado. A predefinição é 1. O valor mínimo é 1.
- failure_threshold
- int
Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta horas failureThreshold
antes de desistir. A predefinição é 3. O valor mínimo é 1.
- namespace
- str
O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e carateres de hífen ('-'). Os primeiros e últimos carateres não podem ser hífenes.
- token_auth_enabled
- bool
Quer ative ou não a autenticação do Azure Active Directory para este webservice. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. Predefinições para Falso.
- cpu_cores_limit
- float
O número máximo de núcleos de cpu que este Webservice pode utilizar. Pode ser um decimal.
- memory_gb_limit
- float
A quantidade máxima de memória (em GB) que este Webservice pode utilizar. Pode ser um decimal.
- blobfuse_enabled
- bool
Quer ative ou não o blobfuse para transferência de modelos para este Webservice. Predefinições para Verdadeiro
Variáveis
- autoscale_enabled
- bool
Indica se pretende ativar o dimensionamento automático para este Webservice.
A predefinição é Verdadeiro se num_replicas
for Nenhuma.
- autoscale_min_replicas
- int
O número mínimo de contentores a utilizar ao dimensionar automaticamente este Webservice. A predefinição é 1.
- autoscale_max_replicas
- int
O número máximo de contentores a utilizar ao dimensionar automaticamente este Webservice. Predefinições para 10
- autoscale_refresh_seconds
- int
Com que frequência o dimensionador automático deve tentar dimensionar este webservice. A predefinição é 1.
- autoscale_target_utilization
- int
A utilização de destino (em percentagem em 100) que o dimensionador automático deve tentar manter para este webservice. A predefinição é 70.
- collect_model_data
- bool
Quer ative ou não a recolha de dados de modelos para este Webservice. Predefinições para Falso.
- auth_enabled
- bool
Quer ative ou não a autenticação para este Webservice. Predefinições para Verdadeiro.
- cpu_cores
- float
O número de núcleos de CPU a alocar para este Webservice. Pode ser um decimal. Predefinições para 0.1
- memory_gb
- float
A quantidade de memória (em GB) a alocar para este Webservice. Pode ser um decimal. Predefinições para 0,5
- enable_app_insights
- bool
Quer ative ou não o registo do Application Insights para este Webservice. Predefinições para Falso
- scoring_timeout_ms
- int
Um tempo limite para impor chamadas de classificação para este webservice. A predefinição é 60000.
- replica_max_concurrent_requests
- int
O número máximo de pedidos simultâneos por réplica para permitir este Webservice. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.
- max_request_wait_time
- int
A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.
- num_replicas
- int
O número de contentores a alocar para este Webservice. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.
- primary_key
- str
Uma chave de autenticação primária a utilizar para este webservice.
- secondary_key
- str
Uma chave de autenticação secundária a utilizar para este webservice.
- azureml.core.webservice.AksServiceDeploymentConfiguration.tags
Dicionário de etiquetas de valor chave para fornecer este Webservice.
- azureml.core.webservice.AksServiceDeploymentConfiguration.properties
Dicionário de propriedades de valor chave para fornecer este Webservice. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.
- azureml.core.webservice.AksServiceDeploymentConfiguration.description
Uma descrição para fornecer este serviço Web.
- gpu_cores
- int
O número de núcleos de GPU a alocar para este Webservice. A predefinição é 0.
- period_seconds
- int
Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.
- initial_delay_seconds
- int
Número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310.
- timeout_seconds
- int
Número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1.
- success_threshold
- int
Êxitos mínimos consecutivos para que a sonda liveness seja considerada com êxito depois de ter falhado. A predefinição é 1. O valor mínimo é 1.
- failure_threshold
- int
Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta horas failureThreshold
antes de desistir. A predefinição é 3. O valor mínimo é 1.
- azureml.core.webservice.AksServiceDeploymentConfiguration.namespace
O espaço de nomes do Kubernetes no qual pretende implementar este Webservice: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e carateres de hífen ('-'). Os primeiros e últimos carateres não podem ser hífenes.
- token_auth_enabled
- bool
Quer ative ou não a autenticação do Azure Active Directory para este webservice. Se esta opção estiver ativada, os utilizadores podem aceder a este webservice ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. Predefinições para Falso.
Métodos
print_deploy_configuration |
Imprima a configuração da implementação. |
validate_configuration |
Verifique se os valores de configuração especificados são válidos. Irá gerar um WebserviceException se a validação falhar. |
print_deploy_configuration
Imprima a configuração da implementação.
print_deploy_configuration()
validate_configuration
Verifique se os valores de configuração especificados são válidos.
Irá gerar um WebserviceException se a validação falhar.
validate_configuration()
Exceções
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários