AksEndpointDeploymentConfiguration Classe
Observação
Essa é uma classe experimental e pode mudar a qualquer momento. Consulte https://aka.ms/azuremlexperimental para obter mais informações.
Representa informações de configuração de implantação para um serviço implantado no Serviço de Kubernetes do Azure.
Criar um objeto AksEndpointDeploymentConfiguration usando o método deploy_configuration
da classe AksEndpoint.
Inicialize um objeto de configuração para implantar um ponto de extremidade em um destino de computação do AKS.
- Herança
-
AksEndpointDeploymentConfiguration
Construtor
AksEndpointDeploymentConfiguration(autoscale_enabled, autoscale_min_replicas, autoscale_max_replicas, autoscale_refresh_seconds, autoscale_target_utilization, collect_model_data, auth_enabled, cpu_cores, memory_gb, enable_app_insights, scoring_timeout_ms, replica_max_concurrent_requests, max_request_wait_time, num_replicas, primary_key, secondary_key, tags, properties, description, gpu_cores, period_seconds, initial_delay_seconds, timeout_seconds, success_threshold, failure_threshold, namespace, token_auth_enabled, version_name, traffic_percentile, compute_target_name, cpu_cores_limit, memory_gb_limit)
Parâmetros
Nome | Description |
---|---|
autoscale_enabled
Obrigatório
|
Se o cálculo automático deve ou não ser habilitado para este serviço Web.
O padrão será True se |
autoscale_min_replicas
Obrigatório
|
O número mínimo de contêineres a serem usados no dimensionamento automático desse serviço Web. O valor padrão é 1. |
autoscale_max_replicas
Obrigatório
|
O número máximo de contêineres a serem usados no dimensionamento automático desse serviço Web. O valor padrão é 10. |
autoscale_refresh_seconds
Obrigatório
|
Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1. |
autoscale_target_utilization
Obrigatório
|
A utilização de destino (em percentual de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O valor padrão é 70. |
collect_model_data
Obrigatório
|
Se a coleta de dados de modelo deve ou não ser habilitada para esse serviço Web. Usa False como padrão. |
auth_enabled
Obrigatório
|
Se a autenticação deve ou não ser habilitada para esse serviço Web. O padrão é True. |
cpu_cores
Obrigatório
|
O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O valor padrão é 0,1 |
memory_gb
Obrigatório
|
A quantidade de memória (em GB) alocada para esse serviço Web. Pode ser um decimal. O valor padrão é 0,5 |
enable_app_insights
Obrigatório
|
Se o registro em log do Application Insights deve ou não ser habilitado para esse serviço Web. Usa False como padrão. |
scoring_timeout_ms
Obrigatório
|
Um tempo limite a ser imposto para chamadas de pontuação para este serviço Web. O valor padrão é 60000. |
replica_max_concurrent_requests
Obrigatório
|
O número máximo de solicitações simultâneas por réplica permitidas para esse serviço Web. O valor padrão é 1. Não altere o valor padrão 1 dessa configuração, a menos que seja instruído pelo suporte técnico da Microsoft ou por um membro da equipe do Azure Machine Learning. |
max_request_wait_time
Obrigatório
|
A quantidade máxima de tempo que uma solicitação permanece na fila (em milissegundos) antes de retornar um erro 503. O valor padrão é 500. |
num_replicas
Obrigatório
|
O número de contêineres alocados para este serviço Web. Não há valor padrão. Se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão. |
primary_key
Obrigatório
|
Uma chave de autenticação primária a ser usada para esse serviço Web |
secondary_key
Obrigatório
|
Uma chave de autenticação secundária a ser usada para esse serviço Web |
tags
Obrigatório
|
Dicionário de marcas de chave/valor a serem fornecidas a esse serviço Web |
properties
Obrigatório
|
Dicionário de propriedades de chave/valor a serem fornecidas a esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de chave/valor podem ser adicionados. |
description
Obrigatório
|
Uma descrição fornecida a esse serviço Web. |
gpu_cores
Obrigatório
|
O número de núcleos de GPU alocados para esse serviço Web. Assume o padrão de 0. |
period_seconds
Obrigatório
|
A frequência (em segundos) para realizar a investigação de atividade. O padrão é 10 segundos. O valor mínimo é 1. |
initial_delay_seconds
Obrigatório
|
O número de segundos depois que o contêiner é iniciado antes que as investigações de atividade sejam iniciadas. O valor padrão é 310. |
timeout_seconds
Obrigatório
|
O número de segundos após os quais a investigação de atividade atinge o tempo limite. O valor padrão é 2 segundos. O valor mínimo é 1. |
success_threshold
Obrigatório
|
O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1. |
failure_threshold
Obrigatório
|
Quando um pod for iniciado e a investigação de atividade falhar, o Kubernetes tentará |
namespace
Obrigatório
|
O namespace do Kubernetes para implantar este serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens. |
token_auth_enabled
Obrigatório
|
Se a autenticação do Azure Active Directory deve ou não ser habilitada para esse serviço Web. Se essa instrução estiver habilitada, os usuários poderão acessar esse serviço Web buscando o token de acesso com o uso das suas credenciais do Azure Active Directory. Usa False como padrão. |
version_name
Obrigatório
|
O nome da versão em um ponto de extremidade. |
traffic_percentile
Obrigatório
|
A quantidade de tráfego que a versão leva em um ponto de extremidade. |
cpu_cores_limit
Obrigatório
|
O número máximo de núcleos de CPU que esse serviço Web tem permissão para usar. Pode ser um decimal. |
memory_gb_limit
Obrigatório
|
A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal. |
autoscale_enabled
Obrigatório
|
Se o cálculo automático deve ou não ser habilitado para este serviço Web.
O padrão será True se |
autoscale_min_replicas
Obrigatório
|
O número mínimo de contêineres a serem usados no dimensionamento automático desse serviço Web. O valor padrão é 1. |
autoscale_max_replicas
Obrigatório
|
O número máximo de contêineres a serem usados no dimensionamento automático desse serviço Web. O valor padrão é 10. |
autoscale_refresh_seconds
Obrigatório
|
Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1. |
autoscale_target_utilization
Obrigatório
|
A utilização de destino (em percentual de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O valor padrão é 70. |
collect_model_data
Obrigatório
|
Se a coleta de dados de modelo deve ou não ser habilitada para esse serviço Web. Usa False como padrão. |
auth_enabled
Obrigatório
|
Se a autenticação deve ou não ser habilitada para esse serviço Web. O padrão é True. |
cpu_cores
Obrigatório
|
O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O valor padrão é 0,1 |
memory_gb
Obrigatório
|
A quantidade de memória (em GB) alocada para esse serviço Web. Pode ser um decimal. O valor padrão é 0,5 |
enable_app_insights
Obrigatório
|
Se o registro em log do Application Insights deve ou não ser habilitado para esse serviço Web. Usa False como padrão. |
scoring_timeout_ms
Obrigatório
|
Um tempo limite a ser imposto para chamadas de pontuação para este serviço Web. O valor padrão é 60000. |
replica_max_concurrent_requests
Obrigatório
|
O número máximo de solicitações simultâneas por réplica permitidas para esse serviço Web. O valor padrão é 1. Não altere o valor padrão 1 dessa configuração, a menos que seja instruído pelo suporte técnico da Microsoft ou por um membro da equipe do Azure Machine Learning. |
max_request_wait_time
Obrigatório
|
A quantidade máxima de tempo que uma solicitação permanece na fila (em milissegundos) antes de retornar um erro 503. O valor padrão é 500. |
num_replicas
Obrigatório
|
O número de contêineres alocados para este serviço Web. Não há valor padrão. Se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão. |
primary_key
Obrigatório
|
Uma chave de autenticação primária a ser usada para esse serviço Web |
secondary_key
Obrigatório
|
Uma chave de autenticação secundária a ser usada para esse serviço Web |
tags
Obrigatório
|
Dicionário de marcas de chave/valor a serem fornecidas a esse serviço Web |
properties
Obrigatório
|
Dicionário de propriedades de chave/valor a serem fornecidas a esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de chave/valor podem ser adicionados. |
description
Obrigatório
|
Uma descrição fornecida a esse serviço Web. |
gpu_cores
Obrigatório
|
O número de núcleos de GPU alocados para esse serviço Web. Assume o padrão de 0. |
period_seconds
Obrigatório
|
A frequência (em segundos) para realizar a investigação de atividade. O padrão é 10 segundos. O valor mínimo é 1. |
initial_delay_seconds
Obrigatório
|
O número de segundos depois que o contêiner é iniciado antes que as investigações de atividade sejam iniciadas. O valor padrão é 310. |
timeout_seconds
Obrigatório
|
O número de segundos após os quais a investigação de atividade atinge o tempo limite. O valor padrão é 2 segundos. O valor mínimo é 1. |
success_threshold
Obrigatório
|
O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1. |
failure_threshold
Obrigatório
|
Quando um pod for iniciado e a investigação de atividade falhar, o Kubernetes tentará |
namespace
Obrigatório
|
O namespace do Kubernetes para implantar este serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens. |
token_auth_enabled
Obrigatório
|
Se a autenticação do Azure Active Directory deve ou não ser habilitada para esse serviço Web. Se essa instrução estiver habilitada, os usuários poderão acessar esse serviço Web buscando o token de acesso com o uso das suas credenciais do Azure Active Directory. Usa False como padrão. |
version_name
Obrigatório
|
O nome da versão em um ponto de extremidade. |
traffic_percentile
Obrigatório
|
A quantidade de tráfego que a versão leva em um ponto de extremidade. |
compute_target_name
Obrigatório
|
O nome do destino de computação a ser implantado |
cpu_cores_limit
Obrigatório
|
O número máximo de núcleos de CPU que esse serviço Web tem permissão para usar. Pode ser um decimal. |
memory_gb_limit
Obrigatório
|
A quantidade máxima de memória (em GB) que esse serviço Web tem permissão para usar. Pode ser um decimal. |
Variáveis
Nome | Description |
---|---|
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_enabled
|
Se o cálculo automático deve ou não ser habilitado para este serviço Web. O padrão será True se |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_min_replicas
|
O número mínimo de contêineres a serem usados no dimensionamento automático desse serviço Web. O valor padrão é 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_max_replicas
|
O número máximo de contêineres a serem usados no dimensionamento automático desse serviço Web. O valor padrão é 10. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_refresh_seconds
|
Com que frequência o dimensionador automático deve tentar dimensionar esse serviço Web. O valor padrão é 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.autoscale_target_utilization
|
A utilização de destino (em percentual de 100) que o dimensionador automático deve tentar manter para esse serviço Web. O valor padrão é 70. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.collect_model_data
|
Se a coleta de dados de modelo deve ou não ser habilitada para esse serviço Web. Usa False como padrão. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.auth_enabled
|
Se a autenticação deve ou não ser habilitada para esse serviço Web. O padrão é True. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.cpu_cores
|
O número de núcleos de CPU a serem alocados para esse serviço Web. Pode ser um decimal. O valor padrão é 0,1 |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.memory_gb
|
A quantidade de memória (em GB) alocada para esse serviço Web. Pode ser um decimal. O valor padrão é 0,5 |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.enable_app_insights
|
Se o registro em log do Application Insights deve ou não ser habilitado para esse serviço Web. Usa False como padrão. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.scoring_timeout_ms
|
Um tempo limite a ser imposto para chamadas de pontuação para este serviço Web. O valor padrão é 60000. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.replica_max_concurrent_requests
|
O número máximo de solicitações simultâneas por réplica permitidas para esse serviço Web. O valor padrão é 1. Não altere o valor padrão 1 dessa configuração, a menos que seja instruído pelo suporte técnico da Microsoft ou por um membro da equipe do Azure Machine Learning. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.max_request_wait_time
|
A quantidade máxima de tempo que uma solicitação permanece na fila (em milissegundos) antes de retornar um erro 503. O valor padrão é 500. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.num_replicas
|
O número de contêineres alocados para este serviço Web. Não há valor padrão. Se esse parâmetro não for definido, o dimensionador automático será habilitado por padrão. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.primary_key
|
Uma chave de autenticação primária a ser usada para esse serviço Web |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.secondary_key
|
Uma chave de autenticação secundária a ser usada para esse serviço Web |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.tags
|
Dicionário de marcas de chave/valor a serem fornecidas a esse serviço Web |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.properties
|
Dicionário de propriedades de chave/valor a serem fornecidas a esse serviço Web. Essas propriedades não podem ser alteradas após a implantação, no entanto, novos pares de chave/valor podem ser adicionados. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.description
|
Uma descrição fornecida a esse serviço Web. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.gpu_cores
|
O número de núcleos de GPU alocados para esse serviço Web. Assume o padrão de 0. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.period_seconds
|
A frequência (em segundos) para realizar a investigação de atividade. O padrão é 10 segundos. O valor mínimo é 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.initial_delay_seconds
|
O número de segundos depois que o contêiner é iniciado antes que as investigações de atividade sejam iniciadas. O valor padrão é 310. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.timeout_seconds
|
O número de segundos após os quais a investigação de atividade atinge o tempo limite. O valor padrão é 2 segundos. O valor mínimo é 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.success_threshold
|
O mínimo de sucessos consecutivos para que a investigação de atividade seja considerada bem-sucedida após apresentar falha. O valor padrão é 1. O valor mínimo é 1. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.failure_threshold
|
Quando um pod for iniciado e a investigação de atividade falhar, o Kubernetes tentará |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.namespace
|
O namespace do Kubernetes para implantar este serviço Web: até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último caracteres não podem ser hifens. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.token_auth_enabled
|
Se a autenticação do Azure Active Directory deve ou não ser habilitada para esse serviço Web. Se essa instrução estiver habilitada, os usuários poderão acessar esse serviço Web buscando o token de acesso com o uso das suas credenciais do Azure Active Directory. Usa False como padrão. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.version_name
|
O nome da versão em um ponto de extremidade. |
azureml.core.webservice.aks.AksEndpointDeploymentConfiguration.traffic_percentile
|
A quantidade de tráfego que a versão leva em um ponto de extremidade. |
Métodos
validate_endpoint_configuration |
Verifique se os valores de configuração especificados são válidos. Se a validação falhar, gerará uma WebserviceException. |
validate_endpoint_configuration
Verifique se os valores de configuração especificados são válidos.
Se a validação falhar, gerará uma WebserviceException.
validate_endpoint_configuration()
Exceções
Tipo | Description |
---|---|