Partilhar via


AksEndpoint Classe

Nota

Esta é uma classe experimental e pode mudar em qualquer altura. Para obter mais informações, veja https://aka.ms/azuremlexperimental.

Representa uma coleção de versões de serviço Web por trás do mesmo ponto final em execução no Azure Kubernetes Service.

Enquanto um AksWebservice implementa um único serviço com um único ponto final de classificação, a classe AksEndpoint permite-lhe implementar várias versões de serviço Web atrás do mesmo ponto final de classificação. Cada versão do serviço Web pode ser configurada para servir uma percentagem do tráfego para que possa implementar modelos de forma controlada, por exemplo, para testes A/B. O AksEndpoint permite a implementação a partir de um objeto de modelo semelhante ao AksWebservice.

Inicialize a instância do Webservice.

O construtor webservice obtém uma representação na cloud de um objeto Webservice associado à área de trabalho fornecida. Devolverá uma instância de uma classe subordinada correspondente ao tipo específico do objeto Webservice obtido.

Herança
AksEndpoint

Construtor

AksEndpoint(workspace, name)

Parâmetros

workspace
Workspace
Necessário

O objeto da área de trabalho que contém o objeto Webservice a obter.

name
str
Necessário

O nome do objeto Webservice a obter.

Variáveis

versions
dict[str, AksWebservice]

Um dicionário do nome da versão para o objeto de versão. Contém todas as versões implementadas como parte deste Ponto Final.

Métodos

create_version

Adicione uma nova versão num Ponto Final com propriedades fornecidas.

delete_version

Eliminar uma versão num Ponto Final.

deploy_configuration

Crie um objeto de configuração para implementar num destino de computação do AKS.

serialize

Converta este Webservice num dicionário serializado JSON.

update

Atualize o Ponto Final com as propriedades fornecidas.

Os valores deixados como Nenhum permanecerão inalterados neste Ponto Final

update_version

Atualize uma versão existente num Ponto Final com as propriedades fornecidas.

Os valores deixados como Nenhum permanecerão inalterados nesta versão.

create_version

Adicione uma nova versão num Ponto Final com propriedades fornecidas.

create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

Parâmetros

version_name
str
Necessário

O nome da versão a adicionar num ponto final.

autoscale_enabled
bool
valor predefinido: None

Quer ative ou não o dimensionamento automático para esta versão num Ponto Final. A predefinição é Verdadeiro se num_replicas for Nenhuma.

autoscale_min_replicas
int
valor predefinido: None

O número mínimo de contentores a utilizar ao dimensionar automaticamente esta versão num Ponto Final. Predefinições para 1

autoscale_max_replicas
int
valor predefinido: None

O número máximo de contentores a utilizar ao dimensionar automaticamente esta versão num Ponto Final. Predefinições para 10

autoscale_refresh_seconds
int
valor predefinido: None

Com que frequência o dimensionador automático deve tentar dimensionar esta versão num Ponto Final. Predefinições para 1

autoscale_target_utilization
int
valor predefinido: None

A utilização de destino (em percentagem em 100) que o dimensionador automático deve tentar manter para esta versão num Ponto Final. Predefinições para 70

collect_model_data
bool
valor predefinido: None

Quer ative ou não a recolha de dados de modelos para esta versão num Ponto Final. Predefinições para Falso

cpu_cores
float
valor predefinido: None

O número de núcleos de CPU a alocar para esta versão num Ponto Final. Pode ser um decimal. Predefinições para 0.1

memory_gb
float
valor predefinido: None

A quantidade de memória (em GB) a alocar para esta versão num Ponto Final. Pode ser um decimal. Predefinições para 0,5

scoring_timeout_ms
int
valor predefinido: None

Um tempo limite para impor chamadas de classificação para esta versão num Ponto Final. A predefinição é 60000.

replica_max_concurrent_requests
int
valor predefinido: None

O número máximo de pedidos simultâneos por réplica para permitir esta versão num Ponto Final. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.

max_request_wait_time
int
valor predefinido: None

A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.

num_replicas
int
valor predefinido: None

O número de contentores a alocar para esta versão num Ponto Final. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.

tags
dict[str, str]
valor predefinido: None

Dicionário de etiquetas de valor chave para dar este Ponto Final.

properties
dict[str, str]
valor predefinido: None

Dicionário de propriedades de valor chave para dar este Ponto Final. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.

description
str
valor predefinido: None

Uma descrição para dar a este Ponto Final.

models
list[Model]
valor predefinido: None

Uma lista de objetos de Modelo para empacotar com o serviço atualizado.

inference_config
InferenceConfig
valor predefinido: None

Um objeto InferenceConfig utilizado para fornecer as propriedades de implementação do modelo necessárias.

gpu_cores
int
valor predefinido: None

O número de núcleos gpu a alocar para esta versão num Ponto Final. A predefinição é 0.

period_seconds
int
valor predefinido: None

Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.

initial_delay_seconds
int
valor predefinido: None

O número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310.

timeout_seconds
int
valor predefinido: None

O número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1.

success_threshold
int
valor predefinido: None

Os êxitos mínimos consecutivos para a sonda de liveness serem considerados bem-sucedidos depois de terem falhado. A predefinição é 1. O valor mínimo é 1.

failure_threshold
int
valor predefinido: None

Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tentará falharTestenha tempos antes de desistir. A predefinição é 3. O valor mínimo é 1.

traffic_percentile
float
valor predefinido: None

A quantidade de tráfego que a versão utiliza num ponto final.

is_default
bool
valor predefinido: None

Se pretende ou não tornar esta versão como versão predefinida num Ponto Final. Predefinições para Falso.

is_control_version_type
bool
valor predefinido: None

Quer esta versão seja ou não uma versão de controlo num Ponto Final. Predefinições para Falso.

cpu_cores_limit
float
valor predefinido: None

O número máximo de núcleos de cpu que este Webservice pode utilizar. Pode ser um decimal.

memory_gb_limit
float
valor predefinido: None

A quantidade máxima de memória (em GB) que este Webservice pode utilizar. Pode ser um decimal.

Exceções

delete_version

Eliminar uma versão num Ponto Final.

delete_version(version_name)

Parâmetros

version_name
str
Necessário

O nome da versão num ponto final a eliminar.

Exceções

deploy_configuration

Crie um objeto de configuração para implementar num destino de computação do AKS.

static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)

Parâmetros

autoscale_enabled
bool
valor predefinido: None

Se pretende ativar ou não o dimensionamento automático para esta versão num Ponto Final. A predefinição é Verdadeiro se num_replicas for Nenhum.

autoscale_min_replicas
int
valor predefinido: None

O número mínimo de contentores a utilizar ao dimensionar automaticamente esta versão num Ponto Final. A predefinição é 1.

autoscale_max_replicas
int
valor predefinido: None

O número máximo de contentores a utilizar ao dimensionar automaticamente esta versão num Ponto Final. A predefinição é 10.

autoscale_refresh_seconds
int
valor predefinido: None

Com que frequência o dimensionador automático deve tentar dimensionar esta versão num Ponto Final. A predefinição é 1.

autoscale_target_utilization
int
valor predefinido: None

A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para esta versão num Ponto Final. A predefinição é 70.

collect_model_data
bool
valor predefinido: None

Ativar ou não a recolha de dados de modelos para esta versão num Ponto Final. A predefinição é Falso.

auth_enabled
bool
valor predefinido: None

Se pretende ativar ou não a autenticação de chave para esta versão num Ponto Final. A predefinição é Verdadeiro.

cpu_cores
float
valor predefinido: None

O número de núcleos de cpu a alocar para esta versão num Ponto Final. Pode ser um decimal. Predefinições para 0.1

memory_gb
float
valor predefinido: None

A quantidade de memória (em GB) a alocar para esta versão num Ponto Final. Pode ser um decimal. Predefinições para 0,5

enable_app_insights
bool
valor predefinido: None

Se pretende ativar ou não o registo do ApplicationInsights para esta versão num Ponto Final. A predefinição é Falso.

scoring_timeout_ms
int
valor predefinido: None

Um tempo limite para impor chamadas de classificação para esta versão num Ponto Final. Predefinições para 60000

replica_max_concurrent_requests
int
valor predefinido: None

O número máximo de pedidos simultâneos por réplica para permitir esta versão num Ponto Final. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.

max_request_wait_time
int
valor predefinido: None

A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.

num_replicas
int
valor predefinido: None

O número de contentores a alocar para esta versão num Ponto Final. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.

primary_key
str
valor predefinido: None

Uma chave de autenticação primária a utilizar para este Ponto Final.

secondary_key
str
valor predefinido: None

Uma chave de autenticação secundária a utilizar para este Ponto Final.

tags
dict[str, str]
valor predefinido: None

Dicionário de etiquetas de valor de chave para dar este Ponto Final.

properties
dict[str, str]
valor predefinido: None

Dicionário de propriedades de valor de chave para dar este Ponto Final. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave

description
str
valor predefinido: None

Uma descrição para dar a este Ponto Final.

gpu_cores
int
valor predefinido: None

O número de núcleos de GPU a alocar para esta versão num Ponto Final. A predefinição é 0.

period_seconds
int
valor predefinido: None

Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.

initial_delay_seconds
int
valor predefinido: None

Número de segundos após o início do contentor antes de as pesquisas de liveness serem iniciadas. A predefinição é 310.

timeout_seconds
int
valor predefinido: None

Número de segundos após o qual a sonda de liveness excede o tempo limite. A predefinição é de 2 segundos. O valor mínimo é 1.

success_threshold
int
valor predefinido: None

Êxitos mínimos consecutivos para que a sonda liveness seja considerada bem-sucedida depois de ter falhado. A predefinição é 1. O valor mínimo é 1.

failure_threshold
int
valor predefinido: None

Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta failureThreshold horas antes de desistir. A predefinição é 3. O valor mínimo é 1.

namespace
str
valor predefinido: None

O espaço de nomes do Kubernetes no qual pretende implementar este Ponto Final: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último carateres não podem ser hífenes.

token_auth_enabled
bool
valor predefinido: None

Quer ative ou não a autenticação do Token para este Ponto Final. Se esta opção estiver ativada, os utilizadores podem aceder a este Ponto Final ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. A predefinição é Falso.

version_name
str
valor predefinido: None

O nome da versão num ponto final.

traffic_percentile
float
valor predefinido: None

a quantidade de tráfego que a versão recebe num ponto final.

compute_target_name
str
valor predefinido: None

O nome do destino de computação a implementar no

cpu_cores_limit
float
valor predefinido: None

O número máximo de núcleos de cpu que este Webservice tem permissão para utilizar. Pode ser um decimal.

memory_gb_limit
float
valor predefinido: None

A quantidade máxima de memória (em GB) que este Webservice tem permissão para utilizar. Pode ser um decimal.

Tipo de retorno

Exceções

serialize

Converta este Webservice num dicionário serializado JSON.

serialize()

Devoluções

A representação JSON deste Webservice.

Tipo de retorno

Exceções

update

Atualize o Ponto Final com as propriedades fornecidas.

Os valores deixados como Nenhum permanecerão inalterados neste Ponto Final

update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)

Parâmetros

auth_enabled
bool
valor predefinido: None

Se pretende ativar ou não a autenticação de chave para esta versão num Ponto Final. A predefinição é Verdadeiro.

token_auth_enabled
bool
valor predefinido: None

Quer ative ou não a autenticação do Token para este Ponto Final. Se esta opção estiver ativada, os utilizadores podem aceder a este Ponto Final ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. A predefinição é Falso.

enable_app_insights
bool
valor predefinido: None

Se pretende ativar ou não o registo do Application Insights para esta versão num Ponto Final. A predefinição é Falso.

description
str
valor predefinido: None

Uma descrição para dar a este Ponto Final.

tags
dict[str, str]
valor predefinido: None

Dicionário de etiquetas de valor de chave para dar este Ponto Final.

properties
dict[str, str]
valor predefinido: None

Dicionário de propriedades de valor de chave para dar este Ponto Final. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.

Exceções

update_version

Atualize uma versão existente num Ponto Final com as propriedades fornecidas.

Os valores deixados como Nenhum permanecerão inalterados nesta versão.

update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

Parâmetros

version_name
str
Necessário

O nome da versão num ponto final.

autoscale_enabled
bool
valor predefinido: None

Se pretende ativar ou não o dimensionamento automático para esta versão num Ponto Final. A predefinição é Verdadeiro se num_replicas for Nenhum.

autoscale_min_replicas
int
valor predefinido: None

O número mínimo de contentores a utilizar ao dimensionar automaticamente esta versão num Ponto Final. A predefinição é 1.

autoscale_max_replicas
int
valor predefinido: None

O número máximo de contentores a utilizar ao dimensionar automaticamente esta versão num Ponto Final. A predefinição é 10.

autoscale_refresh_seconds
int
valor predefinido: None

Com que frequência o dimensionador automático deve tentar dimensionar esta versão num Ponto Final. Predefinições para 1

autoscale_target_utilization
int
valor predefinido: None

A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para esta versão num Ponto Final. A predefinição é 70.

collect_model_data
bool
valor predefinido: None

Ativar ou não a recolha de dados de modelos para esta versão num Ponto Final. A predefinição é Falso.

cpu_cores
float
valor predefinido: None

O número de núcleos de cpu a alocar para esta versão num Ponto Final. Pode ser um decimal. Predefinições para 0.1

memory_gb
float
valor predefinido: None

A quantidade de memória (em GB) a alocar para esta versão num Ponto Final. Pode ser um decimal. Predefinições para 0,5

scoring_timeout_ms
int
valor predefinido: None

Um tempo limite para impor chamadas de classificação para esta versão num Ponto Final. A predefinição é 60000.

replica_max_concurrent_requests
int
valor predefinido: None

O número máximo de pedidos simultâneos por réplica para permitir esta versão num Ponto Final. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.

max_request_wait_time
int
valor predefinido: None

A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.

num_replicas
int
valor predefinido: None

O número de contentores a alocar para esta versão num Ponto Final. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.

tags
dict[str, str]
valor predefinido: None

Dicionário de etiquetas de valor chave para dar este Ponto Final.

properties
dict[str, str]
valor predefinido: None

Dicionário de propriedades de valor chave para dar este Ponto Final. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.

description
str
valor predefinido: None

Uma descrição para dar a este Ponto Final

models
list[Model]
valor predefinido: None

Uma lista de objetos de Modelo a empacotar com o serviço atualizado

inference_config
InferenceConfig
valor predefinido: None

Um objeto InferenceConfig utilizado para fornecer as propriedades de implementação do modelo necessárias.

gpu_cores
int
valor predefinido: None

O número de núcleos gpu a alocar para esta versão num Ponto Final. A predefinição é 0.

period_seconds
int
valor predefinido: None

Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.

initial_delay_seconds
int
valor predefinido: None

O número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310.

timeout_seconds
int
valor predefinido: None

O número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1.

success_threshold
int
valor predefinido: None

Os êxitos mínimos consecutivos para a sonda de liveness serem considerados bem-sucedidos depois de terem falhado. A predefinição é 1. O valor mínimo é 1.

failure_threshold
int
valor predefinido: None

Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tentará falharTestenha tempos antes de desistir. A predefinição é 3. O valor mínimo é 1.

traffic_percentile
float
valor predefinido: None

A quantidade de tráfego que a versão utiliza num ponto final.

is_default
bool
valor predefinido: None

Se pretende ou não tornar esta versão como versão predefinida num Ponto Final. Predefinições para Falso.

is_control_version_type
bool
valor predefinido: None

Quer esta versão seja ou não uma versão de controlo num Ponto Final. Predefinições para Falso.

cpu_cores_limit
float
valor predefinido: None

O número máximo de núcleos de cpu que este Webservice pode utilizar. Pode ser um decimal.

memory_gb_limit
float
valor predefinido: None

A quantidade máxima de memória (em GB) que este Webservice pode utilizar. Pode ser um decimal.

Exceções