AksEndpoint Classe

Referência

Nota

Esta é uma classe experimental e pode mudar em qualquer altura. Para obter mais informações, veja https://aka.ms/azuremlexperimental.

Representa uma coleção de versões de serviço Web por trás do mesmo ponto final em execução no Azure Kubernetes Service.

Enquanto um AksWebservice implementa um único serviço com um único ponto final de classificação, a classe AksEndpoint permite-lhe implementar várias versões de serviço Web atrás do mesmo ponto final de classificação. Cada versão do serviço Web pode ser configurada para servir uma percentagem do tráfego para que possa implementar modelos de forma controlada, por exemplo, para testes A/B. O AksEndpoint permite a implementação a partir de um objeto de modelo semelhante ao AksWebservice.

Inicialize a instância do Webservice.

O construtor webservice obtém uma representação na cloud de um objeto Webservice associado à área de trabalho fornecida. Devolverá uma instância de uma classe subordinada correspondente ao tipo específico do objeto Webservice obtido.

Herança: AksWebservice

AksEndpoint

Construtor

AksEndpoint(workspace, name)

Parâmetros

workspace: Workspace

Necessário

O objeto da área de trabalho que contém o objeto Webservice a obter.

name: str

Necessário

O nome do objeto Webservice a obter.

Variáveis

versions: dict[str, AksWebservice]

Um dicionário do nome da versão para o objeto de versão. Contém todas as versões implementadas como parte deste Ponto Final.

Métodos

create_version	Adicione uma nova versão num Ponto Final com propriedades fornecidas.
delete_version	Eliminar uma versão num Ponto Final.
deploy_configuration	Crie um objeto de configuração para implementar num destino de computação do AKS.
serialize	Converta este Webservice num dicionário serializado JSON.
update	Atualize o Ponto Final com as propriedades fornecidas. Os valores deixados como Nenhum permanecerão inalterados neste Ponto Final
update_version	Atualize uma versão existente num Ponto Final com as propriedades fornecidas. Os valores deixados como Nenhum permanecerão inalterados nesta versão.

create_version

Adicione uma nova versão num Ponto Final com propriedades fornecidas.

create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

Parâmetros

version_name: str

Necessário

O nome da versão a adicionar num ponto final.

autoscale_enabled: bool

valor predefinido: None

Quer ative ou não o dimensionamento automático para esta versão num Ponto Final. A predefinição é Verdadeiro se num_replicas for Nenhuma.

autoscale_min_replicas: int

valor predefinido: None

O número mínimo de contentores a utilizar ao dimensionar automaticamente esta versão num Ponto Final. Predefinições para 1

autoscale_max_replicas: int

valor predefinido: None

O número máximo de contentores a utilizar ao dimensionar automaticamente esta versão num Ponto Final. Predefinições para 10

autoscale_refresh_seconds: int

valor predefinido: None

Com que frequência o dimensionador automático deve tentar dimensionar esta versão num Ponto Final. Predefinições para 1

autoscale_target_utilization: int

valor predefinido: None

A utilização de destino (em percentagem em 100) que o dimensionador automático deve tentar manter para esta versão num Ponto Final. Predefinições para 70

collect_model_data: bool

valor predefinido: None

Quer ative ou não a recolha de dados de modelos para esta versão num Ponto Final. Predefinições para Falso

cpu_cores: float

valor predefinido: None

O número de núcleos de CPU a alocar para esta versão num Ponto Final. Pode ser um decimal. Predefinições para 0.1

memory_gb: float

valor predefinido: None

A quantidade de memória (em GB) a alocar para esta versão num Ponto Final. Pode ser um decimal. Predefinições para 0,5

scoring_timeout_ms: int

valor predefinido: None

Um tempo limite para impor chamadas de classificação para esta versão num Ponto Final. A predefinição é 60000.

replica_max_concurrent_requests: int

valor predefinido: None

O número máximo de pedidos simultâneos por réplica para permitir esta versão num Ponto Final. A predefinição é 1. Não altere esta definição do valor predefinido de 1, a menos que seja instruído pelo Suporte Técnico da Microsoft ou por um membro da equipa do Azure Machine Learning.

max_request_wait_time: int

valor predefinido: None

A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.

num_replicas: int

valor predefinido: None

O número de contentores a alocar para esta versão num Ponto Final. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.

tags: dict[str, str]

valor predefinido: None

Dicionário de etiquetas de valor chave para dar este Ponto Final.

properties: dict[str, str]

valor predefinido: None

Dicionário de propriedades de valor chave para dar este Ponto Final. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave.

description: str

valor predefinido: None

Uma descrição para dar a este Ponto Final.

models: list[Model]

valor predefinido: None

Uma lista de objetos de Modelo para empacotar com o serviço atualizado.

inference_config: InferenceConfig

valor predefinido: None

Um objeto InferenceConfig utilizado para fornecer as propriedades de implementação do modelo necessárias.

gpu_cores: int

valor predefinido: None

O número de núcleos gpu a alocar para esta versão num Ponto Final. A predefinição é 0.

period_seconds: int

valor predefinido: None

Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.

initial_delay_seconds: int

valor predefinido: None

O número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310.

timeout_seconds: int

valor predefinido: None

O número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1.

success_threshold: int

valor predefinido: None

Os êxitos mínimos consecutivos para a sonda de liveness serem considerados bem-sucedidos depois de terem falhado. A predefinição é 1. O valor mínimo é 1.

failure_threshold: int

valor predefinido: None

Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tentará falharTestenha tempos antes de desistir. A predefinição é 3. O valor mínimo é 1.

traffic_percentile: float

valor predefinido: None

A quantidade de tráfego que a versão utiliza num ponto final.

is_default: bool

valor predefinido: None

Se pretende ou não tornar esta versão como versão predefinida num Ponto Final. Predefinições para Falso.

is_control_version_type: bool

valor predefinido: None

Quer esta versão seja ou não uma versão de controlo num Ponto Final. Predefinições para Falso.

cpu_cores_limit: float

valor predefinido: None

O número máximo de núcleos de cpu que este Webservice pode utilizar. Pode ser um decimal.

memory_gb_limit: float

valor predefinido: None

A quantidade máxima de memória (em GB) que este Webservice pode utilizar. Pode ser um decimal.

Exceções

WebserviceException

delete_version

Eliminar uma versão num Ponto Final.

delete_version(version_name)

Parâmetros

version_name: str

Necessário

O nome da versão num ponto final a eliminar.

Exceções

WebserviceException

deploy_configuration

Crie um objeto de configuração para implementar num destino de computação do AKS.

static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)

Parâmetros

autoscale_enabled: bool

valor predefinido: None

Se pretende ativar ou não o dimensionamento automático para esta versão num Ponto Final. A predefinição é Verdadeiro se num_replicas for Nenhum.

autoscale_min_replicas: int

valor predefinido: None

O número mínimo de contentores a utilizar ao dimensionar automaticamente esta versão num Ponto Final. A predefinição é 1.

autoscale_max_replicas: int

valor predefinido: None

O número máximo de contentores a utilizar ao dimensionar automaticamente esta versão num Ponto Final. A predefinição é 10.

autoscale_refresh_seconds: int

valor predefinido: None

Com que frequência o dimensionador automático deve tentar dimensionar esta versão num Ponto Final. A predefinição é 1.

autoscale_target_utilization: int

valor predefinido: None

A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para esta versão num Ponto Final. A predefinição é 70.

collect_model_data: bool

valor predefinido: None

Ativar ou não a recolha de dados de modelos para esta versão num Ponto Final. A predefinição é Falso.

auth_enabled: bool

valor predefinido: None

Se pretende ativar ou não a autenticação de chave para esta versão num Ponto Final. A predefinição é Verdadeiro.

cpu_cores: float

valor predefinido: None

O número de núcleos de cpu a alocar para esta versão num Ponto Final. Pode ser um decimal. Predefinições para 0.1

memory_gb: float

valor predefinido: None

A quantidade de memória (em GB) a alocar para esta versão num Ponto Final. Pode ser um decimal. Predefinições para 0,5

enable_app_insights: bool

valor predefinido: None

Se pretende ativar ou não o registo do ApplicationInsights para esta versão num Ponto Final. A predefinição é Falso.

scoring_timeout_ms: int

valor predefinido: None

Um tempo limite para impor chamadas de classificação para esta versão num Ponto Final. Predefinições para 60000

replica_max_concurrent_requests: int

valor predefinido: None

max_request_wait_time: int

valor predefinido: None

A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.

num_replicas: int

valor predefinido: None

O número de contentores a alocar para esta versão num Ponto Final. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.

primary_key: str

valor predefinido: None

Uma chave de autenticação primária a utilizar para este Ponto Final.

secondary_key: str

valor predefinido: None

Uma chave de autenticação secundária a utilizar para este Ponto Final.

tags: dict[str, str]

valor predefinido: None

Dicionário de etiquetas de valor de chave para dar este Ponto Final.

properties: dict[str, str]

valor predefinido: None

Dicionário de propriedades de valor de chave para dar este Ponto Final. Estas propriedades não podem ser alteradas após a implementação, no entanto, podem ser adicionados novos pares de valores chave

description: str

valor predefinido: None

Uma descrição para dar a este Ponto Final.

gpu_cores: int

valor predefinido: None

O número de núcleos de GPU a alocar para esta versão num Ponto Final. A predefinição é 0.

period_seconds: int

valor predefinido: None

Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.

initial_delay_seconds: int

valor predefinido: None

Número de segundos após o início do contentor antes de as pesquisas de liveness serem iniciadas. A predefinição é 310.

timeout_seconds: int

valor predefinido: None

Número de segundos após o qual a sonda de liveness excede o tempo limite. A predefinição é de 2 segundos. O valor mínimo é 1.

success_threshold: int

valor predefinido: None

Êxitos mínimos consecutivos para que a sonda liveness seja considerada bem-sucedida depois de ter falhado. A predefinição é 1. O valor mínimo é 1.

failure_threshold: int

valor predefinido: None

Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tenta failureThreshold horas antes de desistir. A predefinição é 3. O valor mínimo é 1.

namespace: str

valor predefinido: None

O espaço de nomes do Kubernetes no qual pretende implementar este Ponto Final: até 63 carateres alfanuméricos em minúsculas ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último carateres não podem ser hífenes.

token_auth_enabled: bool

valor predefinido: None

Quer ative ou não a autenticação do Token para este Ponto Final. Se esta opção estiver ativada, os utilizadores podem aceder a este Ponto Final ao obter o token de acesso com as respetivas credenciais do Azure Active Directory. A predefinição é Falso.

version_name: str

valor predefinido: None

O nome da versão num ponto final.

traffic_percentile: float

valor predefinido: None

a quantidade de tráfego que a versão recebe num ponto final.

compute_target_name: str

valor predefinido: None

O nome do destino de computação a implementar no

cpu_cores_limit: float

valor predefinido: None

O número máximo de núcleos de cpu que este Webservice tem permissão para utilizar. Pode ser um decimal.

memory_gb_limit: float

valor predefinido: None

A quantidade máxima de memória (em GB) que este Webservice tem permissão para utilizar. Pode ser um decimal.

Tipo de retorno

AksEndpointDeploymentConfiguration

Exceções

WebserviceException

serialize

Converta este Webservice num dicionário serializado JSON.

serialize()

Devoluções

A representação JSON deste Webservice.

Tipo de retorno

dict

Exceções

WebserviceException

update

Atualize o Ponto Final com as propriedades fornecidas.

Os valores deixados como Nenhum permanecerão inalterados neste Ponto Final

update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)

Parâmetros

auth_enabled: bool

valor predefinido: None

Se pretende ativar ou não a autenticação de chave para esta versão num Ponto Final. A predefinição é Verdadeiro.

token_auth_enabled: bool

valor predefinido: None

enable_app_insights: bool

valor predefinido: None

Se pretende ativar ou não o registo do Application Insights para esta versão num Ponto Final. A predefinição é Falso.

description: str

valor predefinido: None

Uma descrição para dar a este Ponto Final.

tags: dict[str, str]

valor predefinido: None

Dicionário de etiquetas de valor de chave para dar este Ponto Final.

properties: dict[str, str]

valor predefinido: None

Exceções

WebserviceException

update_version

Atualize uma versão existente num Ponto Final com as propriedades fornecidas.

Os valores deixados como Nenhum permanecerão inalterados nesta versão.

update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)

Parâmetros

version_name: str

Necessário

O nome da versão num ponto final.

autoscale_enabled: bool

valor predefinido: None

Se pretende ativar ou não o dimensionamento automático para esta versão num Ponto Final. A predefinição é Verdadeiro se num_replicas for Nenhum.

autoscale_min_replicas: int

valor predefinido: None

O número mínimo de contentores a utilizar ao dimensionar automaticamente esta versão num Ponto Final. A predefinição é 1.

autoscale_max_replicas: int

valor predefinido: None

O número máximo de contentores a utilizar ao dimensionar automaticamente esta versão num Ponto Final. A predefinição é 10.

autoscale_refresh_seconds: int

valor predefinido: None

Com que frequência o dimensionador automático deve tentar dimensionar esta versão num Ponto Final. Predefinições para 1

autoscale_target_utilization: int

valor predefinido: None

A utilização de destino (em percentagem de 100) que o dimensionador automático deve tentar manter para esta versão num Ponto Final. A predefinição é 70.

collect_model_data: bool

valor predefinido: None

Ativar ou não a recolha de dados de modelos para esta versão num Ponto Final. A predefinição é Falso.

cpu_cores: float

valor predefinido: None

O número de núcleos de cpu a alocar para esta versão num Ponto Final. Pode ser um decimal. Predefinições para 0.1

memory_gb: float

valor predefinido: None

A quantidade de memória (em GB) a alocar para esta versão num Ponto Final. Pode ser um decimal. Predefinições para 0,5

scoring_timeout_ms: int

valor predefinido: None

Um tempo limite para impor chamadas de classificação para esta versão num Ponto Final. A predefinição é 60000.

replica_max_concurrent_requests: int

valor predefinido: None

max_request_wait_time: int

valor predefinido: None

A quantidade máxima de tempo que um pedido permanecerá na fila (em milissegundos) antes de devolver um erro 503. A predefinição é 500.

num_replicas: int

valor predefinido: None

O número de contentores a alocar para esta versão num Ponto Final. Sem predefinição, se este parâmetro não estiver definido, o dimensionador automático está ativado por predefinição.

tags: dict[str, str]

valor predefinido: None

Dicionário de etiquetas de valor chave para dar este Ponto Final.

properties: dict[str, str]

valor predefinido: None

description: str

valor predefinido: None

Uma descrição para dar a este Ponto Final

models: list[Model]

valor predefinido: None

Uma lista de objetos de Modelo a empacotar com o serviço atualizado

inference_config: InferenceConfig

valor predefinido: None

Um objeto InferenceConfig utilizado para fornecer as propriedades de implementação do modelo necessárias.

gpu_cores: int

valor predefinido: None

O número de núcleos gpu a alocar para esta versão num Ponto Final. A predefinição é 0.

period_seconds: int

valor predefinido: None

Com que frequência (em segundos) executar a sonda liveness. Predefinição para 10 segundos. O valor mínimo é 1.

initial_delay_seconds: int

valor predefinido: None

O número de segundos após o início do contentor antes de as sondas liveness serem iniciadas. A predefinição é 310.

timeout_seconds: int

valor predefinido: None

O número de segundos após o qual a sonda de liveness excede o limite de tempo. A predefinição é de 2 segundos. O valor mínimo é 1.

success_threshold: int

valor predefinido: None

Os êxitos mínimos consecutivos para a sonda de liveness serem considerados bem-sucedidos depois de terem falhado. A predefinição é 1. O valor mínimo é 1.

failure_threshold: int

valor predefinido: None

Quando um Pod é iniciado e a sonda liveness falha, o Kubernetes tentará falharTestenha tempos antes de desistir. A predefinição é 3. O valor mínimo é 1.

traffic_percentile: float

valor predefinido: None

A quantidade de tráfego que a versão utiliza num ponto final.

is_default: bool

valor predefinido: None

Se pretende ou não tornar esta versão como versão predefinida num Ponto Final. Predefinições para Falso.

is_control_version_type: bool

valor predefinido: None

Quer esta versão seja ou não uma versão de controlo num Ponto Final. Predefinições para Falso.

cpu_cores_limit: float

valor predefinido: None

O número máximo de núcleos de cpu que este Webservice pode utilizar. Pode ser um decimal.

memory_gb_limit: float

valor predefinido: None

A quantidade máxima de memória (em GB) que este Webservice pode utilizar. Pode ser um decimal.

Exceções

WebserviceException

Partilhar via

AksEndpoint Classe

Construtor

Parâmetros

Variáveis

Métodos

create_version

Parâmetros

Exceções

delete_version

Parâmetros

Exceções

deploy_configuration

Parâmetros

Tipo de retorno

Exceções

serialize

Devoluções

Tipo de retorno

Exceções

update

Parâmetros

Exceções

update_version

Parâmetros

Exceções

Comentários

Comentários

Recursos adicionais