Criar endpoints para os serviços web que foram implementados no Machine Learning Studio (clássico).

APLICA-SE A: Aplica-se a. Machine Learning Studio (clássico) Não se aplica a. Azure Machine Learning

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

Consulte informações sobre como mover projetos de aprendizado de máquina do ML Studio (clássico) para o Azure Machine Learning.
Saiba mais sobre o Azure Machine Learning

A documentação do Estúdio de Aprendizagem de Máquina (clássico) está a ser descontinuada e no futuro poderá não ser atualizada.

Depois de implementar um serviço Web, é criado um ponto final predefinido para esse serviço. O ponto final predefinido pode ser chamado através da respetiva chave de API. Pode adicionar mais endpoints com chaves no portal de Serviços Web. Cada endpoint no serviço web é endereçado, limitado e gerido de forma independente. Cada ponto de extremidade é uma URL exclusiva com uma chave de autorização que você pode distribuir aos seus clientes.

Adicionar terminais a um serviço web

Você pode adicionar um ponto de extremidade a um serviço Web usando o portal de Serviços Web de Aprendizado de Máquina. Depois de criado o endpoint, podes consumi-lo através de APIs síncronas, APIs de lote e folhas de cálculo do Excel.

Nota

Se você adicionou pontos de extremidade adicionais ao serviço Web, não poderá excluir o ponto de extremidade padrão.

No Estúdio de Aprendizado de Máquina (clássico), na coluna de navegação à esquerda, clique em Serviços Web.
Na parte inferior do painel do serviço Web, clique em Configurar endpoints. O portal de Serviços Web de Aprendizagem Automática abre-se na página de endpoints do serviço web.
Clique em Novo.
Digite um nome e uma descrição para o novo ponto de extremidade. Os nomes dos pontos finais devem ter 24 caracteres ou menos e devem ser compostos por alfabetos ou números minúsculos. Selecione o nível de registo e se os dados de amostra estão ativados. Para obter mais informações sobre o registo de atividades, consulte Ativar o registo de atividades para serviços Web de Aprendizagem Automática.

Dimensionar um serviço Web adicionando pontos de extremidade adicionais

Por padrão, cada serviço Web publicado é configurado para suportar 20 solicitações simultâneas e pode chegar a 200 solicitações simultâneas. O Machine Learning Studio (clássico) otimiza automaticamente a configuração para fornecer o melhor desempenho ao seu serviço web, ignorando o valor do portal.

Se planeia chamar a API com uma carga superior ao valor máximo de 200 chamadas simultâneas suportadas, deverá criar vários pontos de extremidade no mesmo serviço web. Em seguida, você pode distribuir aleatoriamente sua carga em todos eles.

O dimensionamento de um serviço Web é uma tarefa comum. Alguns motivos para dimensionar são oferecer suporte a mais de 200 solicitações simultâneas, aumentar a disponibilidade por meio de vários pontos de extremidade ou fornecer pontos de extremidade separados para o serviço Web. Você pode ampliar a capacidade adicionando pontos de extremidade adicionais para o mesmo serviço web através do portal do Serviço Web de Aprendizagem Automática.

Lembre-se de que usar uma contagem de simultaneidade alta pode ser prejudicial se você não estiver chamando a API com uma taxa correspondentemente alta. Você pode ver tempos limite esporádicos e/ou picos na latência se colocar uma carga relativamente baixa em uma API configurada para alta carga.

As APIs síncronas são normalmente usadas em situações em que uma latência baixa é desejada. A latência aqui implica o tempo que a API leva para concluir uma solicitação e não leva em conta nenhum atraso na rede. Digamos que você tenha uma API com uma latência de 50 ms. Para consumir totalmente a capacidade disponível com o nível de aceleração High e Max Concurrent Calls = 20, você precisa chamar essa API 20 * 1000 / 50 = 400 vezes por segundo. Estendendo isso ainda mais, um máximo de chamadas simultâneas de 200 permite que você chame a API 4000 vezes por segundo, assumindo uma latência de 50 ms.

Próximos passos

Como consumir um serviço Web de Machine Learning.

Last updated on 2019-02-15

Criar endpoints para os serviços web que foram implementados no Machine Learning Studio (clássico).

Adicionar terminais a um serviço web

Dimensionar um serviço Web adicionando pontos de extremidade adicionais

Próximos passos

Recursos adicionais