Escalabilidade e desempenho
Importante
A partir de 20 de setembro de 2023, você não poderá criar novos recursos do Personalizador. O serviço de Personalizador será aposentado no dia 1º de outubro de 2026.
Sites e aplicativos de alto desempenho e alto tráfego têm dois fatores principais a considerar com o Personalizer para escalabilidade e desempenho:
- Mantendo baixa latência ao fazer chamadas de API de classificação
- Garantir que a taxa de transferência do treinamento acompanhe a entrada do evento
A personalização pode retornar uma classificação rapidamente, com a maior parte da duração da chamada dedicada à comunicação por meio da API REST. O Azure dimensionará automaticamente a capacidade de responder a solicitações rapidamente.
Cenários de baixa latência
Alguns aplicativos exigem latências baixas ao retornar uma classificação. São necessárias latências baixas:
- Para evitar que o usuário espere uma quantidade notável de tempo antes de exibir o conteúdo classificado.
- Para ajudar um servidor que está enfrentando tráfego extremo, evite amarrar o tempo de computação escasso e as conexões de rede.
Escalabilidade e taxa de transferência de treinamento
O Personalizer funciona atualizando um modelo que é retreinado com base em mensagens enviadas de forma assíncrona pelo Personalizer após APIs de Classificação e Recompensa. Essas mensagens são enviadas usando um Azure EventHub para o aplicativo.
É improvável que a maioria dos aplicativos atinja a taxa de transferência máxima de ingresso e treinamento do Personalizer. Embora atingir esse máximo não torne o aplicativo lento, isso implicaria que as filas do hub de eventos estão sendo preenchidas internamente mais rápido do que podem ser limpas.
Como estimar seus requisitos de taxa de transferência
- Estime o número médio de bytes por evento de classificação, adicionando os comprimentos dos documentos JSON de contexto e ação.
- Divida 20 MB/s por essa média estimada de bytes.
Por exemplo, se a sua carga útil média tem 500 recursos e cada um tem cerca de 20 caracteres, então cada evento é de aproximadamente 10 kb. Com essas estimativas, 20.000.000 / 10.000 = 2.000 eventos/seg, o que representa cerca de 173 milhões de eventos/dia.
Se você estiver atingindo esses limites, entre em contato com nossa equipe de suporte para obter conselhos de arquitetura.