Oi Benext!
Bem-vindo ao Microsoft Q&A!
Parece que você está enfrentando um problema de limite de taxa com o GPT-4o-mini. Esse erro geralmente ocorre quando o número de solicitações ou a quantidade de tokens usados excede o limite permitido em um determinado período.
Aqui estão algumas sugestões para resolver esse problema:
- Verifique os Limites de Uso: Certifique-se de que você está ciente dos limites de taxa para o seu modelo. Você pode verificar isso na seção de limites da sua conta.
- Implementar Lógica de Retentativa: Adicione uma lógica de retentativa exponencial no seu código. Isso significa que, ao encontrar um erro de limite de taxa, você deve esperar um tempo antes de tentar novamente, aumentando gradualmente o tempo de espera se o erro persistir. Compreender os limites de taxa
- Reduzir a Carga de Trabalho: Tente diminuir a quantidade de tokens ou a frequência das solicitações. Evite mudanças bruscas na carga de trabalho e aumente gradualmente.
- Aumentar a Cota: Se possível, considere aumentar a cota atribuída ao seu deployment ou mover a cota de outro deployment, se necessário.
Espero que essas dicas ajudem a resolver o problema! Se precisar de mais assistência, estou à disposição.
Saudações
Jonathan.
-----------
Sua opinião é muito importante para nós! Se esta resposta resolveu sua consulta, por favor clique em ‘YES‘. Isso nos ajuda a melhorar continuamente a qualidade e relevância de nossas soluções. Obrigado pela sua colaboração!