Plateforme et infrastructure de cloud computing pour la génération, le déploiement et la gestion d’applications et de services à travers un réseau mondial de centres de données gérés par Microsoft.
Bonjour Eric,
Merci d'avoir sollicité la communauté Q&A France.
Avant toute chose prenez en considération que l’affichage des quotas et le déploiement de modèles nécessitent le rôle Lecteur des utilisations cognitives . Ce rôle fournit l’accès minimal nécessaire pour afficher l’utilisation des quotas dans un abonnement Azure.
Le quota d’Azure OpenAI permet d’attribuer des limites de débit à vos déploiements, jusqu’à une limite globale appelée « quota »; il est attribué à votre abonnement par région, par modèle, en unités de jetons par minute (TPM).
Lorsque vous intégrez un abonnement à Azure OpenAI, vous recevez le quota par défaut pour la plupart des modèles disponibles.
Vous pouvez continuer à créer des déploiements et à leur affecter des TPM jusqu’à ce que vous atteigniez votre limite de quota.
Lorsque cela se produit, vous pouvez uniquement créer des déploiements de ce modèle en réduisant les TPM affectés à d’autres déploiements du même modèle ou en demandant une augmentation du quota de modèle dans la région souhaitée.
Pour plus d'informations je vous invite à consulter les articles Microsoft suivant:
A bientôt
Alexis
Si cette réponse a répondu à votre question, veuillez « Accepter comme réponse » et voter en utilisant « Pouce levé » afin que la pertinence de ce message s’améliore lorsque quelqu’un dans la communauté recherche une requête similaire.