Disponibilité des régions pour les modèles dans les points de terminaison d’API serverless | Azure AI Studio
Important
Certaines des fonctionnalités décrites dans cet article peuvent uniquement être disponibles en préversion. Cette préversion est fournie sans contrat de niveau de service, nous la déconseillons dans des charges de travail de production. Certaines fonctionnalités peuvent être limitées ou non prises en charge. Pour plus d’informations, consultez Conditions d’Utilisation Supplémentaires relatives aux Évaluations Microsoft Azure.
Dans cet article, vous allez découvrir quelles régions sont disponibles pour chacun des modèles prenant en charge les déploiements de points de terminaison d’API serverless.
Certains modèles du catalogue de modèles peuvent être déployés en tant qu’API serverless avec facturation avec paiement à l’utilisation. Ce type de déploiement permet de consommer des modèles en tant qu’API sans les héberger sur votre abonnement, tout en conservant la sécurité et la conformité de l’entreprise dont les organisations ont besoin. Cette option de déploiement ne nécessite pas de quota à partir de votre abonnement.
Disponibilité dans les régions
La disponibilité des points de terminaison d’API serverless pour certains modèles est répertoriée dans les tableaux suivants :
Modèles Cohere
Région | Cohere Command R | Cohere Command R+ | Cohere Embed v3 |
---|---|---|---|
USA Est 2 | ✓ | ✓ | ✓ |
Suède Centre | ✓ | ✓ | ✓ |
Modèles Mistral
Région | Mistral-Small | Mistral-Large |
---|---|---|
USA Est 2 | ✓ | ✓ |
France Centre | non disponible | ✓ |
Suède Centre | ✓ | ✓ |
Modèles Meta Llama
Région | Llama-2 | Llama-3 |
---|---|---|
USA Est 2 | ✓ | ✓ |
USA Ouest 3 | ✓ | non disponible |
Modèle Nixtla TimeGEN-1
Région | Nixtla TimeGEN-1 |
---|---|
USA Est | ✓ |
USA Est 2 | ✓ |
Centre-Nord des États-Unis | ✓ |
États-Unis - partie centrale méridionale | ✓ |
USA Ouest | ✓ |
USA Ouest 3 | ✓ |
Suède Centre | ✓ |
Modèles Phi 3
Région | Phi-3-mini | Phi-3-medium |
---|---|---|
USA Est 2 | ✓ | ✓ |
Suède Centre | ✓ | ✓ |
Alternatives à la disponibilité des régions
Si la plupart de votre infrastructure se trouve dans une région particulière et que vous souhaitez tirer parti des modèles disponibles uniquement en tant que points de terminaison d’API serverless, vous pouvez créer un hub ou un projet sur la région prise en charge, puis consommer le point de terminaison à partir d’une autre région.
Lire Consommer des points de terminaison d’API serverless à partir d’un autre hub ou projet pour apprendre à configurer un point de terminaison d’API serverless existant dans un hub ou un projet différent de celui où il a été déployé.
Contenu connexe
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de l’année 2024, nous abandonnerons progressivement le mécanisme de retour d’information GitHub Issues pour le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultez :Soumettre et afficher des commentaires pour