Partager via


Disponibilité des régions pour les modèles dans les points de terminaison d’API serverless | Azure AI Studio

Important

Certaines des fonctionnalités décrites dans cet article peuvent uniquement être disponibles en préversion. Cette préversion est fournie sans contrat de niveau de service, nous la déconseillons dans des charges de travail de production. Certaines fonctionnalités peuvent être limitées ou non prises en charge. Pour plus d’informations, consultez Conditions d’Utilisation Supplémentaires relatives aux Évaluations Microsoft Azure.

Dans cet article, vous allez découvrir quelles régions sont disponibles pour chacun des modèles prenant en charge les déploiements de points de terminaison d’API serverless.

Certains modèles du catalogue de modèles peuvent être déployés en tant qu’API serverless avec facturation avec paiement à l’utilisation. Ce type de déploiement permet de consommer des modèles en tant qu’API sans les héberger sur votre abonnement, tout en conservant la sécurité et la conformité de l’entreprise dont les organisations ont besoin. Cette option de déploiement ne nécessite pas de quota à partir de votre abonnement.

Disponibilité dans les régions

La disponibilité des points de terminaison d’API serverless pour certains modèles est répertoriée dans les tableaux suivants :

Modèles Cohere

Région Cohere Command R Cohere Command R+ Cohere Embed v3
USA Est 2
Suède Centre

Modèles Mistral

Région Mistral-Small Mistral-Large
USA Est 2
France Centre non disponible
Suède Centre

Modèles Meta Llama

Région Llama-2 Llama-3
USA Est 2
USA Ouest 3 non disponible

Modèle Nixtla TimeGEN-1

Région Nixtla TimeGEN-1
USA Est
USA Est 2
Centre-Nord des États-Unis
États-Unis - partie centrale méridionale
USA Ouest
USA Ouest 3
Suède Centre

Modèles Phi 3

Région Phi-3-mini Phi-3-medium
USA Est 2
Suède Centre

Alternatives à la disponibilité des régions

Si la plupart de votre infrastructure se trouve dans une région particulière et que vous souhaitez tirer parti des modèles disponibles uniquement en tant que points de terminaison d’API serverless, vous pouvez créer un hub ou un projet sur la région prise en charge, puis consommer le point de terminaison à partir d’une autre région.

Lire Consommer des points de terminaison d’API serverless à partir d’un autre hub ou projet pour apprendre à configurer un point de terminaison d’API serverless existant dans un hub ou un projet différent de celui où il a été déployé.