Teilen über


Regionale Verfügbarkeit für Modelle in serverlosen API-Endpunkten | Azure Machine Learning

In diesem Artikel erfahren Sie, welche Regionen für jedes der Modelle verfügbar sind, die serverlose API-Endpunktbereitstellungen unterstützen.

Bestimmte Modelle im Modellkatalog können als serverlose API mit nutzungsbasierter Bezahlung bereitgestellt werden. Diese Art von Bereitstellung bietet eine Möglichkeit, Modelle als API zu nutzen, ohne sie in Ihrem Abonnement zu hosten, während die Unternehmenssicherheit und Compliance beibehalten werden, die Organisationen benötigen. Für diese Bereitstellungsoption ist kein Kontingent aus Ihrem Abonnement erforderlich.

Regionale Verfügbarkeit

Die Verfügbarkeit serverloser API-Endpunkte für ausgewählte Modelle ist in den folgenden Tabellen aufgeführt:

Cohere-Modelle

Region Cohere Command R Cohere Command R+ Cohere Embed v3
East US
USA (Ost) 2
Schweden, Mitte
USA Nord Mitte
USA Süd Mitte
USA (Westen)
USA, Westen 3

Mistral-Modelle

Region Mistral-Nemo Mistral-Small Mistral-Large (2402), Mistral-Large (2407)
East US
USA (Ost) 2
USA Nord Mitte
USA Süd Mitte
Schweden, Mitte
USA (Westen)
USA, Westen 3

Meta Llama-Modelle

Region Llama-2 Llama-3
East US
USA (Ost) 2
USA Nord Mitte
USA Süd Mitte
Schweden, Mitte nicht verfügbar
USA (Westen)
USA, Westen 3

Nixtla TimeGEN-1-Modell

Region Nixtla TimeGEN-1
East US
USA (Ost) 2
USA Nord Mitte
USA Süd Mitte
Schweden, Mitte
USA (Westen)
USA, Westen 3

Phi 3-Modelle

Region Phi-3-mini Phi-3-small Phi-3-medium
USA (Ost) 2
Schweden, Mitte

Jais-Modell

Region Jais 30B Chat
East US
USA (Ost) 2
USA Nord Mitte
USA Süd Mitte
Schweden, Mitte
USA (Westen)
USA, Westen 3

AI21 Labs-Modell

Region AI21-Jamba-Instruct
East US
USA (Ost) 2
USA Nord Mitte
USA Süd Mitte
Schweden, Mitte
USA (Westen)
USA, Westen 3

Hinweis

Modelle, die über den Azure Marketplace angeboten werden, sind nur für Microsoft Managed Countries erhältlich, mit Ausnahme der Cohere-Modellfamilie, die auch in Japan verfügbar ist.

Alternativen zur Verfügbarkeit von Regionen

Wenn sich ein Großteil Ihrer Infrastruktur in einer bestimmten Region befindet und Sie Modelle nutzen möchten, die nur als serverlose API-Endpunkte verfügbar sind, können Sie einen Arbeitsbereich in der unterstützten Region erstellen und dann den Endpunkt aus einer anderen Region nutzen.

Lesen Sie Verwenden von serverlosen API-Endpunkten aus einem anderen Arbeitsbereich, um zu erfahren, wie Sie einen vorhandenen serverlosen API-Endpunkt in einem anderen Arbeitsbereich konfigurieren als der, in dem er bereitgestellt wurde.