Anmerkung
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen, dich anzumelden oder die Verzeichnisse zu wechseln.
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen , die Verzeichnisse zu wechseln.
In diesem Artikel werden die Grundlagenmodelle beschrieben, die Sie mit Mosaic AI Model Servingbereitstellen können.
Foundation-Modelle sind große, vortrainierte neurale Netzwerke, die sowohl auf großen als auch auf breiten Datenbereichen trainiert werden. Diese Modelle sind darauf ausgelegt, allgemeine Muster in Sprache, Bildern oder anderen Datentypen zu erlernen und können mit zusätzlichen Schulungen für bestimmte Aufgaben optimiert werden. Ihre Verwendung bestimmter Foundation-Modelle unterliegt der Lizenz des Modellentwicklers und der zulässigen Verwendungsrichtlinie. Siehe anwendbare Modellentwicklerlizenzen und -bedingungen.
Model Serving bietet flexible Optionen zum Hosten und Abfragen von Foundation-Modellen basierend auf Ihren Anforderungen:
- Pay-per-Token: Ideal für das Experimentieren und schnelle Erforschung. Mit dieser Option können Sie vorkonfigurierte Endpunkte in Ihrem Databricks-Arbeitsbereich abfragen, ohne vorab Infrastrukturverpflichtungen einzugehen.
- KI-Funktionen (Batch-Ableitung): Eine Teilmenge von in Databricks gehosteten Modellen ist für KI-Funktionen optimiert. Mit diesen Funktionen und den unterstützten Modellen können Sie KI auf Ihre Daten anwenden und Batch-Produktionsworkloads im großen Maßstab ausführen.
- Bereitgestellter Durchsatz: Empfohlen für Produktionsanwendungsfälle, die Leistungsgarantien erfordern. Diese Option ermöglicht die Bereitstellung fein abgestimmter Foundation-Modelle mit optimierten Dienstendpunkten.
- Externe Modelle: Diese Option ermöglicht den Zugriff auf Foundation-Modelle, die außerhalb von Databricks gehostet werden, z. B. die von OpenAI oder Anthropic bereitgestellten. Diese Modelle können zentral in Databricks verwaltet werden, um eine optimierte Governance zu erreichen.
Auf Databricks gehostete Foundation-Modelle
Databricks hostet modernste open Foundation-Modelle wie Meta Llama. Diese Modelle werden mithilfe von Foundation Model-APIs zur Verfügung gestellt.
In der folgenden Tabelle wird zusammengefasst, welche datenbricks-gehosteten Modell- und Modellfamilien in jeder Region basierend auf dem Feature "Modellbereitstellung" unterstützt werden.
Wichtig
Anthropic Claude Opus 4.5 werden auf globalen Endpunkten gehostet und erfordern eine standortübergreifende Weiterleitung für jede Region.
Anthropic Claude 3.7 Sonnet wird am 10. März 2026 eingestellt. Siehe "Eingestellte Modelle" für das empfohlene Ersatzmodell und Anleitungen für die Migration während der Außerbetriebnahme.
Meta Llama 4 Maverick ist für Foundation Model APIs verfügbar, die Workloads mit Durchsatz bereitstellen in Öffentliche Vorschau.
Ab dem 11. Dezember 2024 ersetzt Meta-Llama-3.3-70B-Instruct die Unterstützung für Meta-Llama-3.1-70B-Instruct in den pay-per-token Endpunkten der Foundation Model APIs.
Meta-Llama-3.1-405B-Instruct ist das größte offen verfügbare hochmoderne Sprachmodell, das von Meta erstellt und trainiert wurde und von Azure Machine Learning mithilfe des AzureML-Modellkatalogs verteilt wird.
- Ab dem 15. Februar 2026 wird Meta-Llama-3.1-405B-Instruct für Pay-per-Token-Workloads außer Betrieb genommen.
- Ab dem 15. Mai 2026 wird Meta-Llama-3.1-405B-Instruct für vorkonfigurierte Durchsatzbelastungen eingestellt.
- Siehe "Eingestellte Modelle" für das empfohlene Ersatzmodell und Anleitungen für die Migration während der Außerbetriebnahme.
Ab dem 15. Februar 2026 werden die modelle, die den folgenden Modellfamilien zugeordnet sind, eingestellt und sind nicht mehr für die Verwendung in einem der Featurebereiche "Model Serving" verfügbar. Empfohlene Ersatzmodelle und Anleitungen zum Migrieren während der Veraltetkeit finden Sie unter "Eingestellte Modelle ".
- Llama 3 70B
- Llama 3 8B
- Llama 2 70B
- Llama 2 13B
- Mistral 8x7B
- Mixtral 8x7B
Ab dem 19. Dezember 2025 werden die modelle, die den folgenden Modellfamilien zugeordnet sind, eingestellt und sind nicht mehr für die Verwendung in einem der Featurebereiche "Modellbereitstellung" verfügbar. Empfohlene Ersatzmodelle und Anleitungen zum Migrieren während der Veraltetkeit finden Sie unter "Eingestellte Modelle ".
- DBRX
- MPT 30B
- MPT 7B
| Region | APIs für Foundation-Modelle, Bezahlung pro Token | KI-Funktionen (Batch-Ableitung) | Basismodell-APIs mit bereitgestelltem Durchsatz |
|---|---|---|---|
australiacentral |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
australiacentral2 |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
australiaeast |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
australiasoutheast |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
brazilsouth |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
canadacentral |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
canadaeast |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
centralindia |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
centralus |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
chinaeast2 |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
chinaeast3 |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
chinanorth2 |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
chinanorth3 |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
eastasia |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
eastus |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
eastus2 |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
francecentral |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
germanywestcentral |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
japaneast |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
japanwest |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
koreacentral |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
mexicocentral |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
northcentralus |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
northeurope |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
norwayeast |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
qatarcentral |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
southafricanorth |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
southcentralus |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
southeastasia |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
southindia |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
swedencentral |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
switzerlandnorth |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
switzerlandwest |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
uaenorth |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
uksouth |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
ukwest |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
westcentralus |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
westeurope |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
westindia |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
westus |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
westus2 |
Die folgenden Modelle werden unterstützt:
|
Die folgenden Modelle werden unterstützt: |
|
westus3 |
Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
* Dieses Modell wird basierend auf der GPU-Verfügbarkeit unterstützt und erfordert ein standortübergreifendes Routing.
Access Foundation-Modelle, die außerhalb von Databricks gehostet werden
Basismodelle, die von Large Language Model (LLM)-Anbietern wie OpenAI und Anthropic erstellt wurden, sind unter Verwendung von externen Modellen auch in Databricks zugänglich. Diese Modelle werden außerhalb von Databricks gehostet, und Sie können einen Endpunkt erstellen, um sie abzufragen. Diese Endpunkte können zentral von Azure Databricks gesteuert werden, wodurch die Verwendung und Verwaltung verschiedener LLM-Anbieter innerhalb Ihrer Organisation optimiert wird.
Die folgende Tabelle enthält eine nicht vollständige Liste der unterstützten Modelle und die entsprechenden Endpunkttypen. Sie können die aufgelisteten Modellzuordnungen verwenden, um Sie beim Konfigurieren eines Endpunkts für alle neu veröffentlichten Modelltypen zu unterstützen, sobald sie für einen bestimmten Anbieter verfügbar sind. Kunden sind dafür verantwortlich, die Einhaltung anwendbarer Modelllizenzen sicherzustellen.
Hinweis
Mit der schnellen Entwicklung von LLMs gibt es keine Garantie dafür, dass diese Liste jederzeit auf dem neuesten Stand ist. Neue Modellversionen desselben Anbieters werden in der Regel unterstützt, auch wenn sie nicht in der Liste enthalten sind.
| Modellanbieter | llm/v1/completions | llm/v1/chat | llm/v1/embeddings |
|---|---|---|---|
| OpenAI** |
|
|
|
| Azure OpenAI** |
|
|
|
| Anthropic |
|
|
|
| Kohärenz** |
|
|
|
| Mosaic AI-Modellbereitstellung | Databricks-Bereitstellungsendpunkt | Databricks-Bereitstellungsendpunkt | Databricks-Bereitstellungsendpunkt |
| Amazon Bedrock | Anthropisch:
Zusammenhalten
AI21 Labs:
|
Anthropisch:
Zusammenhalten
Amazonas:
|
Amazonas:
Zusammenhalten
|
AI21 Labs†: |
|
||
| Google Cloud Vertex AI | text-bison |
|
|
** Der Modellanbieter unterstützt optimierte Vervollständigungs- und Chatmodelle. Um ein fein abgestimmtes Modell abzufragen, füllen Sie das name Feld der konfiguration external model mit dem Namen Ihres fein abgestimmten Modells auf.
† Der Modellanbieter unterstützt benutzerdefinierte Vervollständigungsmodelle.
Erstellen eines Foundationmodells, das Endpunkte bedient
Um Foundation-Modelle in Ihren KI-Anwendungen abzufragen und zu verwenden, müssen Sie zuerst einen Modell-Serving-Endpunkt erstellen. Model Serving verwendet eine einheitliche API und Benutzeroberfläche zum Erstellen und Aktualisieren des Foundation-Modells, das Endpunkte bedient.
- Informationen zum Erstellen eines Endpunkts, der optimierte Varianten von Basismodellen bereitstellt, die mithilfe von Foundation Model-APIs mit bereitgestelltem Durchsatz verfügbar gemacht werden, finden Sie unter Erstellen eines Endpunkts mit bereitgestelltem Durchsatz mithilfe der REST-API.
- Informationen zum Erstellen von Dienstendpunkten, die auf Basismodelle zugreifen, die mit dem Angebot für externe Modelle bereitgestellt wurden, finden Sie unter Erstellen eines Bereitstellungsendpunkts für ein externes Modell.
Abfragen der Endpunkte für die Basismodellbereitstellung
Nachdem Sie Ihren Bereitstellungsendpunkt erstellt haben, können Sie Ihr Grundmodell abfragen. Model Serving verwendet eine einheitliche openAI-kompatible API und ein SDK zum Abfragen von Foundationmodellen. Diese einheitliche Benutzeroberfläche vereinfacht das Experimentieren und Anpassen von Foundation-Modellen für die Produktion in unterstützten Clouds und Anbietern.