Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
In diesem Artikel wird die Modellwartungsrichtlinie für die Foundation-Modell-APIs pay-per-token, Foundation Model APIs bereitgestellter Durchsatz und Foundation Model Fine-Tuning-Angebote beschrieben.
Um weiterhin die modernsten Modelle zu unterstützen, kann Databricks unterstützte Modelle aktualisieren oder ältere Modelle für diese Angebote zurückziehen.
Modellrichtlinie für den Ruhestand
In der Modelleinstellungsrichtlinie wird erläutert, wie Databricks Sie benachrichtigt, wenn ein unterstütztes Modell für den Ruhestand festgelegt wird, was während des Übergangszeitraums geschieht und was sie am Rententermin erwarten müssen. Zeitachsen unterscheiden sich je nach Angebot und Modellkategorie, wie in den folgenden Abschnitten zusammengefasst.
Informationen zu derzeit eingestellten Modellen und geplanten Altersvorsorgeterminen finden Sie unter "Eingestellte Modelle". Partnermodelle finden Sie unter " Richtlinie zur Einstellung des Partnermodells".
Wichtig
Die Einstellungsrichtlinien, die für die Foundation Model-APIs pay-per-token und Foundation Model Fine-Tuning-Angebote gelten, wirken sich nur auf unterstützte Chat- und Abschlussmodelle aus.
APIs für Foundation-Modelle, Bezahlung pro Token
In der folgenden Tabelle wird die Einstellungsrichtlinie für Foundation-Modell-APIs mit Pay-per-Token zusammengefasst.
| Ruhestandsbenachrichtigung | Übergang zur Pensionierung | Am Ruhestandsdatum |
|---|---|---|
Databricks führt die folgenden Schritte aus, um Kunden über ein Modell zu informieren, das für den Ruhestand festgelegt ist:
|
Databricks wird das Modell in drei Monaten außer Betrieb nehmen. Während dieses dreimonatigen Zeitraums können Kunden:
|
Das Modell ist nicht mehr für die Verwendung verfügbar und wird aus dem Produkt entfernt. Die anwendbare Dokumentation wird aktualisiert, um die Verwendung eines Ersatzmodells zu empfehlen. |
Basismodell-APIs mit bereitgestelltem Durchsatz
In der folgenden Tabelle wird die Richtlinie zur Außerdienststellung für Foundation Model-APIs mit bereitgestelltem Durchsatz zusammengefasst.
| Ruhestandsbenachrichtigung | Übergang zur Pensionierung | Am Ruhestandsdatum |
|---|---|---|
Databricks führt die folgenden Schritte aus, um Kunden über ein Modell zu informieren, das für den Ruhestand festgelegt ist:
|
Databricks wird das Modell in sechs Monaten eingestellt. Während dieses Zeitraums von sechs Monaten:
|
Das Modell ist nicht mehr für die Verwendung verfügbar und wird aus dem Produkt entfernt.
|
Richtlinie für die Einstellung des Partnermodells
Partnermodelle sind Modelle von Drittanbieterpartnern, insbesondere OpenAI, Anthropic und Google, die über Foundation Model-APIs verfügbar sind. Für diese Partnermodelle folgt Databricks im Allgemeinen den gleichen Zeitachsen und Richtlinien wie für bereitgestellte Durchsatz- und Pay-per-Token-Modelle beschrieben.
Die von Partnern bereitgestellten Altersvorsorgetermine können jedoch kürzer sein als die von Databricks veröffentlichten Übergangszeiträume. In diesen Fällen versucht Databricks, die Lücke zu überbrücken, indem modelle vorübergehend auf eine ähnliche Version umgeleitet werden, sodass Kunden die vollständige Übergangszeit erhalten.
Wenn z. B. ein Zahlungs-pro-Token-Modell mit der Vorlaufzeit eines Monats anstelle von drei angekündigt wird, leitet Databricks das Modell für weitere zwei Monate um, um sofortige Unterbrechungen zu verhindern und Zeit für die Migration zu ermöglichen. Abfragen schlagen am Ende des gesamten dreimonatigen Zeitraums fehl.
Note
Diese Umleitung kann nur auftreten, wenn das Ersatzmodell den gleichen Preis hat und abwärtskompatibel ist. Das Ersatzmodell ist in der Regel eine inkrementelle Modellversion, z. B. 3.0 im Vergleich zu 3.1.
Feinabstimmung von Foundation-Modellen
Die folgende Tabelle enthält eine Zusammenfassung der Einstellungsrichtlinie für die Feinabstimmung des Foundation-Modells.
| Ruhestandsbenachrichtigung | Übergang zur Pensionierung | Am Ruhestandsdatum |
|---|---|---|
Databricks führt die folgenden Schritte aus, um Kunden über ein Modell zu informieren, das für den Ruhestand festgelegt ist:
|
Databricks zieht das Modell in drei Monaten zurück. Während dieses dreimonatigen Zeitraums können Kunden vorhandene Workflows migrieren, um empfohlene Ersatzmodelle zu verwenden. | Das Modell ist nicht mehr für die Verwendung verfügbar und wird aus dem Produkt entfernt. Die anwendbare Dokumentation wird aktualisiert, um die Verwendung eines Ersatzmodells zu empfehlen. |
Modellupdates
Databricks liefern möglicherweise inkrementelle Modellupdates, um Optimierungen bereitzustellen. Wenn ein Modell aktualisiert wird, bleibt die Endpunkt-URL gleich, aber die Modell-ID im Antwortobjekt ändert sich, um das Datum der Aktualisierung widerzuspiegeln. Wenn beispielsweise ein Update am 3.4.2024 an meta-llama/Meta-Llama-3.3-70B ausgeliefert wird, wird der Modellname im Antwortobjekt auf meta-llama/Meta-Llama-3.3-70B-030424aktualisiert. Databricks verwaltet einen Versionsverlauf der Updates, auf die Sie verweisen können.
Zurückgezogene Modelle
In den folgenden Abschnitten werden die aktuellen und bevorstehenden Modellausfälle für die angegebenen Featureangebote zusammengefasst.
Einstellungen für Foundation Model-APIs mit tokenbasierter Bezahlung
Die folgende Tabelle zeigt Modelleinstellungen sowie ihre Einstellungstermine und die empfohlenen Ersatzmodelle für die Verwendung mit Workloads für Foundation Model-APIs mit tokenbasierter Bezahlung. Databricks empfiehlt, Ihre Anwendungen vor dem angegebenen Einstellungsdatum zu migrieren, um Ersatzmodelle zu verwenden.
| Partnermodell | Ruhestandsdatum | Empfohlenes Ersatzmodell |
|---|---|---|
| Anthropic Claude 3.7 Sonnet | 12. April 2026 | Verwenden des neuesten Claude Sonnet-Modells |
| Offenes Modell | Ruhestandsdatum | Empfohlenes Ersatzmodell |
|---|---|---|
| Meta Llama 3.1 405B | 15. Februar 2026 | OpenAI GPT OSS 120B |
| DBRX-Anweisung | 30. April 2025 | Meta-Llama-4-Maverick |
| Mixtral-8x7B-Anweisung | 30. April 2025 | Meta-Llama-4-Maverick |
| Meta-Llama-3.1-70B-Instruct | 11. Dezember 2024 | Meta-Llama-4-Maverick |
| Meta-Llama-3-70B-Instruct | 23. Juli 2024 | Meta-Llama-4-Maverick |
| Meta-Llama-2-70B-Chat | 30. Oktober 2024 | Meta-Llama-4-Maverick |
| MPT 7B-Anweisung | 30. August 2024 | Meta-Llama-4-Maverick |
| MPT 30B-Instruktion | 30. August 2024 | Meta-Llama-4-Maverick |
Wenn Sie langfristige Unterstützung für eine bestimmte Modellversion benötigen, empfiehlt Databricks die Verwendung des bereitgestellten Durchsatzes von Foundation Model-APIs für Ihre Bereitstellungsworkloads.
Bereitgestellte Foundation-Modell-APIs für Durchsatzrücksetzungen
In der folgenden Tabelle sind Modellfamilien, deren Ausmusterungsdaten und empfohlene Ersatzmodelle aufgeführt, die zur Verwendung mit Foundation Model-APIs vorgesehen sind und den bereitgestellten Durchsatz bedienen können. Databricks empfiehlt, Ihre Anwendungen vor dem angegebenen Einstellungsdatum zu migrieren, um Ersatzmodelle zu verwenden.
| Partnermodell | Ruhestandsdatum | Empfohlenes Ersatzmodell |
|---|---|---|
| Gemini 3 Pro | 26. März 2026 | Gemini 3.1 Pro. Um mehr Zeit für die Migration zu ermöglichen, werden api-Aufrufe von Gemini 3.1 Pro zwischen dem 26. März 2026 und dem 7. Juni 2026 vorübergehend an Gemini 3.1 Pro umgeleitet. Die Preise für beide Modelle sind identisch. |
| Offene Modellfamilie | Ruhestandsdatum | Empfohlenes Ersatzmodell |
|---|---|---|
| Meta Llama 3.1 405B | 15. Mai 2026 | OpenAI GPT OSS 120B |
| Meta Llama 3 70B | 27. Februar 2026 | Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe. |
| Meta Llama 3 8B | 27. Februar 2026 | Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe. |
| Meta Llama 2 70B | 27. Februar 2026 | Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe. |
| Meta Llama 2 13B | 27. Februar 2026 | Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe. |
| Meta Llama 2 7B | 27. Februar 2026 | Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe. |
| Mixtral 8x7B | 27. Februar 2026 | Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe. |
| Mistral 7B | 27. Februar 2026 | Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe. |
| DBRX | 19. Dezember 2025 | Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe. |
| MPT 30B | 19. Dezember 2025 | Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe. |
| MPT 7B | 19. Dezember 2025 | Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe. |
Einstellungen für Foundation Model-Feinabstimmung
In der folgenden Tabelle sind ausgemusterte Modellfamilien, deren Deaktivierungsdaten und empfohlene Ersatzmodellfamilien zur Verwendung bei Foundation Model Fine-Tuning-Workloads aufgeführt. Databricks empfiehlt, Ihre Anwendungen vor dem angegebenen Einstellungsdatum zu migrieren, um Ersatzmodelle zu verwenden.
| Modellfamilie | Ruhestandsdatum | Empfohlene Ersatzmodellfamilie |
|---|---|---|
| DBRX | 30. April 2025 | Llama-3.1-70B |
| Mixtral | 30. April 2025 | Llama-3.1-70B |
| Mistral | 30. April 2025 | Llama-3.1-8B |
| Meta-Llama-3.1-405B | 30. Januar 2025 | Llama-3.1-70B |
| Meta-Llama-3 | 7. Januar 2025 | Meta-Llama-3.1 |
| Meta-Llama-2 | 7. Januar 2025 | Meta-Llama-3.1 |
| Code Llama | 7. Januar 2025 | Meta-Llama-3.1 |
Suchen nach Arbeitslasten, die eingestellte Modelle verwenden
Verwenden Sie die folgende Abfrage, um Arbeitslasten zu finden, die veraltete Modelle verwenden und deren Besitzer identifizieren.
SELECT
eu.requester,
se.endpoint_name,
se.entity_name,
COUNT(*) AS request_count,
SUM(eu.input_token_count) AS total_input_tokens,
SUM(eu.output_token_count) AS total_output_tokens,
MIN(eu.request_time) AS first_request,
MAX(eu.request_time) AS last_request
FROM system.serving.endpoint_usage eu
JOIN system.serving.served_entities se
ON eu.served_entity_id = se.served_entity_id
WHERE LOWER(se.entity_name) LIKE '%<retired-model-name>%'
GROUP BY eu.requester, se.endpoint_name, se.entity_name
ORDER BY request_count DESC