Wartungsrichtlinie für generative KI-Modelle

In diesem Artikel wird die Modellwartungsrichtlinie für die Foundation-Modell-APIs pay-per-token, Foundation Model APIs bereitgestellter Durchsatz und Foundation Model Fine-Tuning-Angebote beschrieben.

Um weiterhin die modernsten Modelle zu unterstützen, kann Databricks unterstützte Modelle aktualisieren oder ältere Modelle für diese Angebote zurückziehen.

Modellrichtlinie für den Ruhestand

In der Modelleinstellungsrichtlinie wird erläutert, wie Databricks Sie benachrichtigt, wenn ein unterstütztes Modell für den Ruhestand festgelegt wird, was während des Übergangszeitraums geschieht und was sie am Rententermin erwarten müssen. Zeitachsen unterscheiden sich je nach Angebot und Modellkategorie, wie in den folgenden Abschnitten zusammengefasst.

Informationen zu derzeit eingestellten Modellen und geplanten Altersvorsorgeterminen finden Sie unter "Eingestellte Modelle". Partnermodelle finden Sie unter " Richtlinie zur Einstellung des Partnermodells".

Wichtig

Die Einstellungsrichtlinien, die für die Foundation Model-APIs pay-per-token und Foundation Model Fine-Tuning-Angebote gelten, wirken sich nur auf unterstützte Chat- und Abschlussmodelle aus.

APIs für Foundation-Modelle, Bezahlung pro Token

In der folgenden Tabelle wird die Einstellungsrichtlinie für Foundation-Modell-APIs mit Pay-per-Token zusammengefasst.

Ruhestandsbenachrichtigung Übergang zur Pensionierung Am Ruhestandsdatum
Databricks führt die folgenden Schritte aus, um Kunden über ein Modell zu informieren, das für den Ruhestand festgelegt ist:
  • Auf der Seite "Verarbeiten" Ihres Databricks-Arbeitsbereichs wird auf der Modellkarte eine Warnmeldung angezeigt, die angibt, dass das Modell für den Ruhestand geplant ist.
  • Die entsprechende Dokumentation enthält einen Hinweis, der darauf hinweist, dass das Modell auslaufen soll und ab welchem Datum es nicht mehr unterstützt wird.
Databricks wird das Modell in drei Monaten außer Betrieb nehmen. Während dieses dreimonatigen Zeitraums können Kunden:
  • Wählen Sie den Wechsel zu einem bereitgestellten Durchsatzendpunkt der Foundation-Model-APIs, um das Modell über sein End-of-Life-Datum hinaus weiter zu nutzen.
  • Migrieren Sie vorhandene Workflows, um empfohlene Ersatzmodelle zu verwenden.
Das Modell ist nicht mehr für die Verwendung verfügbar und wird aus dem Produkt entfernt. Die anwendbare Dokumentation wird aktualisiert, um die Verwendung eines Ersatzmodells zu empfehlen.

Basismodell-APIs mit bereitgestelltem Durchsatz

In der folgenden Tabelle wird die Richtlinie zur Außerdienststellung für Foundation Model-APIs mit bereitgestelltem Durchsatz zusammengefasst.

Ruhestandsbenachrichtigung Übergang zur Pensionierung Am Ruhestandsdatum
Databricks führt die folgenden Schritte aus, um Kunden über ein Modell zu informieren, das für den Ruhestand festgelegt ist:
  • Für Endpunkte, die ein veraltetes Modell bedienen, wird auf der Detailseite des Endpunkts in Ihrem Databricks-Arbeitsbereich eine Warnmeldung angezeigt. Diese Meldung gibt an, dass das Modell für den Ruhestand und den anwendbaren Ruhestandsdatum geplant ist.
  • Eine Tooltip-Nachricht bietet empfohlene alternative Modelle für die Migration von Workloads.
  • Die entsprechende Dokumentation enthält einen Hinweis, der darauf hinweist, dass das Modell auslaufen soll und ab welchem Datum es nicht mehr unterstützt wird.
Databricks wird das Modell in sechs Monaten eingestellt. Während dieses Zeitraums von sechs Monaten:
  • Kunden können weiterhin vorhandene bereitgestellte Durchsatzendpunkte mit dem veralteten Modell bis zum Deaktivierungsdatum ausführen.
  • Kunden, die ein veraltetes Modell nicht aktiv verwenden, können keine neuen Endpunkte mit berechnetem Durchsatz erstellen oder gestoppte Endpunkte für ein veraltetes Modell neu starten.
Das Modell ist nicht mehr für die Verwendung verfügbar und wird aus dem Produkt entfernt.
  • Alle Endpunkte, die das eingestellte Modell verwenden, werden mit einer beschreibenden Meldung in einen fehlerhaften Zustand umgestellt. Alle Anforderungen an diese Endpunkte schlagen fehl.
  • Der Kunde kann Endpunkte löschen, die das eingestellte Modell verwenden, aber nicht neu starten.
  • Die anwendbare Dokumentation wird aktualisiert, um die Verwendung eines Ersatzmodells zu empfehlen.

Richtlinie für die Einstellung des Partnermodells

Partnermodelle sind Modelle von Drittanbieterpartnern, insbesondere OpenAI, Anthropic und Google, die über Foundation Model-APIs verfügbar sind. Für diese Partnermodelle folgt Databricks im Allgemeinen den gleichen Zeitachsen und Richtlinien wie für bereitgestellte Durchsatz- und Pay-per-Token-Modelle beschrieben.

Die von Partnern bereitgestellten Altersvorsorgetermine können jedoch kürzer sein als die von Databricks veröffentlichten Übergangszeiträume. In diesen Fällen versucht Databricks, die Lücke zu überbrücken, indem modelle vorübergehend auf eine ähnliche Version umgeleitet werden, sodass Kunden die vollständige Übergangszeit erhalten.

Wenn z. B. ein Zahlungs-pro-Token-Modell mit der Vorlaufzeit eines Monats anstelle von drei angekündigt wird, leitet Databricks das Modell für weitere zwei Monate um, um sofortige Unterbrechungen zu verhindern und Zeit für die Migration zu ermöglichen. Abfragen schlagen am Ende des gesamten dreimonatigen Zeitraums fehl.

Note

Diese Umleitung kann nur auftreten, wenn das Ersatzmodell den gleichen Preis hat und abwärtskompatibel ist. Das Ersatzmodell ist in der Regel eine inkrementelle Modellversion, z. B. 3.0 im Vergleich zu 3.1.

Feinabstimmung von Foundation-Modellen

Die folgende Tabelle enthält eine Zusammenfassung der Einstellungsrichtlinie für die Feinabstimmung des Foundation-Modells.

Ruhestandsbenachrichtigung Übergang zur Pensionierung Am Ruhestandsdatum
Databricks führt die folgenden Schritte aus, um Kunden über ein Modell zu informieren, das für den Ruhestand festgelegt ist:
  • Auf der Registerkarte "Experimente " wird im Dropdownmenü für Foundation Model Fine-Tuning eine Warnmeldung angezeigt, die angibt, dass das Modell für den Ruhestand geplant ist.
  • Die entsprechende Dokumentation enthält einen Hinweis, der darauf hinweist, dass das Modell auslaufen soll und ab welchem Datum es nicht mehr unterstützt wird.
Databricks zieht das Modell in drei Monaten zurück. Während dieses dreimonatigen Zeitraums können Kunden vorhandene Workflows migrieren, um empfohlene Ersatzmodelle zu verwenden. Das Modell ist nicht mehr für die Verwendung verfügbar und wird aus dem Produkt entfernt. Die anwendbare Dokumentation wird aktualisiert, um die Verwendung eines Ersatzmodells zu empfehlen.

Modellupdates

Databricks liefern möglicherweise inkrementelle Modellupdates, um Optimierungen bereitzustellen. Wenn ein Modell aktualisiert wird, bleibt die Endpunkt-URL gleich, aber die Modell-ID im Antwortobjekt ändert sich, um das Datum der Aktualisierung widerzuspiegeln. Wenn beispielsweise ein Update am 3.4.2024 an meta-llama/Meta-Llama-3.3-70B ausgeliefert wird, wird der Modellname im Antwortobjekt auf meta-llama/Meta-Llama-3.3-70B-030424aktualisiert. Databricks verwaltet einen Versionsverlauf der Updates, auf die Sie verweisen können.

Zurückgezogene Modelle

In den folgenden Abschnitten werden die aktuellen und bevorstehenden Modellausfälle für die angegebenen Featureangebote zusammengefasst.

Einstellungen für Foundation Model-APIs mit tokenbasierter Bezahlung

Die folgende Tabelle zeigt Modelleinstellungen sowie ihre Einstellungstermine und die empfohlenen Ersatzmodelle für die Verwendung mit Workloads für Foundation Model-APIs mit tokenbasierter Bezahlung. Databricks empfiehlt, Ihre Anwendungen vor dem angegebenen Einstellungsdatum zu migrieren, um Ersatzmodelle zu verwenden.

Partnermodell Ruhestandsdatum Empfohlenes Ersatzmodell
Anthropic Claude 3.7 Sonnet 12. April 2026 Verwenden des neuesten Claude Sonnet-Modells
Offenes Modell Ruhestandsdatum Empfohlenes Ersatzmodell
Meta Llama 3.1 405B 15. Februar 2026 OpenAI GPT OSS 120B
DBRX-Anweisung 30. April 2025 Meta-Llama-4-Maverick
Mixtral-8x7B-Anweisung 30. April 2025 Meta-Llama-4-Maverick
Meta-Llama-3.1-70B-Instruct 11. Dezember 2024 Meta-Llama-4-Maverick
Meta-Llama-3-70B-Instruct 23. Juli 2024 Meta-Llama-4-Maverick
Meta-Llama-2-70B-Chat 30. Oktober 2024 Meta-Llama-4-Maverick
MPT 7B-Anweisung 30. August 2024 Meta-Llama-4-Maverick
MPT 30B-Instruktion 30. August 2024 Meta-Llama-4-Maverick

Wenn Sie langfristige Unterstützung für eine bestimmte Modellversion benötigen, empfiehlt Databricks die Verwendung des bereitgestellten Durchsatzes von Foundation Model-APIs für Ihre Bereitstellungsworkloads.

Bereitgestellte Foundation-Modell-APIs für Durchsatzrücksetzungen

In der folgenden Tabelle sind Modellfamilien, deren Ausmusterungsdaten und empfohlene Ersatzmodelle aufgeführt, die zur Verwendung mit Foundation Model-APIs vorgesehen sind und den bereitgestellten Durchsatz bedienen können. Databricks empfiehlt, Ihre Anwendungen vor dem angegebenen Einstellungsdatum zu migrieren, um Ersatzmodelle zu verwenden.

Partnermodell Ruhestandsdatum Empfohlenes Ersatzmodell
Gemini 3 Pro 26. März 2026 Gemini 3.1 Pro. Um mehr Zeit für die Migration zu ermöglichen, werden api-Aufrufe von Gemini 3.1 Pro zwischen dem 26. März 2026 und dem 7. Juni 2026 vorübergehend an Gemini 3.1 Pro umgeleitet. Die Preise für beide Modelle sind identisch.
Offene Modellfamilie Ruhestandsdatum Empfohlenes Ersatzmodell
Meta Llama 3.1 405B 15. Mai 2026 OpenAI GPT OSS 120B
Meta Llama 3 70B 27. Februar 2026 Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe.
Meta Llama 3 8B 27. Februar 2026 Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe.
Meta Llama 2 70B 27. Februar 2026 Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe.
Meta Llama 2 13B 27. Februar 2026 Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe.
Meta Llama 2 7B 27. Februar 2026 Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe.
Mixtral 8x7B 27. Februar 2026 Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe.
Mistral 7B 27. Februar 2026 Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe.
DBRX 19. Dezember 2025 Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe.
MPT 30B 19. Dezember 2025 Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe.
MPT 7B 19. Dezember 2025 Vergleichbares Modell innerhalb derselben Angebotspalette, wie das Llama 3.2-, 3.3- oder 4-Modell mit ähnlicher Größe.

Einstellungen für Foundation Model-Feinabstimmung

In der folgenden Tabelle sind ausgemusterte Modellfamilien, deren Deaktivierungsdaten und empfohlene Ersatzmodellfamilien zur Verwendung bei Foundation Model Fine-Tuning-Workloads aufgeführt. Databricks empfiehlt, Ihre Anwendungen vor dem angegebenen Einstellungsdatum zu migrieren, um Ersatzmodelle zu verwenden.

Modellfamilie Ruhestandsdatum Empfohlene Ersatzmodellfamilie
DBRX 30. April 2025 Llama-3.1-70B
Mixtral 30. April 2025 Llama-3.1-70B
Mistral 30. April 2025 Llama-3.1-8B
Meta-Llama-3.1-405B 30. Januar 2025 Llama-3.1-70B
Meta-Llama-3 7. Januar 2025 Meta-Llama-3.1
Meta-Llama-2 7. Januar 2025 Meta-Llama-3.1
Code Llama 7. Januar 2025 Meta-Llama-3.1

Suchen nach Arbeitslasten, die eingestellte Modelle verwenden

Verwenden Sie die folgende Abfrage, um Arbeitslasten zu finden, die veraltete Modelle verwenden und deren Besitzer identifizieren.

SELECT
   eu.requester,
   se.endpoint_name,
   se.entity_name,
   COUNT(*) AS request_count,
   SUM(eu.input_token_count) AS total_input_tokens,
   SUM(eu.output_token_count) AS total_output_tokens,
   MIN(eu.request_time) AS first_request,
   MAX(eu.request_time) AS last_request
 FROM system.serving.endpoint_usage eu
 JOIN system.serving.served_entities se
   ON eu.served_entity_id = se.served_entity_id
 WHERE LOWER(se.entity_name) LIKE '%<retired-model-name>%'
 GROUP BY eu.requester, se.endpoint_name, se.entity_name
 ORDER BY request_count DESC