Migrieren zum serverlosen Echtzeitrückschluss

Wichtig

  • Diese Dokumentation wurde eingestellt und wird unter Umständen nicht aktualisiert. Die in diesem Inhalt erwähnten Produkte, Dienste oder Technologien werden nicht mehr unterstützt.
  • Die Anleitung in diesem Artikel gilt für die Vorschauversion der Modellbereitstellungsfunktion, ehemals Serverless Real-Time Inference. Databricks empfiehlt, Ihr Modell zur Bereitstellung von Workflows auf die allgemein verfügbare Funktionalität zu migrieren. Weitere Informationen finden Sie unter Modellbereitstellung mit Azure Databricks.

Wichtig

Dieses Feature befindet sich in der Public Preview.

Dieser Artikel zeigt, wie Sie den serverlosen Echtzeitrückschluss in Ihrem Arbeitsbereich aktivieren und Ihre Modelle von der Legacy-MLflow-Modellbereitstellung auf die Modellbereitstellung mit serverlosem Echtzeitrückschluss umstellen.

Allgemeine Informationen zur serverlosen Echtzeit-Inferenz finden Sie unter Modellbereitstellung mit serverloser Echtzeit-Inferenz.

Anforderungen

  • Registriertes Modell in der MLflow-Modellregistrierung.
  • Berechtigungen zum Erstellen von Clustern in Ihrem Arbeitsbereich. Siehe Verwalten von Berechtigungen.
  • KANN PRODUKTIONSVERSIONEN VERWALTEN-Berechtigungen für die Produktionsversion des registrierten Modells. Siehe MLFlow-Modell ACLs.

Wichtige Änderungen

  • In serverloser Echtzeit-Inferenz unterscheiden sich das Format der Anforderung an den Endpunkt und die Antwort des Endpunkts geringfügig von der Legacy-MLflow-Modellbereitstellung. Einzelheiten zum neuen Formatprotokoll finden Sie unter Scoring eines Modellendpunkts.
  • In serverloser Echtzeit-Inferenz enthält die Endpunkt-URL model-endpoint anstelle von model
  • Serverloser Echtzeit-Inferenz bietet volle Unterstützung für die Verwaltung von Ressourcen mit API-Workflows und ist produktionsbereit.

Aktivieren des serverlosen Echtzeitrückschlusses für Ihren Arbeitsbereich

Wichtig

Serverloser Echtzeitrückschluss muss für Ihren Arbeitsbereich aktiviert sein. Wenn die Funktion zum ersten Mal für den Arbeitsbereich aktiviert wird, muss der Arbeitsbereichsadministrator die Nutzungsbedingungen lesen und akzeptieren.

Aktivieren des serverlosen Echtzeitrückschlusses für Ihren Arbeitsbereich:

  1. Registrieren Sie sich für die Vorschauversion.
    1. Wenden Sie sich an Ihr Azure Databricks-Kontoteam, um die Teilnahme an der öffentlichen Vorschau der Serverless Real-Time Inference anzufordern.
    2. Databricks sendet Ihnen ein Google-Formular.
    3. Füllen Sie das Formular aus, und senden Sie es an Databricks. Das Formular enthält Informationen darüber, welcher Arbeitsbereich zu registrieren ist.
    4. Warten Sie, bis Databricks Sie benachrichtigt, dass Ihr Arbeitsbereich in der Vorschau registriert ist.
  2. Greifen Sie als Arbeitsbereichsadministrator auf die Seite Admin Einstellungen zu.
  3. Wählen Sie Arbeitsbereichseinstellungen aus.
  4. Wählen Sie Aktivieren von serverlosem Echtzeitrückschluss mit MLflow aus.

Deaktivieren der Legacy-MLflow-Modellbereitstellung für Ihre Modelle

Bevor Sie den serverlosen Echtzeitrückschluss für Ihre Modelle aktivieren können, müssen Sie die Legacy-MLflow-Modellbereitstellung für Ihre derzeit bereitgestellten Modelle deaktivieren.

Die folgenden Schritte zeigen, wie Sie dies mit der Benutzeroberfläche ausführen.

  1. Navigieren Sie zu auf der Seitenleiste Ihres Machine Learning-Arbeitsbereichs zu Modelle.
  2. Wählen Sie das Modell aus, für das Sie die Legacy-MLflow-Modellbereitstellung deaktivieren möchten.
  3. Wählen Sie auf der Registerkarte Bereitstellung" die Option Beenden aus.
  4. Eine Bestätigungsmeldung wird angezeigt. Wählen Sie Bereitstellung beenden aus.

Aktivieren des serverlosen Echtzeitrückschlusses für Ihre Modelle

Sobald der serverlose Echtzeitrückschluss in Ihrem Arbeitsbereich aktiviert ist, sehen Sie auf der Registerkarte Bereitstellung Ihrer registrierten Modelle den folgenden Bildschirm. Zum Aktivieren des serverlosen Echtzeitrückschlusses für dieses Modell klicken Sie auf die Schaltfläche Serverlosen Echtzeitrückschluss aktivieren.

Bereitstellungsbereich

Wichtig

Wenn diese Schaltfläche nicht angezeigt wird, stattdessen aber die Schaltfläche Bereitstellung aktivieren zu sehen ist, verwenden Sie Endpunkte für die Legacy-MLflow-Modellbereitstellung, keine Endpunkte für serverlose Modelle. Wenden Sie sich an einen Arbeitsbereichsadministrator, um die Funktion in diesem Arbeitsbereich zu aktivieren.

Zusätzliche Ressourcen