Freigeben über


Upgraden von ML-Workflows auf Zielmodelle in Unity Catalog

In diesem Artikel wird erläutert, wie Sie Databricks-Workflows so migrieren und aktualisieren, dass sie Zielmodelle in Unity Catalog verwenden.

Anforderungen

Erforderliche Privilegien

Zum Ausführen eines Modellschulungs-, Bereitstellungs- oder Rückschlussworkflows in Unity Catalog muss der Prinzipal, der den Workflow ausführt, über die Berechtigungen USE CATALOG und USE SCHEMA für den Katalog und das Schema verfügen, die das Modell enthalten.

Die folgenden Berechtigungen sind ebenfalls erforderlich:

  • Zum Erstellen eines Modells muss der Prinzipal über die Berechtigung CREATE MODEL verfügen.
  • Zum Laden oder Bereitstellen eines Modells muss der Prinzipal über die Berechtigung EXECUTE für das registrierte Modell verfügen.

Nur der Besitzer eines registrierten Modells kann:

  • Eine neue Modellversion erstellen.
  • Einen Alias für ein registriertes Modell festlegen.

Computeanforderungen

Die für den Workflow angegebene Computeressource muss Zugriff auf Unity Catalog haben. Weitere Informationen finden Sie unter Zugriffsmodi.

Erstellen paralleler Trainings-, Bereitstellungs- und Rückschlussworkflows

Um Modelltrainings- und Rückschlussworkflows auf Unity Catalog zu aktualisieren, empfiehlt Databricks einen inkrementellen Ansatz, bei dem Sie eine Pipeline für paralleles Training, Bereitstellung und Rückschluss erstellen, die Modelle in Unity Catalog nutzt. Wenn Sie mit den Ergebnissen bei Verwendung von Unity Catalog zufrieden sind, können Sie Downstreamconsumer auf das Lesen der Batchrückschlussausgabe umstellen oder den an Modelle in Unity Catalog weitergeleiteten Datenverkehr in Bereitstellungsendpunkten erhöhen.

Modelltrainingsworkflow

Klonen Sie Ihren Modelltrainingsworkflow. Vergewissern Sie sich, dass der Prinzipal, der den Workflow ausführt, und der für den Workflow angegebene Compute die Anforderungen erfüllen.

Ändern Sie als Nächstes den Modelltrainingscode im geklonten Workflow. Möglicherweise müssen Sie das vom Workflow ausgeführte Notebook klonen oder einen neuen Git-Branch im geklonten Workflow erstellen und als Ziel festlegen. Führen Sie diese Schritte aus, um die erforderliche Version von MLflow zu installieren und den Client mit Unity Catalog als Ziel in Ihrem Trainingscode zu konfigurieren. Aktualisieren Sie dann den Modelltrainingscode, um Modelle bei Unity Catalog zu registrieren. Siehe Trainieren und Registrieren von Unity Catalog-kompatiblen Modellen.

Modellbereitstellungsworkflow

Klonen Sie Ihren Modellbereitstellungsworkflow. Vergewissern Sie sich, dass der Prinzipal, der den Workflow ausführt, und der für den Workflow angegebene Compute die Anforderungen erfüllen.

Wenn Sie über eine Modellüberprüfungslogik in Ihrem Bereitstellungsworkflow verfügen, aktualisieren Sie sie, um Modellversionen aus UC zu laden. Verwenden Sie Aliase, um Rollouts von Produktionsmodellen zu verwalten.

Modellrückschlussworkflow

Batchrückschlussworkflow

Klonen Sie den Batchrückschlussworkflow. Vergewissern Sie sich, dass der Prinzipal, der den Workflow ausführt, und der für den Workflow angegebene Compute die Anforderungen erfüllen.

Modellbereitstellungsworkflow

Wenn Sie Mosaic AI Model Serving verwenden, müssen Sie Ihren vorhandenen Endpunkt nicht klonen. Nutzen Sie stattdessen das Feature zur Datenverkehrsaufteilung, um mit der Weiterleitung eines kleinen Teils des Datenverkehrs an Modelle in Unity Catalog zu beginnen. Erhöhen Sie beim Überprüfen der Ergebnisse mit Unity Catalog den Umfang des Datenverkehrs, bis der gesamte Datenverkehr umgeleitet wird.

Höherstufen eines Modell in mehreren Umgebungen

Das umgebungsübergreifende Höherstufen eines Modells funktioniert bei Modellen in Unity Catalog anders. Weitere Einzelheiten finden Sie unter Höherstufen eines Modell in mehreren Umgebungen.

Verwenden von Auftragswebhooks zur manuellen Genehmigung für die Modellimplementierung

Databricks empfiehlt, die ModellImplemented. nach Möglichkeit vollständig zu automatisieren und während des Modellimplementierungsprozesses geeignete Überprüfungen und Tests zu verwenden. Wenn Sie jedoch manuelle Genehmigungen für die Bereitstellung von Produktionsmodellen durchführen müssen, können Sie Auftragsbenachrichtigungen verwenden, um externe CI/CD-Systeme aufzurufen und eine manuelle Genehmigung für die Bereitstellung eines Modells anzufordern, nachdem Ihr Modelltrainingsauftrag erfolgreich abgeschlossen wurde. Nach der manuellen Genehmigung kann Ihr CI/CD-System die Modellversion bereitstellen, um Datenverkehr zu verarbeiten, z. B. durch Festlegen des Alias „Champion“.