Entwurf für erneutes Training
Wenn Sie Ihr Modell für die Produktion in einer MLOps-Lösung (Machine Learning Operations) vorbereiten, müssen Sie einen Entwurf für ein erneutes Training erstellen.
Im Allgemeinen gibt es zwei Ansätze, wenn Sie ein Modell erneut trainieren möchten:
- Basierend auf einem Zeitplan: Wenn Sie wissen, dass Sie immer die neueste Version des Modells benötigen, können Sie entscheiden, Ihr Modell basierend auf einem Zeitplan jede Woche oder jeden Monat erneut zu trainieren.
- Basierend auf Metriken: Wenn Sie Ihr Modell nur bei Bedarf erneut trainieren möchten, können Sie Leistung und Datendrift des Modells überwachen, um zu entscheiden, wann Sie das Modell erneut trainieren müssen.
In beiden Fällen müssen Sie einen Entwurf für ein erneutes Training erstellen. Um Ihr Modell einfach neu zu trainieren, sollten Sie Ihren Code für die Automatisierung vorbereiten.
Vorbereiten Ihres Codes
Im Idealfall sollten Sie Modelle mit Skripts anstelle von Notebooks trainieren. Skripts eignen sich besser für die Automatisierung. Sie können einem Skript Parameter hinzufügen und Eingabeparameter wie die Trainingsdaten oder Hyperparameterwerte ändern. Wenn Sie Ihre Skripts parametrisieren, können Sie das Modell bei Bedarf problemlos mit neuen Daten trainieren.
Ein weiterer wichtiger Punkt bei der Vorbereitung Ihres Codes ist das Hosten des Codes in einem zentralen Repository. Ein Repository ist der Ort, an dem alle relevanten Dateien eines Softwareprojekts gespeichert werden. Für Machine Learning-Projekte sind Repositorys auf Git-Basis ideal für die Quellcodeverwaltung.
Wenn Sie die Quellcodeverwaltung auf Ihr Projekt anwenden, können Sie problemlos an einem Projekt zusammenarbeiten. Sie können jemanden zuweisen, der das Modell durch Aktualisieren des Codes verbessern soll. Sie können frühere Änderungen anzeigen und überprüfen, bevor sie in das Hauptrepository committet werden.
Automatisieren Ihres Codes
Wenn Sie Ihren Code automatisch ausführen möchten, können Sie Azure Machine Learning-Aufträge zum Ausführen von Skripts konfigurieren. In Azure Machine Learning können Sie auch Pipelines erstellen und planen, um Skripts auszuführen.
Wenn Skripts basierend auf Triggern oder Ereignissen, die außerhalb von Azure Machine Learning stattfinden, ausgeführt werden sollen, können Sie den Azure Machine Learning-Auftrag über ein anderes Tool auslösen.
Zwei Tools, die häufig in MLOps-Projekten verwendet werden, sind Azure DevOps und GitHub (Actions). Mit beiden Tools können Sie Automatisierungspipelines erstellen und Azure Machine Learning-Pipelines auslösen.
Als wissenschaftliche Fachkraft für Daten ziehen Sie es vielleicht vor, mit dem Azure Machine Learning Python SDK zu arbeiten. Wenn Sie jedoch mit Tools wie Azure DevOps und GitHub arbeiten, sollten Sie stattdessen die erforderlichen Ressourcen und Aufträge mit der Azure Machine Learning CLI-Erweiterung konfigurieren. Die Azure CLI ist für die Automatisierung von Aufgaben konzipiert und mit Azure DevOps und GitHub möglicherweise einfacher zu verwenden.
Tipp
Wenn Sie mehr über MLOps erfahren möchten, lesen Sie die Einführung in Machine Learning-Vorgänge (MLOps), oder versuchen Sie, Ihre erste MLOps-Automatisierungspipeline mit GitHub Actions zu erstellen.