Machine Learning-Vorgänge

2025-04-30

In diesem Artikel werden drei Azure-Architekturen für Machine Learning- Operations beschrieben, die durchgängige fortlaufende Integration und CI/CD-Pipelines (Continuous Delivery) und Umschulungspipelinen aufweisen. Die Architekturen sind für diese KI-Anwendungen:

Klassisches maschinelles Lernen
Maschinelles Sehen (Computer Vision, CV)
Verarbeitung natürlicher Sprache

Diese Architekturen sind das Produkt des MLOps v2-Projekts. Sie beinhalten bewährte Methoden, die Lösungsarchitekten im Entwicklungsprozess verschiedener Lösungen für maschinelles Lernen identifiziert haben. Das Ergebnis sind einsatzfähige, wiederholbare und wartbare Muster. Alle drei Architekturen verwenden den Azure Machine Learning-Dienst.

Eine Implementierung mit Beispielbereitstellungsvorlagen für MLOps v2 finden Sie unter Azure MLOps v2 GitHub-Repository.

Mögliche Anwendungsfälle

Klassisches maschinelles Lernen: Zeitreihenprognose, Regression und Klassifizierung in tabellarischen strukturierten Daten sind die häufigsten Anwendungsfälle in dieser Kategorie. Beispiele:
- Binäre und Multibeschriftungsklassifizierung.
- lineare, polynomiale, Ridge-, Lasso-, Quantil- und Bayessche Regression.
- ARIMA, autoregressiv, SARIMA, VAR, SES, LSTM.
CV: Das in diesem Artikel vorgestellte MLOps-Framework konzentriert sich hauptsächlich auf die CV-Anwendungsfälle der Segmentierung und Bildklassifizierung.
Verarbeitung natürlicher Sprachen: Sie können dieses MLOps-Framework verwenden, um Folgendes zu implementieren:
- Benannte Entitätserkennung
- Textklassifizierung
- Textgenerierung
- Stimmungsanalyse
- Sprachübersetzung
- Beantwortung von Fragen
- Zusammenfassung
- Satzerkennung
- Spracherkennung
- Part-of-Speech-Tagging

KI-Simulationen, Deep Reinforcement Learning und andere Formen der KI werden in diesem Artikel nicht beschrieben.

MLOps als wichtiger Entwurfsbereich für KI-Workloads

Die Planung und Implementierung von MLOps und GenAIOps sind entscheidende Entwurfsbereiche für KI-Workloads in Azure. Informationen dazu, warum diese Machine Learning-Workloads spezielle Vorgänge benötigen, finden Sie unter MLOps und GenAIOps für AI-Workloads in Azure im Azure Well-Architected Framework.

Aufbau

Das Architekturmuster MLOps v2 verfügt über vier hauptmodulare Komponenten oder Phasen des MLOps-Lebenszyklus:

Datenbestand
Verwaltung und Einrichtung
Modellentwicklung (auch innere Schleifenphase)
Modellimplementierung (auch äußere Schleifenphase)

Die vorhergehenden Komponenten, die Verbindungen zwischen ihnen und die typischen beteiligten Personas sind in allen MLOps v2-Szenarioarchitekturen Standard. Abweichungen in den Details der einzelnen Komponenten können je nach Szenario unterschiedlich sein.

Die Basisarchitektur für MLOps v2 für Machine Learning ist das klassische Machine Learning-Szenario für tabellarische Daten. Die CV- und NLP-Architekturen basieren auf dieser Basisarchitektur und ändern diese Basisarchitektur.

MLOps v2 behandelt die folgenden Architekturen, die in diesem Artikel beschrieben werden:

Klassische Machine Learning-Architektur
CV-Architektur für Machine Learning
Architektur der Verarbeitung natürlicher Sprache für maschinelles Lernen

Klassische Machine Learning-Architektur

Laden Sie eine Visio-Datei dieser Architektur herunter.

Workflow für die klassische Machine Learning-Architektur

Datenbestand

Diese Komponente veranschaulicht den Datenbestand der Organisation und potenzielle Datenquellen und -ziele für ein Data Science-Projekt. Datentechniker sind die primären Besitzer dieser Komponente des MLOps v2-Lebenszyklus. Die Azure-Datenplattformen in diesem Diagramm sind weder vollständig noch präskriptiv. Ein grünes Häkchen kennzeichnet die Datenquellen und -ziele, die empfohlene Best Practices darstellen, die auf dem Anwendungsfall des Kunden basieren.
Verwaltung und Einrichtung

Diese Komponente ist der erste Schritt in der MLOps v2-Lösungsbereitstellung. Es besteht aus allen Aufgaben im Zusammenhang mit der Erstellung und Verwaltung von Ressourcen und Rollen, die dem Projekt zugeordnet sind. Beispielsweise kann das Infrastrukturteam:
1. Projekt-Quellcode-Repositorys erstellen.
2. Verwenden Sie Bicep oder Terraform, um Machine Learning-Arbeitsbereiche zu erstellen.
3. Erstellen oder Ändern von Datasets und Computeressourcen für die Modellentwicklung und -bereitstellung.
4. Definieren von Projektteambenutzern, deren Rollen und Zugriffssteuerelementen für andere Ressourcen
5. Erstellen von CI/CD-Pipelines.
6. Erstellen Sie Überwachungskomponenten zum Sammeln und Erstellen von Warnungen für Modell- und Infrastrukturmetriken.
Die primäre Person, die mit dieser Phase in Verbindung steht, ist das Infrastrukturteam, aber eine Organisation kann auch Dateningenieure, Ingenieure für maschinelles Lernen oder Datenwissenschaftler haben.
Modellentwicklung (Phase des inneren Zyklus)

Die innere Schleifenphase besteht aus einem iterativen Data Science-Workflow, der innerhalb eines dedizierten und sicheren Machine Learning-Arbeitsbereichs fungiert. Das vorangehende Diagramm zeigt einen typischen Workflow. Der Prozess beginnt mit der Datenaufnahme, geht über explorative Datenanalyse, Experimente, Modellentwicklung und -bewertung und registriert dann ein Modell für den Produktionseinsatz. Diese modulare Komponente ist agnostisch und kann an den Prozess angepasst werden, den Ihr Data Science-Team zur Entwicklung von Modellen verwendet.

Personas, die dieser Phase zugeordnet sind, umfassen Datenwissenschaftler und Machine Learning-Techniker.
Machine Learning-Registrierungen

Nachdem das Data Science-Team ein Modell entwickelt hat, das es in der Produktion einsetzen kann, registriert es das Modell im Machine Learning-Arbeitsbereichsregister. CI-Pipelines, die entweder automatisch durch die Modellregistrierung oder durch die Genehmigung von Personen in der Schleife ausgelöst werden, fördern das Modell und alle anderen Modellabhängigkeiten an die Modellimplementierungsphase.

Personas, die dieser Phase zugeordnet sind, sind in der Regel Machine Learning-Techniker.
Modellimplementierung (äußere Schleifenphase)

Die Modellimplementierung oder äußere Schleifenphase besteht aus vorproduktivem Staging und Tests, der Produktionsbereitstellung und der Überwachung von Modell, Daten und Infrastruktur. Wenn das Modell die Kriterien der Organisation und des Anwendungsfalls erfüllt, fördern CD-Pipelines das Modell und die zugehörigen Assets durch Produktion, Überwachung und mögliche Neuschulung.

Personas, die dieser Phase zugeordnet sind, sind in erster Linie Machine Learning-Techniker.
Staging und Test

Die Staging- und Testphase variiert je nach Kundenpraxis. Diese Phase umfasst in der Regel Vorgänge wie das Retraining und Testen des Modellkandidaten auf Produktionsdaten, Testbereitstellungen zur Leistungsbewertung von Endpunkten, Datenqualitätsprüfungen, Komponententests und verantwortungsvolle KI-Prüfungen zur Erkennung von Verzerrungen im Modell und in den Daten. Diese Phase erfolgt in einem oder mehreren dedizierten und sicheren Machine Learning-Arbeitsbereichen.
Produktionsbereitstellung

Nachdem ein Modell die Staging- und Testphase durchlaufen hat, können Fachkräfte für Machine-Learning es mithilfe einer „Human-in-the-Loop“-Genehmigung in die Produktion überführen. Zu den Optionen für die Modellbereitstellung gehören ein verwalteter Batchendpunkt für Batchszenarien oder ein verwalteter Onlineendpunkt oder eine Kubernetes-Bereitstellung, die Azure Arc für Onlineszenarien nahezu in Echtzeit verwendet. Die Produktion erfolgt normalerweise in einem oder mehreren dedizierten und sicheren Machine-Learning-Arbeitsbereichen.
Überwachung

Ingenieure für maschinelles Lernen überwachen Komponenten in der Bereitstellung, beim Testen und in der Produktion, um Metriken im Zusammenhang mit Leistungsänderungen des Modells, der Daten und der Infrastruktur zu sammeln. Sie können diese Metriken verwenden, um Maßnahmen zu ergreifen. Modell- und Datenüberwachung können die Überprüfung auf Modell- und Datendrift, die Modellleistung für neue Daten und verantwortungsvolle KI-Probleme umfassen. Durch die Überwachung der Infrastruktur können langsame Endpunktreaktionen, unzureichende Rechenkapazität oder Netzwerkprobleme identifiziert werden.
Daten- und Modellüberwachung: Ereignisse und Aktionen

Basierend auf Modell- und Datenkriterien wie Metrikschwellenwerten oder Zeitplänen können automatisierte Auslöser und Benachrichtigungen entsprechende Maßnahmen implementieren. Beispielsweise könnte ein Trigger ein erneutes Training des Modells mit neuen Produktionsdaten auslösen und das Modell dann zum Zweck einer Präproduktionsauswertung per Loopback zum Staging und Testen zurückzuschicken. Oder ein Modell- oder Datenproblem könnte eine Aktion auslösen, die einen Loopback zur Modellentwicklungsphase erfordert, wo Datenwissenschaftler das Problem untersuchen und möglicherweise ein neues Modell entwickeln können.
Infrastrukturüberwachung: Ereignisse und Aktionen

Automatisierte Auslöser und Benachrichtigungen können entsprechende Maßnahmen basierend auf Infrastrukturkriterien implementieren, wie z. B. einer Verzögerung der Endpunktantwort oder unzureichender Rechenleistung für die Bereitstellung. Automatische Auslöser und Benachrichtigungen können einen Loopback zur Einrichtungs- und Verwaltungsphase auslösen, wo das Infrastrukturteam das Problem untersuchen und ggf. die Rechen- und Netzwerkressourcen neu konfigurieren kann.

CV-Architektur für Machine Learning

Laden Sie eine Visio-Datei dieser Architektur herunter.

Workflow für die CV-Architektur

Die CV-Architektur für Machine Learning basiert auf der klassischen Machine Learning-Architektur, beinhaltet jedoch Änderungen, die insbesondere für überwachte CV-Szenarien gelten.

Datenbestand

Diese Komponente demonstriert den Datenbestand der Organisation und potenzielle Datenquellen und -ziele für ein Data Science-Projekt. Datentechniker sind die primären Besitzer dieser Komponente im MLOps v2-Lebenszyklus. Die Azure-Datenplattformen in diesem Diagramm sind weder vollständig noch präskriptiv. Bilder für CV-Szenarien können aus verschiedenen Datenquellen stammen. Zur Steigerung der Effizienz bei der Entwicklung und Bereitstellung von CV-Modellen mit Machine Learning empfehlen wir Azure Blob Storage und Azure Data Lake Storage.
Verwaltung und Einrichtung

Diese Komponente ist der erste Schritt in der MLOps v2-Bereitstellung. Es besteht aus allen Aufgaben im Zusammenhang mit der Erstellung und Verwaltung von Ressourcen und Rollen, die dem Projekt zugeordnet sind. Für CV-Szenarien ist die Verwaltung und Einrichtung der MLOps v2-Umgebung weitgehend identisch mit klassischem maschinellem Lernen, umfasst aber einen zusätzlichen Schritt. Das Infrastrukturteam verwendet das Bezeichnungsfeature von Machine Learning oder ein anderes Tool zum Erstellen von Bildbezeichnungen und Anmerkungsprojekten.
Modellentwicklung (Phase des inneren Zyklus)

Die innere Schleifenphase besteht aus einem iterativen Data Science-Workflow, der innerhalb eines dedizierten und sicheren Arbeitsbereichs für maschinelles Lernen ausgeführt wird. Der Hauptunterschied zwischen diesem Workflow und dem klassischen Machine Learning-Szenario besteht darin, dass die Bildbezeichnung und Anmerkung eine wichtige Komponente dieser Entwicklungsschleife ist.
Machine Learning-Registrierungen

Nachdem das Data Science-Team ein Modell entwickelt hat, das es in der Produktion einsetzen kann, registriert es das Modell im Machine Learning-Arbeitsbereichsregister. CI-Pipelines, die automatisch durch die Modellregistrierung oder durch die Genehmigung von Menschen in der Schleife ausgelöst werden, fördern das Modell und alle anderen Modellabhängigkeiten an die Modellimplementierungsphase.
Modellimplementierung (äußere Schleifenphase)

Die Modellimplementierung oder äußere Schleifenphase besteht aus vorproduktivem Staging und Tests, der Produktionsbereitstellung und der Überwachung von Modell, Daten und Infrastruktur. Wenn das Modell die Kriterien der Organisation und des Anwendungsfalls erfüllt, fördern CD-Pipelines das Modell und die zugehörigen Assets durch Produktion, Überwachung und mögliche Neuschulung.
Staging und Test

Die Staging- und Testphase variiert je nach Kundenpraxis. Diese Phase umfasst in der Regel Vorgänge wie Testbereitstellungen zur Bewertung der Endpoint-Leistung, Datenqualitätsprüfungen, Komponententests und verantwortungsbewusste KI-Prüfungen auf Modell- und Datenverzerrungen. Bei CV-Szenarien müssen Machine Learning-Ingenieure den Modellkandidaten aufgrund von Ressourcen- und Zeitbeschränkungen nicht mit Produktionsdaten neu trainieren. Das Data Science-Team kann stattdessen Produktionsdaten für die Modellentwicklung verwenden. Das aus der Entwicklungsschleife registrierte Kandidatenmodell wird für die Produktion ausgewertet. Diese Phase erfolgt in einem oder mehreren dedizierten und sicheren Machine Learning-Arbeitsbereichen.
Produktionsbereitstellung

Nachdem ein Modell die Staging- und Testphase durchlaufen hat, können Fachkräfte für Machine-Learning es mithilfe einer „Human-in-the-Loop“-Genehmigung in die Produktion überführen. Zu den Optionen für die Modellbereitstellung gehören ein verwalteter Batchendpunkt für Batchszenarien oder ein verwalteter Onlineendpunkt oder eine Kubernetes-Bereitstellung, die Azure Arc für Onlineszenarien nahezu in Echtzeit verwendet. Die Produktion erfolgt normalerweise in einem oder mehreren dedizierten und sicheren Machine-Learning-Arbeitsbereichen.
Überwachung

Ingenieure für maschinelles Lernen überwachen Komponenten in der Bereitstellung, beim Testen und in der Produktion, um Metriken im Zusammenhang mit Leistungsänderungen des Modells, der Daten und der Infrastruktur zu sammeln. Sie können diese Metriken verwenden, um Maßnahmen zu ergreifen. Modell- und Datenüberwachung kann die Überprüfung der Modellleistung auf neuen Bildern umfassen. Durch die Überwachung der Infrastruktur können langsame Endpunktreaktionen, unzureichende Rechenkapazität oder Netzwerkprobleme identifiziert werden.
Daten- und Modellüberwachung: Ereignisse und Aktionen

Die Daten- und Modellüberwachung und Ereignis- und Aktionsphasen von MLOps für linguistische Datenverarbeitung sind die wichtigsten Unterschiede zum klassischen maschinellen Lernen. Das automatisierte erneute Training erfolgt in der Regel nicht in CV-Szenarien, wenn eine Verschlechterung der Modellleistung bei neuen Bildern erkannt wird. In diesem Fall ist ein Human-in-the-Loop-Prozess erforderlich, um neue Bilder für das Modell mit schlechter Leistung zu überprüfen und zu kommentieren. Die nächste Aktion geht häufig zurück zur Modellentwicklungsschleife, um das Modell mit den neuen Bildern zu aktualisieren.
Infrastrukturüberwachung: Ereignisse und Aktionen

Automatisierte Auslöser und Benachrichtigungen können entsprechende Maßnahmen basierend auf Infrastrukturkriterien implementieren, wie z. B. einer Verzögerung der Endpunktantwort oder unzureichender Rechenleistung für die Bereitstellung. Automatische Auslöser und Benachrichtigungen können einen Loopback zur Setup- und Administrationsphase auslösen, wo das Infrastrukturteam das Problem untersuchen und ggf. die Umgebung sowie die Rechen- und Netzwerkressourcen neu konfigurieren kann.

Architektur der Verarbeitung natürlicher Sprache für maschinelles Lernen

Laden Sie eine Visio-Datei dieser Architektur herunter.

Workflow für die Architektur der linguistischen Datenverarbeitung.

Die Architektur der linguistischen Datenverarbeitung beim maschinellen Lernen basiert auf der klassischen Architektur des maschinellen Lernens, weist jedoch einige für NLP-Szenarien spezifische Modifikationen auf.

Datenbestand

Diese Komponente demonstriert den Datenbestand der Organisation und potenzielle Datenquellen und -ziele für ein Data Science-Projekt. Datentechniker sind die primären Besitzer dieser Komponente im MLOps v2-Lebenszyklus. Die Azure-Datenplattformen in diesem Diagramm sind weder vollständig noch präskriptiv. Ein grünes Häkchen kennzeichnet Quellen und Ziele, die empfohlene Best Practices darstellen, die auf dem Anwendungsfall des Kunden basieren.
Verwaltung und Einrichtung

Diese Komponente ist der erste Schritt in der MLOps v2-Bereitstellung. Es besteht aus allen Aufgaben im Zusammenhang mit der Erstellung und Verwaltung von Ressourcen und Rollen, die dem Projekt zugeordnet sind. Für Szenarien zur Verarbeitung natürlicher Sprache ist die Verwaltung und Einrichtung der MLOps v2-Umgebung weitgehend identisch mit der für klassisches Machine Learning, jedoch mit einem zusätzlichen Schritt: Erstellen Sie Textbeschriftungs- und Anmerkungsprojekte mithilfe der Bezeichnungsfunktion von Machine Learning oder einem anderen Tool.
Modellentwicklung (Phase des inneren Zyklus)

Die innere Schleifenphase besteht aus einem iterativen Data Science-Workflow, der innerhalb eines dedizierten und sicheren Arbeitsbereichs für maschinelles Lernen ausgeführt wird. Die typische NLP-Modellentwicklungsschleife unterscheidet sich vom klassischen Szenario des maschinellen Lernens darin, dass die typischen Entwicklungsschritte für dieses Szenario Annotatoren für Sätze sowie Tokenisierung, Normalisierung und Einbettungen für Textdaten umfassen.
Machine Learning-Registrierungen

Nachdem das Data Science-Team ein Modell entwickelt hat, das es in der Produktion einsetzen kann, registriert es das Modell im Machine Learning-Arbeitsbereichsregister. CI-Pipelines, die automatisch durch die Modellregistrierung oder durch die Genehmigung von Menschen in der Schleife ausgelöst werden, fördern das Modell und alle anderen Modellabhängigkeiten an die Modellimplementierungsphase.
Modellimplementierung (äußere Schleifenphase)

Die Modellimplementierung oder äußere Schleifenphase besteht aus vorproduktivem Staging und Tests, der Produktionsbereitstellung und der Überwachung von Modell, Daten und Infrastruktur. Wenn das Modell die Kriterien der Organisation und des Anwendungsfalls erfüllt, fördern CD-Pipelines das Modell und die zugehörigen Assets durch Produktion, Überwachung und mögliche Neuschulung.
Staging und Test

Die Staging- und Testphase variiert je nach Kundenpraxis. Diese Phase umfasst in der Regel Vorgänge wie das Retraining und Testen des Modellkandidaten auf Produktionsdaten, Testbereitstellungen zur Leistungsbewertung von Endpunkten, Datenqualitätsprüfungen, Komponententests und verantwortungsvolle KI-Prüfungen zur Erkennung von Verzerrungen im Modell und in den Daten. Diese Phase erfolgt in einem oder mehreren dedizierten und sicheren Machine Learning-Arbeitsbereichen.
Produktionsbereitstellung

Nachdem ein Modell die Staging- und Testphase durchlaufen hat, können Fachkräfte für Machine-Learning es mithilfe einer „Human-in-the-Loop“-Genehmigung in die Produktion überführen. Zu den Optionen für die Modellbereitstellung gehören ein verwalteter Batchendpunkt für Batchszenarien oder ein verwalteter Onlineendpunkt oder eine Kubernetes-Bereitstellung, die Azure Arc für Onlineszenarien nahezu in Echtzeit verwendet. Die Produktion erfolgt normalerweise in einem oder mehreren dedizierten und sicheren Machine-Learning-Arbeitsbereichen.
Überwachung

Ingenieure für maschinelles Lernen überwachen Komponenten in der Bereitstellung, beim Testen und in der Produktion, um Metriken im Zusammenhang mit Leistungsänderungen des Modells, der Daten und der Infrastruktur zu sammeln. Sie können diese Metriken verwenden, um Maßnahmen zu ergreifen. Überwachung von Modellen und Daten kann die Überprüfung auf Modell- und Datendrift, die Modellleistung bei neuen Textdaten und Probleme verantwortungsvollen Umgangs mit KI umfassen. Die Infrastrukturüberwachung kann Probleme wie langsame Endpunktantworten, unzureichende Berechnungskapazität oder Netzwerkprobleme identifizieren.
Daten- und Modellüberwachung: Ereignisse und Aktionen

Wie in der CV-Architektur sind die Daten- und Modellüberwachung und Ereignis- und Aktionsphasen von MLOps für linguistische Datenverarbeitung die wichtigsten Unterschiede zum klassischem maschinellem Lernen. Die automatisierte Neuschulung erfolgt in der Regel nicht in Szenarien der Verarbeitung natürlicher Sprache, wenn die Leistungsverschlechterung des Modells bei neuem Text erkannt wird. In diesem Fall ist ein Human-in-the-Loop-Prozess erforderlich, um neue Textdaten für das Modell mit schlechter Leistung zu überprüfen und zu kommentieren. Häufig besteht die nächste Aktion darin, zur Modellentwicklungsschleife zurückzukehren, um das Modell mit den neuen Textdaten zu aktualisieren.
Infrastrukturüberwachung: Ereignisse und Aktionen

Automatisierte Auslöser und Benachrichtigungen können entsprechende Maßnahmen basierend auf Infrastrukturkriterien implementieren, wie z. B. einer Verzögerung der Endpunktantwort oder unzureichender Rechenleistung für die Bereitstellung. Automatische Auslöser und Benachrichtigungen können einen Loopback zur Einrichtungs- und Verwaltungsphase auslösen, wo das Infrastrukturteam das Problem untersuchen und ggf. die Rechen- und Netzwerkressourcen neu konfigurieren kann.

Komponenten

Machine Learning ist ein Cloud-Dienst, mit dem Sie Machine-Learning-Modelle im großen Maßstab trainieren, bewerten, bereitstellen und verwalten können.
Azure Pipelines ist ein Build- und Testsystem, das auf Azure DevOps basiert und für die Erstellung und Freigabe von Pipelines verwendet wird. Azure Pipelines unterteilt diese Pipelines in logische Schritte, die als Aufgaben bezeichnet werden.
GitHub ist eine Codehostingplattform für Versionsverwaltung, Zusammenarbeit und CI/CD-Workflows.
Azure Arc ist eine Plattform, die Azure Resource Manager zum Verwalten von Azure-Ressourcen und lokalen Ressourcen verwendet. Die Ressourcen können virtuelle Computer, Kubernetes-Cluster und Datenbanken enthalten.
Kubernetes ist ein Open-Source-System, mit dem Sie die Bereitstellung, Skalierung und Verwaltung von Containeranwendungen automatisieren können.
Azure Data Lake Storage ist ein Hadoop-kompatibles Dateisystem. Es verfügt über einen integrierten hierarchischen Namespace und die enorme Skalierung und Wirtschaftlichkeit von Azure Blob Storage.
Azure Synapse Analytics ist ein unbegrenzter Analysedienst, der Datenintegration, Data Warehousing für Unternehmen und Big Data-Analysen vereint.
Azure Event Hubs ist ein Dienst, der von Clientanwendungen generierte Datenströme aufnimmt. Anschließend erfassen und speichern sie Streamingdaten, die die Abfolge der empfangenen Ereignisse beibehalten. Kunden können eine Verbindung mit den Hub-Endpunkten herstellen, um Nachrichten zur Verarbeitung abzurufen. Diese Architektur verwendet die Data Lake Storage-Integration.

Andere Aspekte

Das vorangehende MLOps v2-Architekturmuster verfügt über mehrere wichtige Komponenten, einschließlich rollenbasierter Zugriffssteuerung (RBAC), die sich an die Geschäftsbeteiligten, die effiziente Paketverwaltung und robuste Überwachungsmechanismen richtet. Diese Komponenten tragen gemeinsam zur erfolgreichen Implementierung und Verwaltung von Machine Learning-Workflows bei.

Persona-basierte rollenbasierte Zugriffssteuerung (RBAC)

Es ist entscheidend, dass Sie den Zugriff auf Machine Learning-Daten und -Ressourcen verwalten. RBAC bietet ein robustes Framework, mit dem Sie verwalten können, wer bestimmte Aktionen ausführen und auf bestimmte Bereiche in Ihrer Lösung zugreifen kann. Entwerfen Sie Ihre Identitätssegmentierungsstrategie so, dass sie mit dem Lebenszyklus von Machine Learning-Modellen in Machine Learning und den im Prozess enthaltenen Personas übereinstimmt. Jede Persona verfügt über einen bestimmten Satz von Zuständigkeiten, die in ihren RBAC-Rollen und der Gruppenmitgliedschaft widerspiegelt werden.

Beispielpersonas

Um eine geeignete Segmentierung in einem Machine Learning-Workload zu unterstützen, sollten Sie die folgenden allgemeinen Personas berücksichtigen, die den identitätsbasierten RBAC-Gruppenentwurf beeinflussen.

Data Scientist und Ingenieur für maschinelles Lernen

Data Scientists und Machine Learning Ingenieure führen verschiedene Machine Learning- und Data Science-Aktivitäten im gesamten Softwareentwicklungslebenszyklus eines Projekts durch. Zu ihren Aufgaben gehören explorative Datenanalyse und Datenvorverarbeitung. Data Scientists und Machine Learning Ingenieure sind für Schulungen, Auswertungen und Bereitstellungsmodelle verantwortlich. Die Zuständigkeiten dieser Rollen umfassen auch Break-Fix-Aktivitäten für Machine Learning-Modelle, Pakete und Daten. Diese Aufgaben liegen außerhalb des Umfangs des technischen Supportteams der Plattform.