Machine Learning-Modell in Microsoft Fabric

Ein Machine Learning-Modell ist eine Datei, die trainiert wird, um bestimmte Arten von Mustern zu erkennen. Sie trainieren ein Modell über einen Datensatz, und Sie versorgen es mit einem Algorithmus, der verwendet wird, um über diesen Datensatz zu schlussfolgern und daraus zu lernen. Nachdem Sie das Modell trainiert haben, können Sie es verwenden, um daten zu begründen, die es noch nie gesehen hat, und Vorhersagen zu diesen Daten zu erstellen.

In MLflow kann ein Machine Learning-Modell mehrere Modellversionen enthalten. Hier kann jede Version eine Modelliteration darstellen. In diesem Artikel erfahren Sie, wie Sie mit ML-Modellen interagieren, um Modelliterationen nachzuverfolgen und zu vergleichen.

In diesem Artikel erfahren Sie, wie Sie:

Erstellen von Machine Learning-Modellen in Microsoft Fabric
Verwalten und Nachverfolgen von Modellversionen
Vergleichen der Modellleistung über Versionen hinweg
Anwenden von Modellen für Bewertung und Ableitung

Erstellen eines Machine Learning-Modells

Sie können ein Machine Learning-Modell über die Fabric UI oder programmgesteuert mit der MLflow-API erstellen. In MLflow verwenden Modelle ein Standardverpackungsformat, das mit verschiedenen nachgeschalteten Tools funktioniert, einschließlich Batchableitung auf Apache Spark. Das Format speichert ein Modell in verschiedenen "Geschmacksrichtungen", die verschiedene nachgeschaltete Tools verstehen können.

So erstellen Sie ein Machine Learning-Modell aus der Benutzeroberfläche:

Wählen Sie einen vorhandenen Data Science-Arbeitsbereich aus, oder erstellen Sie einen neuen Arbeitsbereich.
Erstellen Sie ein neues Element über den Arbeitsbereich oder mithilfe der Schaltfläche "Erstellen":
1. Arbeitsbereich:
  1. Wählen Sie Ihren Arbeitsbereich aus.
  2. Wählen Sie Neues Element aus.
  3. Wählen Sie "ML-Modell " unter "Analysieren und Trainieren von Daten" aus.
2. Schaltfläche "Erstellen":
  1. Wählen Sie "Erstellen" aus, das im vertikalen Menü in ... zu finden ist.
  2. Wählen Sie "ML-Modell " unter "Data Science" aus.
Nach der Modellerstellung können Sie mit dem Hinzufügen von Modellversionen beginnen, um die Ausführungsmetriken und -parameter nachzuverfolgen. Registrieren oder Speichern von Experimentläufen in einem vorhandenen Modell.

Sie können auch direkt aus ihrer Erstellungserfahrung mit der mlflow.register_model() API ein Machine Learning-Modell erstellen. Wenn ein registriertes Machine Learning-Modell mit dem angegebenen Namen nicht vorhanden ist, erstellt die API es automatisch.

import mlflow

model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")

print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))

Verwalten von Versionen in einem Machine Learning-Modell

Ein Machine Learning-Modell enthält eine Sammlung von Modellversionen für die vereinfachte Nachverfolgung und den Vergleich. Innerhalb eines Modells kann ein Datenwissenschaftler in verschiedenen Modellversionen navigieren, um die zugrunde liegenden Parameter und Metriken zu untersuchen. Data Scientists können auch Vergleiche über Modellversionen hinweg durchführen, um festzustellen, ob neuere Modelle bessere Ergebnisse erzielen könnten.

Note

Mit der MLflow 3-Unterstützung in Fabric erstellt jedes Modell, das Sie mit mlflow.<flavor>.log_model(model, name="...") protokollieren, ein LoggedModel Entität, das mit seiner Quellausführung, Parametern, Metriken, Datasets und Umgebung verknüpft ist. Sie können ein LoggedModel über die Experimentseite öffnen und als neues ML-Modell oder als neue Version eines vorhandenen Modells registrieren. Ausführliche Informationen finden Sie unter MLflow 3 in Fabric Data Science.

Nachverfolgen von Machine Learning-Modellen

Eine Version des Machine Learning-Modells stellt ein einzelnes Modell dar, das für die Nachverfolgung registriert ist.

Jede Modellversion enthält die folgenden Informationen:

Eigentum	Description
Erstellungszeit	Datum und Uhrzeit der Modellerstellung.
Run Name	Der Bezeichner für den Experimentlauf, der zum Erstellen dieser spezifischen Modellversion verwendet wird.
Hyperparameter	Als Schlüsselwertpaare gespeichert. Schlüssel und Werte sind Zeichenfolgen.
Metriken	Führen Sie Metriken aus, die als Schlüsselwertpaare gespeichert sind. Der Wert ist numerisch.
Modellschema/Signatur	Eine Beschreibung der Modelleingaben und -ausgaben.
Protokollierte Dateien	Protokollierte Dateien in einem beliebigen Format. Sie können beispielsweise Bilder, Umgebungen, Modelle und Datendateien aufzeichnen.
Stichwörter	Benutzerdefinierte Metadaten als Schlüsselwertpaare, die an Läufe angehängt sind. Erfahren Sie, wie Tags angewendet werden.

Anwenden von Tags auf Machine Learning-Modelle

Mit MLflow-Tagging für Modellversionen können Benutzer benutzerdefinierte Metadaten bestimmten Versionen eines registrierten Modells in der MLflow-Modellregistrierung anfügen. Diese Tags, die als Schlüsselwertpaare gespeichert sind, helfen beim Organisieren, Nachverfolgen und Unterscheiden zwischen Modellversionen und erleichtern die Verwaltung von Modelllebenszyklus. Tags können verwendet werden, um den Zweck, die Bereitstellungsumgebung oder alle anderen relevanten Informationen zu kennzeichnen, wodurch eine effizientere Modellverwaltung und Entscheidungsfindung innerhalb von Teams erleichtert wird.

Dieser Code veranschaulicht, wie Sie ein RandomForestRegressor-Modell mithilfe von Scikit-learn trainieren, das Modell und die Parameter mit MLflow protokollieren und dann das Modell in der MLflow-Modellregistrierung mit benutzerdefinierten Tags registrieren. Diese Tags stellen nützliche Metadaten bereit, z. B. Projektname, Abteilung, Team und Projektquartal, wodurch die Verwaltung und Nachverfolgung der Modellversion erleichtert wird.

import mlflow.sklearn
from mlflow.models import infer_signature
from sklearn.datasets import make_regression
from sklearn.ensemble import RandomForestRegressor

# Generate synthetic regression data
X, y = make_regression(n_features=4, n_informative=2, random_state=0, shuffle=False)

# Model parameters
params = {"n_estimators": 3, "random_state": 42}

# Model tags for MLflow
model_tags = {
    "project_name": "grocery-forecasting",
    "store_dept": "produce",
    "team": "stores-ml",
    "project_quarter": "Q3-2023"
}

# Log MLflow entities
with mlflow.start_run() as run:
    # Train the model
    model = RandomForestRegressor(**params).fit(X, y)
    
    # Infer the model signature
    signature = infer_signature(X, model.predict(X))
    
    # Log parameters and the model
    mlflow.log_params(params)
    mlflow.sklearn.log_model(model, artifact_path="sklearn-model", signature=signature)

# Register the model with tags
model_uri = f"runs:/{run.info.run_id}/sklearn-model"
model_version = mlflow.register_model(model_uri, "RandomForestRegressionModel", tags=model_tags)

# Output model registration details
print(f"Model Name: {model_version.name}")
print(f"Model Version: {model_version.version}")

Nachdem Sie die Tags angewendet haben, können Sie sie direkt auf der Modellversionsdetailseite anzeigen. Darüber hinaus können Tags jederzeit hinzugefügt, aktualisiert oder von dieser Seite entfernt werden.

Vergleichen und Filtern von Machine Learning-Modellen

Um die Qualität von Machine Learning-Modellversionen zu vergleichen und zu bewerten, können Sie die Parameter, Metriken und Metadaten zwischen ausgewählten Versionen vergleichen.

Visuelles Vergleichen von Machine Learning-Modellen

Sie können Ausführungen in einem vorhandenen Modell visuell vergleichen. Der visuelle Vergleich ermöglicht eine einfache Navigation zwischen mehreren Versionen und das Sortieren über diese hinweg.

Zum Vergleichen von Durchläufen können Sie folgende Aktionen ausführen:

Wählen Sie ein vorhandenes Machine Learning-Modell aus, das mehrere Versionen enthält.
Wählen Sie die Registerkarte "Ansicht " aus, und navigieren Sie dann zur Modelllistenansicht . Sie können auch die Option zum Anzeigen der Modellliste direkt aus der Detailansicht auswählen.
Sie können die Spalten in der Tabelle anpassen. Erweitern Sie den Bereich "Spalten anpassen ". Dort können Sie die Eigenschaften, Metriken, Tags und Hyperparameter auswählen, die Sie anzeigen möchten.
Schließlich können Sie mehrere Versionen auswählen, um ihre Ergebnisse im Metrikvergleichsbereich zu vergleichen. In diesem Bereich können Sie die Diagramme mit Änderungen am Diagrammtitel, dem Visualisierungstyp, der X-Achse, der Y-Achse und mehr anpassen.

Vergleichen von Machine Learning-Modellen mithilfe der MLflow-API

Data Scientists können auch MLflow verwenden, um zwischen mehreren Modellen zu suchen, die im Arbeitsbereich gespeichert sind. Besuchen Sie die MLflow-Dokumentation , um andere MLflow-APIs für die Modellinteraktion zu erkunden.

from pprint import pprint
from mlflow import MlflowClient

client = MlflowClient()
for rm in client.search_registered_models():
    pprint(dict(rm), indent=4)

Anwenden von Machine Learning-Modellen

Sobald Sie ein Modell für eine Datenmenge trainieren, können Sie dieses Modell auf Daten anwenden, die es nie gesehen hat, um Vorhersagen zu generieren. Wir nennen diese Technik der Modellanwendung Scoring oder Inferencing.

Fabric unterstützt mehrere Ansätze für die Anwendung Ihrer trainierten Modelle:

Batch-Scoring – Wenden Sie Ihr Modell in großem Maßstab auf große Datasets mithilfe von Apache Spark an. Dies eignet sich ideal zum Generieren von Vorhersagen zu historischen oder geplanten Daten.
Echtzeitbewertung : Stellen Sie Ihr Modell für On-Demand-Vorhersagen auf einem Endpunkt bereit, die für Anwendungen nützlich sind, die sofortige Ergebnisse benötigen.

Um mit der Anwendung Ihrer Modelle zu beginnen, wählen Sie den Ansatz aus, der Ihrem Szenario entspricht:

Erste Schritte mit der Batchbewertung

Bereitstellen von Modellen für die Bewertung in Echtzeit

Feedback

War diese Seite hilfreich?

Last updated on 2026-06-04