Machine Learning-Modell in Microsoft Fabric

Ein Machine Learning-Modell ist eine Datei, die trainiert wird, um bestimmte Mustertypen zu erkennen. Sie trainieren ein Modell über eine Reihe von Daten und stellen es mit einem Algorithmus bereit, der verwendet, um das Dataset zu überstellen und daraus zu lernen. Nachdem Sie das Modell trainiert haben, können Sie es verwenden, um über Daten zu argumentieren, die es noch nie zuvor gesehen hat, und Vorhersagen zu diesen Daten zu treffen.

Wichtig

Microsoft Fabric befindet sich derzeit in der VORSCHAU. Diese Informationen beziehen sich auf eine Vorabversion des Produkts, an der vor der Veröffentlichung noch wesentliche Änderungen vorgenommen werden können. Microsoft übernimmt keine Garantie, weder ausdrücklich noch stillschweigend, für die hier bereitgestellten Informationen.

In MLflow kann ein Machine Learning-Modell mehrere Modellversionen enthalten. Hier kann jede Version eine Modelliteration darstellen. In diesem Artikel erfahren Sie, wie Sie mit Machine Learning-Modellen interagieren, um Modellversionen nachzuverfolgen und zu vergleichen.

Erstellen eines Modells

In MLflow enthalten Machine Learning-Modelle ein Standardpaketformat. Dieses Format ermöglicht die Verwendung dieser Modelle in verschiedenen Downstreamtools, einschließlich Batchrückschlüssen in Apache Spark. Das Format definiert eine Konvention zum Speichern eines Modells in verschiedenen "Varianten", die von verschiedenen nachgeschalteten Tools verstanden werden können.

Die Benutzeroberfläche kann direkt ein Machine Learning-Modell aus der Benutzeroberfläche erstellen. Die MLflow-API kann auch direkt ein Machine Learning-Modell erstellen.

Um ein Machine Learning-Modell aus der Benutzeroberfläche zu erstellen, haben Sie folgende Möglichkeiten:

  1. Erstellen Sie einen neuen Data Science-Arbeitsbereich, oder wählen Sie einen vorhandenen Data Science-Arbeitsbereich aus.

  2. Wählen Sie in der Dropdownliste + Neudie Option Modell aus. Dadurch wird ein leeres Modell in Ihrem Data Science-Arbeitsbereich erstellt.

    Screenshot: Dropdownmenü

  3. Nach der Modellerstellung können Sie mit dem Hinzufügen von Modellversionen beginnen, um Ausführungsmetriken und -parameter nachzuverfolgen. Registrieren oder Speichern von Experimentausführungen in einem vorhandenen Modell.

Sie können auch ein Machine Learning-Experiment direkt aus Ihrer Erstellungserfahrung mit der mlflow.register_model() API erstellen. Wenn kein registriertes Modell mit dem angegebenen Namen vorhanden ist, erstellt die API es automatisch.

import mlflow

model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")

print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))

Verwalten von Versionen in einem Modell

Ein Machine Learning-Modell enthält eine Sammlung von Modellversionen für eine vereinfachte Nachverfolgung und einen vereinfachten Vergleich. Innerhalb eines Modells kann ein Data Scientist über verschiedene Modellversionen navigieren, um die zugrunde liegenden Parameter und Metriken zu untersuchen. Data Scientists können auch Modellversionenübergreifende Vergleiche anstellen, um zu ermitteln, ob neuere Modelle bessere Ergebnisse liefern könnten.

Nachverfolgen von Modellen

Eine Machine Learning-Modellversion stellt ein einzelnes Modell dar, das für die Nachverfolgung registriert wurde.

Screenshot des Detailbildschirms eines Modells.

Jede Modellversion enthält die folgenden Informationen:

  • Erstellungszeit: Datum und Uhrzeit der Modellerstellung.
  • Ausführungsname: Der Bezeichner für die Experimentausführungen, die zum Erstellen dieser spezifischen Modellversion verwendet werden.
  • Hyperparameter: Hyperparameter werden als Schlüssel-Wert-Paare gespeichert. Sowohl Schlüssel als auch Werte sind Zeichenfolgen.
  • Metriken: Führen Sie Metriken aus, die als Schlüssel-Wert-Paare gespeichert werden. Der Wert ist numerisch.
  • Modellschema/Signatur: Eine Beschreibung der Modelleingaben und -ausgaben.
  • Protokollierte Dateien: Protokollierte Dateien in einem beliebigen Format. Sie können beispielsweise Bilder, Umgebungen, Modelle und Datendateien aufzeichnen.

Vergleichen und Filtern von Modellen

Um die Qualität von Machine Learning-Modellversionen zu vergleichen und zu bewerten, können Sie die Parameter, Metriken und Metadaten zwischen ausgewählten Versionen vergleichen.

Visueller Vergleich von Modellen

Sie können Ausführungen innerhalb eines vorhandenen Modells visuell vergleichen. Dies ermöglicht eine einfache Navigation zwischen und sortiert mehrere Versionen.

Screenshot: Liste der Ausführungen zum Vergleich.

Um Ausführungen zu vergleichen, haben Sie folgende Möglichkeiten:

  1. Wählen Sie ein vorhandenes Machine Learning-Modell aus, das mehrere Versionen enthält.
  2. Wählen Sie die Registerkarte Ansicht aus, und navigieren Sie dann zur Listenansicht Modell . Sie können auch die Option Modellliste anzeigen direkt in der Detailansicht auswählen.
  3. Sie können die Spalten in der Tabelle anpassen. Erweitern Sie den Bereich Spalten anpassen . Dort können Sie die Eigenschaften, Metriken und Hyperparameter auswählen, die Sie anzeigen möchten.
  4. Schließlich können Sie mehrere Versionen auswählen, um deren Ergebnisse im Metrikvergleichsbereich zu vergleichen. In diesem Bereich können Sie die Diagramme mit Änderungen am Diagrammtitel, Visualisierungstyp, X-Achse, Y-Achse und mehr anpassen.

Vergleichen von Modellen mithilfe der MLflow-API

Data Scientists können auch MLflow verwenden, um zwischen mehreren Modellen zu suchen, die im Arbeitsbereich gespeichert sind. Besuchen Sie die MLflow-Dokumentation , um andere MLflow-APIs für die Modellinteraktion zu erkunden.

from pprint import pprint

client = MlflowClient()
for rm in client.list_registered_models():
    pprint(dict(rm), indent=4)

Modell anwenden

Nachdem Sie ein Modell für ein Dataset trainiert haben, können Sie dieses Modell auf Daten anwenden, die es noch nie gesehen hat, um Vorhersagen zu generieren. Dieses Modell wird als Technikbewertung oder -rückschluss bezeichnet. Weitere Informationen zur Microsoft Fabric-Modellbewertung finden Sie im nächsten Abschnitt.

Nächste Schritte