Auswerten der Modellleistung in Machine Learning Studio (Classic)

2017-03-20

Gilt für: Machine Learning Studio (klassisch) Gilt nicht für: Azure Machine Learning

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum zu Azure Machine Learning zu wechseln.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Informationen zum Verschieben von Machine Learning-Projekten von ML Studio (klassisch) zu Azure Machine Learning.
Weitere Informationen zu Azure Machine Learning

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

In diesem Artikel erhalten Sie weitere Informationen zu den Metriken, die Sie verwenden können, um die Modellleistung in Machine Learning Studio (Classic) zu überwachen. Die Auswertung der Leistung eines Modells ist eine der wesentlichen Phasen im Datenanalyseprozess. Sie gibt an, wie erfolgreich die Bewertung (die Vorhersagen) eines Datasets eines trainierten Modells war. In Machine Learning Studio (Classic) wird die Auswertung von Modellen durch zwei der wichtigsten Machine Learning-Module unterstützt:

Mit diesen Modulen können Sie die Leistung Ihres Modells im Hinblick auf verschiedene Kennzahlen anzeigen, die beim maschinellen Lernen und in der Statistik häufig verwendet werden.

Beim Auswerten von Modellen sollte außerdem Folgendes berücksichtigt werden:

Es werden drei häufig eingesetzte Szenarios des beaufsichtigten Lernens vorgestellt:

Regression
Binäre Klassifizierung
Multiklassenklassifizierung

Auswertung und Kreuzvalidierung im Vergleich

Die Auswertung und die Kreuzvalidierung sind Standardmethoden zum Messen der Leistung von Modellen. Bei beiden Methoden werden Auswertungskennzahlen generiert, die mit denen anderer Modelle geprüft oder verglichen werden können.

Das Auswertungsmodell erwartet ein bewertetes Dataset als Eingabe (oder zwei für den Fall, dass Sie die Leistung von zwei verschiedenen Modellen vergleichen möchten). Daher müssen Sie Ihr Modell mithilfe des Train-Modellmoduls trainieren und Vorhersagen für einige Datasets mithilfe des Score Model-Moduls erstellen, bevor Sie die Ergebnisse auswerten können. Die Auswertung basiert auf den bewerteten Bezeichnungen/Wahrscheinlichkeiten zusammen mit den tatsächlichen Beschriftungen, die alle vom Score Model-Modul ausgegeben werden.

Alternativ können Sie mithilfe der Kreuzvalidierung automatisch mehrere Trainings-/Bewertungs-/Auswertungsvorgänge (Aufteilung in 10 Teildatensätze) für verschiedene Teilmengen der Eingabedaten durchführen. Die Eingabedaten werden in 10 Teilmengen aufgeteilt, wobei eine Teilmenge zum Testen und die anderen 9 zum Trainieren vorgesehen sind. Dieser Vorgang wird 10-mal wiederholt, und die Auswertungskennzahlen werden gemittelt. Damit lässt sich feststellen, wie gut ein Modell neue Datasets verallgemeinert. Das Modul Cross-Validate Model verwendet ein untrainiertes Modell und einige markierte Datensätze und gibt die Bewertungsergebnisse jeder der 10 Faltungen neben den durchschnittlichen Ergebnissen aus.

In den folgenden Abschnitten erstellen wir einfache Regressions- und Klassifikationsmodelle und bewerten ihre Leistung unter Verwendung der Module "Evaluate Model " und " Cross-Validate Model ".

Auswerten eines Regressionsmodells

Angenommen, wir möchten den Preis eines Fahrzeugs anhand von Eigenschaften wie Abmessungen, PS, Motorisierung usw. vorhersagen. Dies ist ein typisches Regressionsproblem, bei dem die Zielvariable (Preis) ein fortlaufender numerischer Wert ist. Dazu kann ein lineares Regressionsmodell angepasst werden, das mit den Eigenschaftenwerten eines bestimmten Fahrzeugs den Preis des Fahrzeugs vorhersagen kann. Mit diesem Regressionsmodell kann das gleiche Dataset bewertet werden, das für das Training verwendet wurde. Wenn die vorhergesagten Fahrzeugpreise vorliegen, kann die Modellleistung ausgewertet werden, indem wir uns ansehen, inwieweit die Vorhersagen im Durchschnitt von den tatsächlichen Preisen abweichen. Um dies zu veranschaulichen, verwenden wir den Datensatz "Automobilpreisdaten (Rohdaten)", der im Abschnitt "Gespeicherte Datasets" in Machine Learning Studio (klassisch) verfügbar ist.

Erstellen des Experiments

Fügen Sie Ihrem Arbeitsbereich in Machine Learning Studio (Classic) die folgenden Module hinzu:

Verbinden Sie die Ports, wie in Abbildung 1 unten dargestellt, und legen Sie die Spalte "Label" des Train Model-Moduls auf price fest.

Auswerten eines Regressionsmodells

Abbildung 1. Auswerten eines Regressionsmodells.

Überprüfen der Auswertungsergebnisse

Nachdem Sie das Experiment ausgeführt haben, können Sie auf den Ausgabeport des Moduls "Evaluate Model " klicken und "Visualisieren" auswählen, um die Auswertungsergebnisse anzuzeigen. Die für Regressionsmodelle verfügbaren Auswertungsmetriken sind: Mean Absolute Error, Root Mean Absolute Error, Relative Absolute Error, Relativer quadratischer Fehler und der Bestimmtheitskoeffizient.

Der Begriff "Fehler" gibt hier die Differenz zwischen dem vorhergesagten und dem tatsächlichen Wert an. Normalerweise wird der absolute Wert oder das Quadrat dieser Differenz berechnet, um die gesamte Fehlerabweichung in allen Fällen zu erfassen, da die Differenz zwischen dem vorhergesagten und dem tatsächlichen Wert in einigen Fällen auch negativ sein kann. Die Fehlerkennzahlen messen die Vorhersageleistung eines Regressionsmodells im Hinblick auf die mittlere Abweichung seiner Vorhersagen von den tatsächlichen Werten. Kleinere Fehlerwerte bedeuten, dass das Modell bei Vorhersagen genauer ist. Die Fehlerkennzahl null bedeutet, dass das Modell perfekt mit den Daten übereinstimmt.

Das Bestimmtheitsmaß, das auch als "R-Quadrat" notiert wird, ist ebenfalls eine Standardmethode für die Berechnung, wie gut das Vorhersagemodell mit den Daten übereinstimmt. Es kann als der Anteil der Abweichung interpretiert werden, der durch das Modell beschrieben wird. In diesem Fall ist ein höherer Anteil besser, wobei "1" eine perfekte Übereinstimmung angibt.

Metriken für lineare Regressionsauswertung

Abbildung 2. Auswertungskennzahlen bei der linearen Regression.

Verwenden der Kreuzvalidierung

Wie bereits erwähnt, können Sie wiederholte Schulungen, Bewertungen und Auswertungen automatisch mithilfe des Moduls "Cross-Validate Model " durchführen. Alles, was Sie in diesem Fall benötigen, ist ein Dataset, ein untrainiertes Modell und ein Cross-Validate-Modellmodul (siehe Abbildung unten). Sie müssen die Bezeichnungsspalte auf "Preis " in den Eigenschaften des Cross-Validate-Modellmoduls festlegen.

Kreuz validieren eines Regressionsmodells

Abbildung 3. Kreuzvalidierung eines Regressionsmodells.

Nach dem Ausführen des Experiments können Sie die Auswertungsergebnisse überprüfen, indem Sie auf den rechten Ausgabeport des Cross-Validate-Modellmoduls klicken. Dadurch werden eine Detailansicht der Kennzahlen für jede Iteration (Aufteilung) und die gemittelten Ergebnisse aller Kennzahlen angezeigt (Abbildung 4).

Kreuzvalidierungsergebnisse eines Regressionsmodells

Abbildung 4. Ergebnisse der Kreuzvalidierung eines Regressionsmodells.

Auswerten eines binären Klassifizierungsmodells

Bei der binären Klassifizierung hat die Zielvariable nur zwei mögliche Ergebnisse, z. B.: {0, 1} oder {falsch, wahrt}, {negativ, positiv}. Angenommen, Sie erhalten ein Dataset mit Mitarbeiterdaten, das verschiedene Variablen zu Demografie und Beschäftigung enthält, und Sie werden gebeten, das Einkommensniveau (eine binäre Variable mit den Werten {"<=50 K", ">50 K"}) vorherzusagen. Anders gesagt: Die negative Klasse gibt die Mitarbeiter an, deren Einkommen pro Jahr kleiner oder gleich 50 K (50.000) ist, und die positive Klasse alle anderen Mitarbeiter. Wie beim Regressionsszenario werden ein Modell trainiert, einige Daten bewertet und die Ergebnisse ausgewertet. Der Hauptunterschied besteht hier in der Auswahl der Metriken, die in Machine Learning Studio (Classic) berechnet und ausgegeben werden. Zur Veranschaulichung des Szenarios für die Einkommensstufe verwenden wir das Dataset "Adult ", um ein Studio-Experiment (klassisch) zu erstellen und die Leistung eines zweistufigen Logistischen Regressionsmodells zu bewerten, einem häufig verwendeten binären Klassifizierer.