Share via


ML Studio -Modulbeschreibungen (klassisch)

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Dieses Thema bietet eine Übersicht über alle Module in Machine Learning Studio (klassisch), einem interaktiven, visuellen Arbeitsbereich zum einfachen Erstellen und Testen von Vorhersagemodellen.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Was ist ein Modul?

In Machine Learning Studio (klassisch) ist ein Modul ein Baustein zum Erstellen von Experimenten. Jedes Modul kapselt einen bestimmten Machine Learning-Algorithmus, eine funktion oder eine Codebibliothek, die auf Daten in Ihrem Arbeitsbereich agieren kann. Die Module sind so konzipiert, dass verbindungen von anderen Modulen akzeptiert werden, um Daten gemeinsam zu verwenden und zu ändern.

Der Code, der in jedem Modul ausgeführt wird, stammt aus vielen Quellen. Dazu gehören Open Source Bibliotheken und Sprachen, von Microsoft Research entwickelte Algorithmen und Tools für die Arbeit mit Azure und anderen Clouddiensten.

Tipp

Suchen Sie nach Algorithmen für maschinelles Lernen? Weitere Informationen finden Machine Learning Kategorie , die Module für Entscheidungsstrukturen, Clustering, neuronale Netze und andere enthält. Die Kategorien Trainierenund Auswerten enthalten Module zum Trainieren und Testen Ihrer Modelle.

Durch Verbinden und Konfigurieren von Modulen können Sie einen Workflow erstellen, der Daten aus externen Quellen liest, für die Analyse vorbereitet, Machine Learning-Algorithmen verwendet und Ergebnisse generiert.

Wenn ein Experiment in Machine Learning Studio (klassisch) geöffnet ist, wird links im Navigationsbereich die vollständige Liste der aktuellen Module angezeigt. Sie ziehen diese Bausteine in Ihr Experiment und verbinden sie dann, um einen vollständigen Machine Learning-Workflow zu erstellen, der als Experiment bezeichnet wird.

Manchmal werden Module aktualisiert, um neue Funktionen hinzuzufügen oder älteren Code zu entfernen. In diesem Fall werden alle von Ihnen erstellten Experimente, die das Modul verwenden, weiterhin ausgeführt. Aber wenn Sie das Experiment das nächste Mal öffnen, werden Sie aufgefordert, das Modul zu aktualisieren oder ein anderes Modul zu verwenden.

Beispiele

Ein Beispiel zum Erstellen eines vollständigen Machine Learning-Experiments finden Sie in den folgenden Tutorials:

Modulkategorien

Um die Suche nach verwandten Modulen zu vereinfachen, werden die Machine Learning-Tools in Machine Learning Studio (klassisch) nach diesen Kategorien unterteilt.

Datenformatkonvertierungen

Verwenden Sie diese Module zum Konvertieren von Daten in eins der Formate, die von anderen Machine Learning-Tools oder -Formaten verwendet werden.

  • Dateneingabe und -ausgabe

    Verwenden Sie diese Module, um Daten und Modelle aus Clouddatenquellen zu lesen, einschließlich Hadoop-Clustern, Azure Table Storage und Web-URLs. Sie können diese Module auch verwenden, um Ergebnisse in den Speicher oder in eine Datenbank zu schreiben.

  • Datentransformation

    Verwenden Sie diese Module zum Vorbereiten von Daten für die Analyse. Sie können Datentypen ändern, Spalten als Features oder Bezeichnungen kennzeichnen, Features generieren und Daten skalieren oder normalisieren.

  • Filter

    Transformieren numerischer Daten, die aus der Digitalen Signalverarbeitung abgeleitet wurden.

  • Learning mit Zählern

    Verwenden Sie gemeinsame Wahrscheinlichkeitsverteilungen, um Features zu erstellen, die große Datasets kompakt beschreiben.

  • Manipulation

    Diese Gruppe bietet eine Vielzahl von Tools für Data Science. Beispielsweise können Sie fehlende Werte entfernen oder ersetzen, eine Teilmenge von Spalten auswählen, eine Spalte hinzufügen oder zwei Datasets verketten.

  • Sample and Split

    Dividieren Sie ein Dataset nach Kriterien oder Größe, um Trainings- und Testsätze zu erstellen oder bestimmte Zeilen zu isolieren.

  • Scale and Reduce

    Transformieren numerischer Daten.

Featureauswahl

Verwenden Sie diese Module, um die besten Merkmale in Ihren Daten mithilfe von gut erforschten statistischen Methoden zu identifizieren.

Machine Learning

Diese Gruppe enthält die meisten machine learning-Algorithmen, die von der Machine Learning.

Es enthält auch Module, die die Algorithmen unterstützen sollen, indem Modelle trainiert, Bewertungen generiert und die Modellleistung bewertet wird.

  • Evaluieren

    Nachdem Sie ein Modell trainiert haben, verwenden Sie diese Tools, um die Genauigkeit des Modells zu messen.

  • Initialisieren

    Diese Module stellen die Machine Learning-Algorithmen zur Verfügung, die Sie anpassen können, indem Sie Parameter festlegen. Die Algorithmen in diesem Abschnitt sind nach Typ gruppiert:

  • Wert

    Verwenden Sie diese Module, um neue Daten über den Algorithmus zu übergeben und einen Satz von Ergebnissen für die Auswertung zu generieren. Sie können die Ergebnisse der Bewertung auch als Teil eines Vorhersagediensts verwenden.

  • Trainieren

    Diese Module trainieren ein initialisiertes Machine Learning-Modell mit daten, die Sie bereitstellen.

OpenCV-Bibliotheksmodule

Diese Module bieten Ihnen einfachen Zugriff auf eine beliebte Open Source-Bibliothek für die Bildverarbeitung und Bildklassifikation.

R Language Modules

Verwenden Sie diese Modulen, um Ihrem Experiment benutzerdefinierten R-Code hinzuzufügen oder um ein Machine Learning-Modell auf Grundlage eines R-Pakets zu implementieren.

Python-Sprachmodule

Verwenden Sie diese Module, um Ihrem Experiment benutzerdefinierten Python-Code hinzuzufügen.

Statistische Funktionen

Verwenden Sie diese Module zum Berechnen von Wahrscheinlichkeitsverteilungen, zum Erstellen benutzerdefinierter Berechnungen sowie zum Ausführen einer Vielzahl unterschiedlicher sonstiger Aufgaben im Zusammenhang mit numerischen Variablen.

Textanalyse

Verwenden Sie diese Module, um Featurehashing und Erkennung benannter Entitäten durchzuführen oder Text mithilfe von Tools zur Verarbeitung natürlicher Sprache vorverarbeitet zu haben.

Zeitreihe

Verwenden Sie diese Module, um Anomalien in Trends zu bewerten, indem Sie Algorithmen verwenden, die speziell für Zeitreihendaten entwickelt wurden.

Machine Learning Studio-Module (klassisch) versuchen nicht, Datenintegrationstools zu duplizieren, die in anderen Tools unterstützt werden, z. B. Azure Data Factory. Stattdessen bieten die Module Funktionen, die für maschinelles Lernen spezifisch sind:

  • Normalisierung, Gruppierung und Skalierung von Daten
  • Berechnen der statistischen Verteilung von Daten
  • Konvertierung in andere Machine Learning-Formate
  • Importieren von Daten, die für Machine Learning-Experimente und den Export von Ergebnissen verwendet werden
  • Textanalyse, Featureauswahl und Verringerung der Dimensionalität

Wenn Sie komplexere Einrichtungen für die Datenbearbeitung und -speicherung benötigen, lesen Sie Folgendes:

Siehe auch