Datentransformation – Manipulation
Wichtig
Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.
Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.
- Siehe Migrieren zu Azure Machine Learning
- Weitere Informationen zu Azure Machine Learning.
Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.
In diesem Artikel werden die Module in Machine Learning Studio (klassisch) beschrieben, die Sie für die grundlegende Datenbearbeitung verwenden können.
Hinweis
Gilt für: Machine Learning Studio (klassisch)
Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.
Machine Learning Studio (klassisch) unterstützt Aufgaben, die für maschinelles Lernen spezifisch sind, z. B. Normalisierung oder Featureauswahl. Die Module in dieser Kategorie sind für allgemeinere Aufgaben vorgesehen.
Datenbearbeitungsaufgaben
Die Module in dieser Kategorie sollen kernige Datenverwaltungsaufgaben unterstützen, die möglicherweise in Machine Learning Studio (klassisch) ausgeführt werden müssen. Die folgenden Aufgaben sind Beispiele für zentrale Datenverwaltungsaufgaben:
- Kombinieren Sie zwei Datasets, entweder mithilfe von Joins oder durch Zusammenführen von Spalten oder Zeilen.
- Erstellen Sie neue Kategorien, die beim Gruppieren von Daten verwendet werden.
- Ändern Sie Spaltenüberschriften, ändern Sie Spaltendatentypen, oder kennzeichnen Sie Spalten als Features oder Bezeichnungen.
- Überprüfen Sie, ob Werte fehlen, und ersetzen Sie sie dann durch entsprechende Werte.
Zugehörige Aufgaben
- Durchführen einer Stichprobenentnahme oder Aufteilen eines Datasets in Trainings- und Testsätze: Verwenden Sie die Module Data Transformation – Sample und Split .
- Zahlen skalieren, Daten normalisieren oder numerische Werte in Behälter setzen: Verwenden Sie die Module Datentransformation – Skalieren und Reduzieren .
- Ausführen von Berechnungen für numerische Datenfelder oder zum Generieren häufig verwendeter Statistiken: Verwenden Sie die Tools in Statistische Funktionen.
Beispiele
Beispiele zum Arbeiten mit komplexen Daten in Machine Learning-Experimenten finden Sie in den folgenden Beispielen im Azure KI-Katalog:
- Datenverarbeitung und -analyse: Veranschaulicht wichtige Tools und Prozesse.
- Erkennung von Frühchen: Veranschaulicht, wie Datasets partitioniert und dann auf jede Partition eine spezielle Verarbeitung angewendet wird.
Module in dieser Kategorie
Die Kategorie Datentransformation – Manipulation umfasst die folgenden Module:
- Spalten hinzufügen: Fügt einen Satz von Spalten aus einem Dataset zu einem anderen hinzu.
- Zeilen hinzufügen: Fügt eine Reihe von Zeilen aus einem Eingabe-Dataset an das Ende eines anderen Datasets an.
- Anwenden SQL Transformation: Führt eine SQLite-Abfrage für Eingabe-Datasets aus, um die Daten zu transformieren.
- Fehlende Daten bereinigt: Gibt an, wie Werte behandelt werden, die in einem Dataset fehlen. Dieses Modul ersetzt Denkbereinigung fehlender Werte, der veraltet ist.
- In Indikatorwerte konvertieren: Konvertiert kategorische Werte in Spalten in Indikatorwerte.
- Metadaten bearbeiten: Bearbeitet Metadaten, die Spalten in einem Dataset zugeordnet sind.
- Kategorische Werte gruppieren: Gruppieren von Daten aus mehreren Kategorien in eine neue Kategorie.
- Daten beitreten: Verbindet zwei Datasets.
- Doppelte Zeilen entfernen: Entfernt doppelte Zeilen aus einem Dataset.
- Spalten im Dataset auswählen: Wählt Spalten aus, die in ein Dataset ein- oder aus einem Dataset in einem Vorgang ausgeschlossen werden sollen.
- Spaltentransformation auswählen: Erstellt eine Transformation, die dieselbe Teilmenge von Spalten wie in einem angegebenen Dataset auswählt.
- SMOTE: Erhöht die Anzahl von Beispielen mit geringem Anteil in einem Dataset, indem synthetisches Oversampling der Minderheit verwendet wird.