Datentransformation

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

In diesem Artikel werden die Module aufgelistet, die in Machine Learning Studio (klassisch) für die Datentransformation bereitgestellt werden. Für maschinelles Lernen umfasst die Datentransformation einige sehr allgemeine Aufgaben, z. B. das Verknüpfen von Datasets oder das Ändern von Spaltennamen. Sie umfasst jedoch auch viele Aufgaben, die für maschinelles Lernen spezifisch sind, z. B. Normalisierung, Gruppierung und Rückschluss auf fehlende Werte.

Hinweis

Gilt nur für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Wichtig

Daten, die Sie in Machine Learning Studio (klassisch) verwenden, werden in der Regel als "aufgeräumt" erwartet, bevor Sie sie in Machine Learning Studio (klassisch) importieren. Bei der Datenvorbereitung kann beispielsweise sichergestellt werden, dass die Daten die richtige Codierung verwenden und überprüft wird, ob die Daten über ein konsistentes Schema verfügen.

Module für die Datentransformation sind in die folgenden aufgabenbasierten Kategorien gruppiert:

  • Erstellen von Filtern für die digitale Signalverarbeitung: Digitale Signalfilter können auf numerische Daten angewendet werden, um Machine Learning-Aufgaben wie Bilderkennung, Spracherkennung und Wellenformanalyse zu unterstützen.
  • Generieren und Verwenden von count-basierten Features: Count-based featurization modules (Count-based featurization modules) hilft Ihnen bei der Entwicklung kompakter Features für machine learning.
  • Allgemeine Datenbearbeitung und -vorbereitung: Zusammenführen von Datasets, Bereinigen fehlender Werte, Gruppieren und Zusammenfassen von Daten, Ändern von Spaltennamen und Datentypen oder Angeben, welche Spalte eine Bezeichnung oder ein Feature ist.
  • Sampling und Aufteilung von Datasets: Teilen Sie Ihre Daten in Trainings- und Testsätze auf, teilen Sie Datasets nach Prozentsatz oder filterbedingung auf, oder führen Sie die Stichprobenentnahme durch.
  • Skalieren und Reduzieren von Daten: Bereiten Sie numerische Daten für die Analyse vor, indem Sie die Normalisierung anwenden oder skalieren. Einteilen von Daten in Gruppen, Entfernen oder Ersetzen von Ausreißern oder Durchführen einer Prinzipalkomponentenanalyse (Principal Component Analysis, PCA).

Liste der Module

Die folgenden Modulkategorien sind in der Kategorie Datentransformation enthalten:

Siehe auch