Freigeben über


Data Format Conversions

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Hinweis

Gilt nur für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

In diesem Artikel werden die Module aufgelistet, die in Machine Learning Studio (klassisch) zum Konvertieren von Daten in verschiedene Dateiformate bereitgestellt werden, die beim maschinellen Lernen verwendet werden.

Folgende Formate werden unterstützt:

  • Das Datasetformat, das in Machine Learning verwendet wird.
  • Das arff-Format , das von Weka verwendet wird. Weka ist ein Open-Source-Java-basierter Satz von Machine Learning-Algorithmen.
  • Das SVMLight-Format . Das SVMLight-Format wurde für das SVMlight-Framework für maschinelles Lernen entwickelt. Sie kann auch von Vowpal Wabbit verwendet werden.
  • Die durch Tabstopps getrennten (TSV) und csv-getrennten Flatfileformate, die von den meisten relationalen Datenbanken unterstützt werden. Diese Formate werden auch von R und Python umfassend unterstützt.

Wenn Sie Daten in diese Formate konvertieren, können Sie Ergebnisse und Daten einfacher zwischen verschiedenen Machine Learning-Frameworks oder Speichermechanismen verschieben.

Hinweis

Diese Datenkonvertierungsmodule konvertieren nur das vollständige Dataset in ein angegebenes Format. Wenn Sie eine Umwandlung, Kürzung, Konvertierung von Datums-/Uhrzeitformaten oder eine andere Bearbeitung der Werte durchführen müssen, verwenden Sie die Module in der Datentransformation, oder sehen Sie sich die Liste der zugehörigen Aufgaben an.

Allgemeine Datenkonvertierungsszenarien

In der Regel verwenden Sie die Datenkonvertierungsmodule, wenn Sie Daten aus einem Machine Learning Experiment in ein anderes Machine Learning-Tool oder eine andere Plattform verschieben müssen. Sie können die Module auch verwenden, um Daten aus Machine Learning in einem Format zu exportieren, das von einer Datenbank oder anderen Tools verwendet werden kann. Beispiel:

Aufgabe Option
Sie müssen ein Zwischendataset speichern, das in Excel verwendet werden soll, oder in eine Datenbank importieren. Verwenden Sie das CSV-Modul oder das TSV-Modul , um die Daten im richtigen Format vorzubereiten. Laden Sie dann die Daten herunter, oder speichern Sie sie in Azure Storage.
Sie möchten Daten aus Ihrem Experiment in R- oder Python-Code wiederverwenden. Verwenden Sie das CSV-Modul oder das TSV-Modul , um die Daten vorzubereiten. Klicken Sie dann mit der rechten Maustaste auf das konvertierte Dataset, um den Python-Code abzurufen, den Sie für den Zugriff auf das Dataset benötigen.
Sie portieren Ihr Experiment und Ihre Daten zwischen Weka und Machine Learning. Verwenden Sie das ARFF-Modul , um die Daten vorzubereiten. Laden Sie dann die Ergebnisse herunter.
Sie müssen Daten im SVMlight-Framework vorbereiten. Verwenden Sie das Modul Convert to SVMLight (In SVMLight konvertieren ), um die Daten vorzubereiten. Laden Sie dann die resultierenden Daten herunter.
Erstellen Sie Daten für die Verwendung mit Vowpal Wabbit. Verwenden Sie das SVMLight-Format . Ändern Sie dann die Dateien wie im Artikel beschrieben. Speichern Sie die Datei in Azure Blob Storage, um sie mit einem Vowpal Wabbit-Modul in Machine Learning zu verwenden.
Daten haben kein tabellarisches Format. Wandeln Sie es mithilfe des Moduls Convert to Dataset (In Dataset konvertieren ) in ein Datasetformat um.

Wenn Sie Daten in Machine Learning importieren oder Daten in einzelne Spalten transformieren müssen, verwenden Sie diese Module, bevor Sie die Datenkonvertierung durchführen:

Aufgabe Option
Importieren Sie Daten von meinem Computer in Machine Learning. Hochladen Datasets im CSV-Format, wie unter Importieren Ihrer Trainingsdaten in Machine Learning Studio (klassisch) beschrieben.
Importieren sie Daten aus einer Clouddatenquelle, einschließlich Hadoop oder Azure. Verwenden Sie das Import Data-Modul .
Speichern sie Machine Learning-Datasets in Azure Blob Storage, einem Hadoop-Cluster oder einem anderen cloudbasierten Speicher. Verwenden Sie das Modul Export Data .
Ändern Sie den Datentyp von Spalten oder Umwandlungsspalten in ein anderes Format oder einen anderen Typ. Verwenden Sie in Machine Learning die Module Edit Metadata (Metadaten bearbeiten) oder Apply SQL Transformation (SQL Transformation anwenden). Wenn Sie mit R oder Python vertraut sind, probieren Sie die Module Execute Python Script (Python-Skript ausführen ) oder Execute R Script (R-Skript ausführen ) aus.
Runden, Gruppieren oder Normalisieren numerischer Daten. Verwenden Sie die Module Mathematische Operation anwenden, Daten in Container gruppieren oder Daten normalisieren .

Liste der Module

Die Kategorie Datenformatkonvertierungen umfasst die folgenden Module:

  • In ARFF konvertieren: Konvertiert die Dateneingabe in das Attributbeziehungsdateiformat, das vom Weka-Toolset verwendet wird.
  • In CSV konvertieren: Konvertiert ein Dataset in ein durch Trennzeichen getrenntes Werteformat.
  • In Dataset konvertieren: Konvertiert die Dateneingabe in das interne Datasetformat, das von Machine Learning verwendet wird.
  • In SVMLight konvertieren: Konvertiert die Dateneingabe in das Format, das vom SVMlight-Framework verwendet wird.
  • In TSV konvertieren: Konvertiert die Dateneingabe in das durch Tabstopps getrennte Format.

Siehe auch