Share via


Migrieren eines Studio (Classic)-Datasets zu Azure Machine Learning

Wichtig

Der Support für Azure Machine Learning-Studio (klassisch) wird am 31. August 2024 enden. Wir empfehlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie in Machine Learning-Studio (klassisch) keine neuen Ressourcen mehr erstellen (Arbeitsbereichs- und Webdienstplan). Sie können bereits vorhandene Experimente und Webdienste in Machine Learning-Studio (klassisch) noch bis zum 31. August 2024 weiterverwenden. Weitere Informationen finden Sie unter:

Die Dokumentation zu Machine Learning-Studio (klassisch) wird eingestellt und möglicherweise in der Zukunft nicht mehr aktualisiert.

In diesem Artikel erfahren Sie, wie Sie ein Studio (Classic)-Dataset zu Azure Machine Learning migrieren. Weitere Informationen zur Migration aus Studio (Classic) finden Sie im Artikel mit der Übersicht über die Migration.

Sie haben drei Möglichkeiten, ein Dataset zu Azure Machine Learning zu migrieren. Lesen Sie die einzelnen Abschnitte, um zu bestimmen, welche Option sich am besten für Ihr Szenario eignet.

Wo befinden sich die Daten? Migrationsoption
In Studio (Classic) Option 1: Herunterladen des Datasets aus Studio (Classic) und anschließendes Hochladen in Azure Machine Learning
Cloudspeicher Option 2: Registrieren eines Datasets aus einer Clouddatenquelle

Option 3: Verwenden des Moduls „Daten importieren“ zum Abrufen von Daten aus einer Clouddatenquelle

Hinweis

Azure Machine Learning unterstützt auch Code First-Workflows zum Erstellen und Verwalten von Datasets.

Voraussetzungen

Herunterladen des Datasets aus Studio (Classic)

Die einfachste Methode zum Migrieren eines Studio (Classic)-Datasets zu Azure Machine Learning ist das Herunterladen des Datasets und seine Registrierung in Azure Machine Learning. Dadurch wird eine neue Kopie des Datasets erstellt und in einen Azure Machine Learning-Datenspeicher hochgeladen.

Die folgenden Studio (Classic)-Datasettypen können Sie direkt herunterladen.

  • Nur-Text (.txt)
  • Durch Trennzeichen getrennte Werte (CSV) mit einer Kopfzeile (.csv) oder ohne (.nh.csv)
  • Durch Tabulator getrennte Werte (TSV) mit einer Kopfzeile (.tsv) oder ohne (.nh.tsv)
  • Excel-Datei
  • ZIP-Datei (.zip)

So laden Sie Datasets direkt herunter

  1. Navigieren Sie zu Ihrem Studio (Classic)-Arbeitsbereich (https://studio.azureml.net).

  2. Wählen Sie auf der linken Navigationsleiste die Registerkarte Datasets aus.

  3. Wählen Sie die Datasets aus, die heruntergeladen werden sollen.

  4. Wählen Sie auf der unteren Aktionsleiste die Option Herunterladen aus.

    AScreenshot showing how to download a dataset in Studio (classic).

Bei den folgenden Datentypen müssen Sie zum Herunterladen von Datasets das Modul In CSV konvertieren verwenden.

  • SVMLight-Daten (.svmlight)
  • ARFF-Daten (Attribute Relation File Format, .arff)
  • R-Objektdatei oder -Arbeitsbereichsdatei (.RData)
  • Datasettyp (.data). Der Dataset-Typ ist der interne Studio (Classic)-Datentyp für die Modulausgabe.

So konvertieren Sie das Dataset in das CSV-Format und laden die Ergebnisse herunter

  1. Navigieren Sie zu Ihrem Studio (Classic)-Arbeitsbereich (https://studio.azureml.net).

  2. Erstellen eines neuen Experiments.

  3. Ziehen Sie das herunterzuladende Dataset auf die Canvas.

  4. Fügen Sie ein In CSV konvertieren-Modul hinzu.

  5. Verbinden Sie den Eingabeport von In CSV konvertieren mit dem Ausgabeport des Datasets.

  6. Führen Sie das Experiment aus.

  7. Klicken Sie mit der rechten Maustaste auf das Modul In CSV konvertieren.

  8. Wählen Sie Results dataset (Ergebnisdataset)>Herunterladen aus.

    Screenshot showing how to setup a convert to CSV pipeline.

Hochladen des Datasets in Azure Machine Learning

Nachdem Sie die Datendatei heruntergeladen haben, können Sie es als Datenressource in Azure Machine Learning registrieren:

  1. Navigieren Sie zu Azure Machine Learning Studio.

  2. Wählen Sie unter Ressourcen im linken Navigationsbereich die Option Daten aus. Wählen Sie auf der Registerkarte „Datenressourcen“ die Option „Erstellen“ aus.Screenshot highlights Create in the Data assets tab.

  3. Geben Sie Ihrer Datenressource einen Namen und eine optionale Beschreibung. Wählen Sie dann die Option Tabellarisch unter Typ im Abschnitt Datasettypen der Dropdownliste aus.

    Hinweis

    Sie können auch ZIP-Dateien als Datenressourcen hochladen. Um eine ZIP-Datei hochzuladen, wählen Sie Datei für Typ im Abschnitt Datasettypen der Dropdownliste aus. Screenshot shows data asset source choices.

  4. Wählen Sie für die Datenquelle die Option „Aus lokalen Dateien“ aus, um das Dataset hochzuladen.

  5. Wählen Sie bei der Dateiauswahl zuerst aus, wo Ihre Daten in Azure gespeichert werden sollen. Sie wählen einen Azure Machine Learning-Datenspeicher aus. Weitere Informationen zu Datenspeichern finden Sie unter Herstellen einer Verbindung mit Speicherdiensten. Laden Sie als Nächstes das Dataset hoch, das Sie zuvor heruntergeladen haben.

  6. Befolgen Sie die Schritte, um die Datenanalyseeinstellungen und das Schema für Ihre Datenressource festzulegen.

  7. Wenn Sie den Schritt „Überprüfen“ erreichen, klicken Sie auf der letzten Seite auf „Erstellen“.

Importieren von Daten aus Clouddatenquellen

Wenn sich Ihre Daten bereits in einem Cloudspeicherdienst befinden und am nativen Speicherort beibehalten werden sollen, haben Sie folgende Möglichkeiten:

Erfassungsmethode BESCHREIBUNG
Registrieren eines Azure Machine Learning-Datasets Die Daten werden aus lokalen und Onlinedatenquellen (Blob, ADLS Gen1, ADLS Gen2, Dateifreigabe, SQL DB) erfasst.

Ein Verweis auf die Datenquelle wird erstellt, der zur Laufzeit verzögert ausgewertet wird. Verwenden Sie diese Option, wenn Sie wiederholt auf das Dataset zugreifen und erweiterte Datenfunktionen wie die Datenversionsverwaltung und Datenüberwachung aktivieren möchten.
Modul „Import Data“ (Daten importieren) Die Daten werden aus Onlinedatenquellen (Blob, ADLS Gen1, ADLS Gen2, Dateifreigabe, SQL DB) erfasst.

Das Dataset wird nur in die aktuelle Designer-Pipelineausführung importiert.

Hinweis

Benutzer von Studio (Classic) sollten beachten, dass die folgenden Clouddatenquellen in Azure Machine Learning nicht nativ unterstützt werden:

  • Hive-Abfrage
  • Azure Table
  • Azure Cosmos DB
  • Lokale SQL-Datenbank

Es wird empfohlen, dass Benutzer ihre Daten mithilfe von Azure Data Factory zu unterstützten Speicherdiensten migrieren.

Registrieren eines Azure Machine Learning-Datasets

Führen Sie die folgenden Schritte aus, um ein Dataset aus einem Clouddienst in Azure Machine Learning zu registrieren:

  1. Erstellen Sie einen Datenspeicher, über den der Cloudspeicherdienst mit Ihrem Azure Machine Learning-Arbeitsbereich verbunden wird.

  2. Registrieren Sie ein Dataset. Wenn Sie ein Studio (Classic)-Dataset migrieren, wählen Sie die Einstellung Tabellarisch als Datasettyp aus.

Nachdem Sie ein Dataset in Azure Machine Learning registriert haben, können Sie es im Designer verwenden:

  1. Erstellen Sie einen neuen Designer-Pipelineentwurf.
  2. Erweitern Sie in der Modulpalette links den Bereich Datasets.
  3. Ziehen Sie das registrierte Dataset auf die Canvas.

Verwenden des Moduls „Daten importieren“

Führen Sie die folgenden Schritte aus, um Daten direkt in die Designer-Pipeline zu importieren:

  1. Erstellen Sie einen Datenspeicher, über den der Cloudspeicherdienst mit Ihrem Azure Machine Learning-Arbeitsbereich verbunden wird.

Nach dem Erstellen des Datenspeichers können Sie das Modul Daten importieren im Designer verwenden, um Daten daraus zu erfassen:

  1. Erstellen Sie einen neuen Designer-Pipelineentwurf.
  2. Suchen Sie in der Modulpalette links das Modul Daten importieren, und ziehen Sie es auf die Canvas.
  3. Wählen Sie das Modul Daten importieren aus, und verwenden Sie die Einstellungen im rechten Bereich, um die Datenquelle zu konfigurieren.

Nächste Schritte

In diesem Artikel haben Sie erfahren, wie Sie ein Studio (Classic)-Dataset zu Azure Machine Learning migrieren. Im nächsten Schritt erstellen Sie eine Studio (Classic)-Trainingspipeline neu.

Weitere Informationen finden Sie in den anderen Artikeln der Reihe zur Migration von Studio (Classic):

  1. Übersicht über die Migration.
  2. Migrieren von Datasets
  3. Neuerstellen einer Studio (Classic)-Trainingspipeline
  4. Neuerstellen eines Studio (Classic)-Webdiensts
  5. Integrieren eines Azure Machine Learning-Webdiensts in Clientanwendungen
  6. Migrieren von „R-Skript ausführen“-Modulen