Exportieren von Daten

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Schreibt ein Dataset in verschiedene Arten von cloudbasiertem Speicher in Azure, z. B. Tabellen, Blobs und Azure SQL Datenbanken.

Kategorie: Dateneingabe und -ausgabe

Hinweis

Gilt nur für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Export Data in Machine Learning Studio (klassisch) verwenden, um Ergebnisse, Zwischendaten und Arbeitsdaten aus Ihren Experimenten in Cloudspeicherzielen außerhalb von Machine Learning Studio (klassisch) zu speichern.

Dieses Modul unterstützt das Exportieren oder Speichern von Daten in folgenden Clouddatendiensten:

  • Nach Hive-Abfrage exportieren: Schreiben von Daten in eine Hive-Tabelle in einem HDInsight Hadoop-Cluster.

  • In Azure SQL-Datenbank exportieren: Speichern Sie Daten in Azure SQL-Datenbank oder in Azure SQL Data Warehouse.

  • In Azure-Tabelle exportieren: Speichern Sie Daten im Tabellenspeicherdienst in Azure. Table Storage eignet sich gut zum Speichern großer Datenmengen. Es bietet ein tabellarisches Format, das skalierbar, kostengünstig und hochverfükbar ist.

  • Exportieren in Azure Blob Storage: Speichert Daten im Blob-Dienst in Azure. Diese Option eignet sich für Bilder, unstrukturierten Text oder Binärdaten. Daten im Blob-Dienst können öffentlich freigegeben oder in gesicherten Anwendungsdatenspeichern gespeichert werden.

Hinweis

Das Modul "Daten exportieren" unterstützt keine Verbindung mit dem Azure Blob Storage-Konto, wenn die Option "Sichere Übertragung erforderlich" aktiviert ist.

  • Herunterladen von Daten: Um Ihre Daten herunterzuladen, sodass Sie sie in Excel oder einer anderen Anwendung öffnen können, verwenden Sie ein Modul wie In CSV konvertieren oder In TSV konvertieren, um die Daten in einem bestimmten Format vorzubereiten, und laden Sie dann die Daten herunter.

  • Sie können die Ergebnisse jedes Moduls herunterladen, das ein Dataset ausgibt, indem Sie mit der rechten Maustaste auf die Ausgabe klicken und Dataset herunterladen auswählen. Standardmäßig werden die Daten im CSV-Format exportiert.

  • Laden Sie eine Moduldefinition oder einen Experimentgraphen herunter: Mit einer neuen PowerShell-Bibliothek können Sie die vollständigen Metadaten für Ihr Experiment oder die Details für ein bestimmtes Modul herunterladen. Die PowerShell für Machine Learning-Bibliothek ist ein experimentelles Release, verfügt aber über viele nützliche Cmdlets:

    • Get-AmlExperiment listet alle Experimente in einem Arbeitsbereich auf.
    • Export-AmlExperimentGraph exportiert eine Definition des vollständigen Experiments in eine JSON-Datei.
    • Download-AmlExperimentNodeOutput können Sie die Informationen extrahieren, die an den Ausgabeports eines beliebigen Moduls bereitgestellt werden.

Gewusst wie: Konfigurieren von „Export Data“

  1. Fügen Sie ihrem Experiment in Studio (klassisch) das Modul Export Data hinzu. Sie finden dieses Modul in der Kategorie Input and Output (Eingabe und Ausgabe).

  2. Verbinden Exportieren von Daten in das Modul, das die zu exportierenden Daten enthält.

  3. Doppelklicken Sie auf Export Data, um den Bereich Properties (Eigenschaften) zu öffnen.

  4. Wählen Sie für Data destination (Datenziel) den Typ des Cloudspeichers aus, in dem Sie Ihre Daten speichern möchten. Wenn Sie diese Option ändern, werden alle anderen Eigenschaften zurückgesetzt. Legen Sie deshalb diese Option zuerst fest!

  5. Geben Sie einen Kontonamen und eine Authentifizierungsmethode an, die für den Zugriff auf das angegebene Speicherkonto erforderlich sind.

    Abhängig vom Speichertyp und davon, ob das Konto gesichert ist, müssen Sie möglicherweise den Kontonamen, Dateityp, Zugriffsschlüssel oder Containernamen angeben. Für Quellen, für die keine Authentifizierung erforderlich ist, ist es im Allgemeinen ausreichend, die URL zu kennen.

    Beispiele für die einzelnen Typen finden Sie in den folgenden Themen:

  6. Mit der Option Zwischengespeicherte Ergebnisse verwenden können Sie das Experiment wiederholen, ohne jedes Mal dieselben Ergebnisse neu zu schreiben.

    Wenn Sie diese Option deaktivieren, werden die Ergebnisse bei jeder Ausführung des Experiments in den Speicher geschrieben, unabhängig davon, ob sich die Ausgabedaten geändert haben.

    Wenn Sie diese Option auswählen, verwendet Daten exportieren zwischengespeicherte Daten, sofern verfügbar. Neue Ergebnisse werden nur generiert, wenn eine Upstreamänderung vorliegt, die sich auf die Ergebnisse auswirken würde.

  7. Führen Sie das Experiment aus.

Beispiele

Beispiele für die Verwendung des Moduls Export Data finden Sie im Azure KI-Katalog:

Technische Hinweise

Dieser Abschnitt enthält Implementierungsdetails, Tipps und Antworten auf häufig gestellte Fragen.

Details zur Implementierung

  • Dieses Modul hatte zuvor den Namen Writer. Wenn Sie über ein vorhandenes Experiment verfügen, das das Writer-Modul verwendet, wird das Modul in Daten exportieren umbenannt, wenn Sie das Experiment aktualisieren.

  • Nicht alle Module erzeugen eine Ausgabe, die mit Export Data-Zielen kompatibel ist. Daten exportieren kann beispielsweise kein Dataset speichern, das in das SVMLight-Format konvertiert wurde. Export Data unterstützt die folgenden Formate:

    • Dataset (internes Azure ML-Format)
    • .NET DataTable
    • CSV mit oder ohne Header
    • TSV mit oder ohne Header

Bekannte Probleme

  • Wenn Sie Azure Table als Speicherort für die Ausgabe Ihrer Daten auswählen, kann es gelegentlich zu einem Fehler beim Schreiben in die angegebene Tabelle kommen. In diesem Fall werden die Daten möglicherweise stattdessen in ein Blob geschrieben.

    Wenn dieser Fehler auftritt und Sie später nicht mehr aus der erwarteten Tabelle lesen können, versuchen Sie, die Blobs im angegebenen Container in Ihrem Speicherkonto mithilfe eines Azure Storage-Hilfsprogramms zu überprüfen.

  • Derzeit können Sie ein Blob nicht in einer angegebenen Hive-Tabelle speichern. Wenn Sie Zwischenergebnisse schreiben müssen, vermeiden Sie die Verwendung einer Hive-Tabelle in HDInsight, und verwenden Sie stattdessen Blob Storage oder Table Storage.

  • Wenn Sie derzeit HDFS als Speicherort zum Speichern von Ausgabedaten auswählen, wird die folgende Fehlermeldung zurückgegeben: "Microsoft.Analytics.Exceptions.ErrorMapping+ModuleException".

Erwartete Eingaben

Name Type Beschreibung
Dataset Datentabelle Das Dataset, das geschrieben werden soll.

Modulparameter

Diese Tabelle enthält Parameter, die für alle Export Data-Optionen gelten. Andere Parameter sind dynamisch und ändern sich je nach ausgewähltem Datenziel.

Name Range type Standard Beschreibung
Please specify data destination Liste DataSourceOrSink Blob-Dienst in Azure Storage Geben Sie an, ob das Datenziel eine Datei im Blob-Dienst, eine Datei im Tabellenspeicherdienst, eine SQL-Datenbank in Azure oder eine Hive-Tabelle ist.
Zwischengespeicherte Ergebnisse verwenden TRUE/FALSE Boolean FALSE Wählen Sie diese Option aus, um zu vermeiden, dass Ergebnisse unnötig neu geschrieben werden. Wenn sich etwas im Upstream des Experiments ändert, führt Export Data immer aus und schreibt neue Ergebnisse. Wenn sich jedoch nichts geändert hat und Sie diese Option ausgewählt haben, wird Daten exportieren nicht ausgeführt, um zu vermeiden, dass die gleichen Ergebnisse neu geschrieben werden.

Ausnahmen

Ausnahme Beschreibung
Fehler 0057 Eine Ausnahme tritt auf, wenn versucht wird, eine Datei oder ein Blob zu erstellen, die oder das bereits vorhanden ist.
Fehler 0001 Eine Ausnahme tritt auf, wenn mindestens eine angegebene Spalte des Datasets nicht gefunden werden konnte.
Fehler 0027 Eine Ausnahme tritt auf, wenn zwei Objekte gleich groß sein müssen, dies aber nicht der Fall ist.
Fehler 0079 Eine Ausnahme tritt auf, wenn der Containername in Azure Storage falsch angegeben wird.
Fehler 0052 Eine Ausnahme tritt auf, wenn der Speicherzugriffsschlüssel für das Azure-Konto falsch angegeben wird.
Fehler 0064 Eine Ausnahme tritt auf, wenn der Kontoname oder der Speicherzugriffsschlüssel für das Azure-Konto falsch angegeben wird.
Fehler 0071 Eine Ausnahme tritt auf, wenn die angegebenen Anmeldeinformationen falsch sind.
Fehler 0018 Eine Ausnahme tritt auf, wenn das Eingabedataset ungültig ist.
Fehler 0029 Eine Ausnahme tritt auf, wenn ein ungültiger URI übergeben wird.
Fehler 0003 Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.

Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.

Eine Liste der API-Ausnahmen finden Sie unter Machine Learning REST-API-Fehlercodes.

Siehe auch

Daten importieren
Dateneingabe und -ausgabe
Datentransformation
Azure-Tabellenspeicher und Azure SQL-Datenbank – Vergleich und Gegenüberstellung
Modulliste von A bis Z