Share via


Exportieren nach Azure Table

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

In diesem Artikel wird beschrieben, wie Sie die Option In Azure exportieren im Modul Daten exportieren in Machine Learning Studio (klassisch) verwenden.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Diese Option ist nützlich, wenn Sie Ergebnisse oder Zwischendaten aus einem Machine Learning-Experiment in eine Azure-Tabelle exportieren möchten. Der Azure-Tabellenspeicherdienst ist ein Datenverwaltungsdienst in Azure, der große Mengen strukturierter, nicht relationaler Daten speichern kann. Es handelt sich um einen NoSQL-Datenspeicher, der authentifizierte Aufrufe von innerhalb und außerhalb von Azure akzeptiert.

Exportieren von Daten in eine Azure-Tabelle

  1. Fügen Sie Ihrem Experiment das Modul Export Data hinzu. Sie finden dieses Modul in studio ( klassisch) in der Kategorie Dateneingabe und -ausgabe.

  2. Verbinden in das Modul, das die Daten erzeugt, die Sie in Azure Table Storage exportieren möchten.

  3. Geben Sie an, ob Sie Daten in eine öffentliche freigegebene Ressource oder in ein privates Speicherkonto exportieren möchten, für das Anmeldeinformationen erforderlich sind, indem Sie die Option Authentifizierungstyp festlegen.

    • Öffentlich (SAS-URL): Wählen Sie diese Option aus, wenn das Konto den Zugriff über die SAS-URL unterstützt. Geben oder fügen Sie im Feld Tabellen-SAS-URI den vollständigen URI ein, der das Konto und das öffentliche Blob definiert.

      Die SAS-URL ist eine zeitgebundene Zugriffs-URL, die Sie mithilfe eines Azure Storage-Hilfsprogramms generieren können. Auf einer Seite, auf die über die SAS-URL zugegriffen werden kann, können Daten nur in den folgenden Formaten gespeichert werden: CSV, TSV und ARFF.

    • Konto: Wählen Sie diese Option aus, wenn sich Ihre Daten in einem privaten Konto befindet. Sie müssen auch Anmeldeinformationen angeben, einschließlich des Kontonamens und des Schlüssels.

  4. Wenn Sie Ihre Daten in einen geschützten privaten Speicher exportieren möchten, geben Sie die Anmeldeinformationen an, die für den Zugriff auf das Konto erforderlich sind:

    • Tabellenkontoname: Geben Oder fügen Sie den Namen des Kontos ein, das das Blob enthält, auf das Sie zugreifen möchten. Wenn die vollständige URL des Speicherkontos z.B. https://myshared.table.core.windows.net lautet, geben Sie myshared ein.

    • Tabellenkontoschlüssel: Fügen Sie den Zugriffsschlüssel ein, der dem Speicherkonto zugeordnet ist.

    • Tabellenname: Geben Sie den Namen der spezifischen Tabelle ein, die Sie lesen möchten.

  5. Geben Sie mithilfe der Spalteneigenschaften an, welche Spalten im Tabellenspeicher gespeichert werden sollen und welche Spalten zum Definieren des Tabellenschemas verwendet werden sollen.

    • Partitionsschlüssel: Wählen Sie die Spalte aus, die zum Partitionieren des gespeicherten Datasets für die Tabelle im Azure Storage. Tabellen in Azure werden partitioniert, um den Lastenausgleich zwischen verschiedenen Speicherknoten zu unterstützen. Alle Tabellenentitäten sind nach Partition organisiert. Daher ist die PartitionKey-Eigenschaft für alle Tabellenvorgänge erforderlich.

    • Azure-Tabellenzeilenschlüssel: Wählen Sie die Spalte aus, die für die RowKey-Eigenschaft verwendet werden soll. Die RowKey-Eigenschaft ist eine Systemeigenschaft, die für jede Entität in einer Tabelle erforderlich ist. Zusammen mit der PartitionKey-Eigenschaft bildet sie einen eindeutigen Index für jede Zeile in der Tabelle.

    Hinweis

    Sie müssen unterschiedliche Spalten für RowKey undPartitionKey verwenden. Stellen Sie sicher, dass jede Spalte, die Sie für RowKey oder PartitionKey auswählen, auch in der Liste der Zielspalten enthalten ist, oder dass ein Fehler ausgelöst wird.

    • Azure Table Origin-Spalten: Wählen Sie alle zusätzlichen Spalten aus dem Dataset aus, das Sie in der Azure-Tabelle speichern möchten. Sie müssen auch die für PartitionKey und RowKey ausgewähltenSpalten hinzufügen.

    Weitere Informationen zu Tabellen in Azure Storage finden Sie unter Grundlegendes zum Tabellendienst-Datenmodell.

  6. Geben Sie die Namen der Spalten an, die in die Tabelle geschrieben werden sollen.

    Wichtig

    Sie müssen einen Spaltennamen für jede Spalte angeben, die Sie an die Tabelle ausgegeben haben, einschließlich RowKey, PartitionKey und allen Ursprungsspalten.

    Wenn die Von Ihnen angegebenen Spaltennamen nicht mit der Anzahl der Ausgabespalten übereinstimmen, wird ein Fehler ausgelöst.

    Wenn Sie neue Spaltennamen eingeben, müssen diese in der Reihenfolge der Spaltenindizes der Quellspalten angegeben werden.

  7. Azure-Tabellen-Schreibmodus: Geben Sie an, wie sich die Exportdaten verhalten sollen, wenn bereits Daten in der Azure-Tabelle vorhanden sind.

    • Einfügen: Der Insert Entity Vorgang fügt eine neue Entität mit einem eindeutigen Primärschlüssel ein, der aus einer Kombination der Eigenschaften PartitionKey und RowKey gebildet wird.

    • Zusammenführen: Der Vorgang Merge Entity aktualisiert eine vorhandene Entität, indem die Eigenschaften der Entität aktualisiert werden. Die vorhandene Entität wird bei diesem Vorgang nicht ersetzt.

    • Ersetzen: Der Update Entity Vorgang ersetzt den Inhalt der angegebenen Entität in einer Tabelle.

    • InsertOrReplace: Der InsertOrReplace Entity Vorgang fügt die Entität ein, wenn die Entität nicht vorhanden ist. Wenn die Entität vorhanden ist, wird die vorhandene ersetzt.

    • InsertOrMerge: Der InsertOrMerge Entity Vorgang fügt die Entität ein, wenn die Entität nicht vorhanden ist. Wenn die Entität vorhanden ist, werden die Eigenschaften der angegebenen Entität mit den bereits vorhandenen zusammengeführt.

  8. Zwischengespeicherte Ergebnisse verwenden: Geben Sie an, ob die Daten bei jeder Ausführung des Experiments aktualisiert werden sollen.

    Wenn Sie diese Option auswählen, speichert das Modul Daten exportieren daten bei der ersten Ausführung des Experiments in der angegebenen Tabelle und führt anschließend keine Schreibvorgänge durch, es sei denn, es gibt Upstreamänderungen.

    Wenn Sie diese Option deaktivieren, werden die Daten bei jeder Ausführung des Experiments in das Ziel geschrieben, unabhängig davon, ob die Daten identisch sind oder nicht.

  9. Führen Sie das Experiment aus.

Technische Hinweise

Dieser Abschnitt enthält Implementierungsdetails, Tipps und Antworten auf häufig gestellte Fragen.

Häufig gestellte Fragen

Warum habe ich beim Schreiben in eine vorhandene Tabelle einen Fehler erhalten?

Überprüfen Sie das Schema der Tabelle, um sicherzustellen, dass die Spaltennamen und Datentypen identisch sind. Beispielsweise wird in Azure Table Storage erwartet, dass die ID-Spalte eine Zeichenfolge ist.

Wenn Sie den Fehler Fehler 0027: Die Größe der übergebenen Objekte ist inkonsistent erhalten, überprüfen Sie, ob die Tabelle im angegebenen Container vorhanden ist. Derzeit kann Azure ML nur in vorhandene Tabellen schreiben.

Warum wird der Fehler angezeigt, dass eine vorhandene Spalte nicht gefunden werden kann?

Wenn Sie das Experiment nicht ausgeführt haben, werden Upstreamspalten manchmal nicht von den Exportdaten erkannt. Wenn Sie Upstreamänderungen im Experiment vornehmen, müssen Sie möglicherweise das Modul Daten exportieren entfernen und dann hinzufügen und neu konfigurieren.

Wie kann ich vermeiden, dass dieselben Daten unnötigerweise erneut geschrieben werden?

Wenn sich die Daten in Ihrem Experiment aus irgendeinem Grund ändern, schreibt das Modul Daten exportieren immer die neuen Daten.

Wenn Sie das Experiment jedoch mit anderen Änderungen ausführen, die sich nicht auf Ergebnisse auswirken, legen Sie die Option Zwischengespeicherte Ergebnisse verwenden auf TRUE fest. Das Modul überprüft, ob das Experiment zuvor mit den gleichen Optionen ausgeführt wurde, und wenn ein vorheriges Ergebnis gefunden wird, werden die Daten nicht in die Azure-Tabelle geschrieben.

Kann ich Daten in eine andere geografische Region exportieren?

Ja. Wenn sich das Speicherkonto jedoch in einer anderen Region befindet als der Computeknoten, der für das Machine Learning-Experiment verwendet wird, kann der Datenzugriff langsamer sein. Darüber hinaus werden Ihnen datenein- und ausgehende Daten im Abonnement in Rechnung gestellt.

Beispiele

Beispiele für die Verwendung dieser Machine Learning-Module finden Sie im Azure KI-Katalog.

Modulparameter

Öffentlich oder SAS : Öffentliche Optionen

Name Range type Standard Beschreibung
Tabellen-SAS-URI any Zeichenfolge

Konto – Optionen für private Konten

Name Range type Standard Beschreibung
Table account name
Table account key any SecureString

Speicheroptionen

Name Range type Standard Beschreibung
Tabellenname String Keine
Partitionsschlüssel any SecureString Keine Wählen Sie die Spalte aus, die beim Partitionieren der Tabelle als Schlüssel verwendet werden soll. Wenn keine Spalte ausgewählt ist, wird der Spaltenname als Partitionsschlüssel für alle Einträge verwendet.
Azure table row key any ColumnPicker Keine Wählen Sie die Spalte aus, die den eindeutigen Bezeichner für Tabellenzeilen enthält. Standardmäßig wird ein GUID-basierter Zeilenschlüssel verwendet.
Azure table origin columns any ColumnPicker Keine Geben Sie an, welche Spalten in die Tabelle aufgenommen werden sollen, entweder nach Name oder Spaltenindex.
Azure table destination columns any Zeichenfolge Keine Geben Sie die Namen der Spalten ein, die in der Zieltabelle verwendet werden sollen.
Azure table write mode List: Insert, Merge, Replace, InsertOrReplace, InsertOrMerge Enumeration Keine
Zwischengespeicherte Ergebnisse verwenden TRUE/FALSE Boolean FALSE Das Modul wird nur ausgeführt, wenn kein gültiger Cache vorhanden ist. verwenden andernfalls zwischengespeicherte Daten aus der vorherigen Ausführung.

Ausnahmen

Ausnahme Beschreibung
Fehler 0027 Eine Ausnahme tritt auf, wenn zwei Objekte gleich groß sein müssen, dies aber nicht der Fall ist.
Fehler 0003 Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.
Fehler 0029 Eine Ausnahme tritt auf, wenn ein ungültiger URI übergeben wird.
Fehler 0030 Eine Ausnahme tritt auf, wenn es nicht möglich ist, eine Datei herunterzuladen.
Fehler 0002 Eine Ausnahme tritt auf, wenn mindestens ein Parameter nicht analysiert oder nicht aus einem angegebenen Typ in den für die Zielmethode erforderlichen Typ konvertiert werden konnte.
Fehler 0009 Eine Ausnahme tritt auf, wenn der Azure-Speicherkontoname oder der Containername falsch angegeben ist.
Fehler 0048 Eine Ausnahme tritt auf, wenn es nicht möglich, eine Datei zu öffnen.
Fehler 0046 Eine Ausnahme tritt auf, wenn es nicht möglich ist, ein Verzeichnis im angegebenen Pfad zu erstellen.
Fehler 0049 Eine Ausnahme tritt auf, wenn es nicht möglich, eine Datei zu analysieren.

Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.

Eine Liste der API-Ausnahmen finden Sie unter Machine Learning REST-API-Fehlercodes.

Siehe auch

Daten importieren
Daten exportieren
Exportieren nach Azure SQL-Datenbank
Exportieren in Azure Blob Storage
Exportieren nach Hive-Abfrage