Abrufen von Daten aus OneLake

In diesem Artikel erfahren Sie, wie Sie Daten aus OneLake in eine neue oder vorhandene Tabelle abrufen.

Voraussetzungen

Kopieren des Dateipfads aus Lakehouse

  1. Wählen Sie im Umschalter für die Benutzeroberfläche Datentechnik aus.

  2. Wählen Sie die Lakehouse-Umgebung aus, die die Datenquelle enthält, die Sie verwenden möchten.

  3. Platzieren Sie den Cursor über der gewünschten Datei, und wählen Sie das Menü Mehr und dann Eigenschaften aus.

    Wichtig

    • Ordnerpfade werden nicht unterstützt.
    • Platzhalter (*) werden nicht unterstützt.

    Screenshot of a Lakehouse file's dropdown menu. The option titled Properties is highlighted.

  4. Wählen Sie unter URL das Symbol In Zwischenablage kopieren aus, und speichern Sie sie an einer beliebigen Stelle, um sie in einem späteren Schritt wieder abzurufen.

    Screenshot of a Lakehouse file's Properties pane. The copy icon to the right of the file's URL is highlighted.

  5. Kehren Sie zu Ihrem Arbeitsbereich zurück, und wählen Sie eine KQL-Datenbank aus.

Source

  1. Wählen Sie im unteren Menüband Ihrer KQL-Datenbank Daten abrufen aus.

    Im Fenster Daten abrufen ist die Registerkarte Quelle ausgewählt.

  2. Wählen Sie die Datenquelle aus der verfügbaren Liste aus. In diesem Beispiel erfassen Sie Daten aus OneLake.

    Screenshot of get data window with source tab selected.

Konfigurieren

  1. Wählen Sie eine Zieltabelle aus. Wenn Sie Daten in eine neue Tabelle erfassen möchten, wählen Sie +Neue Tabelle aus, und geben Sie einen Tabellennamen ein.

    Hinweis

    Tabellennamen können bis zu 1024 Zeichen umfassen und alphanumerische Zeichen, Bindestriche und Unterstriche enthalten. Sonderzeichen werden nicht unterstützt.

  2. Fügen Sie unter OneLake Datei den Dateipfad des Lakehouse ein, den Sie unter Kopieren des Dateipfads aus Lakehouse kopiert haben.

    Hinweis

    Sie können jeweils bis zu 10 Elemente von bis zu 1 GB dekomprimiert Größe hinzufügen.

    Screenshot of configure tab with new table entered and a OneLake file path added.

  3. Wählen Sie Weiter aus.

Inspizieren

Die Registerkarte Prüfen wird mit einer Vorschau der Daten geöffnet.

Um den Erfassungsvorgang abzuschließen, wählen Sie Fertig stellen aus.

Screenshot of the inspect tab.

Optional:

Bearbeiten von Spalten

Hinweis

  • Bei Tabellenformaten (CSV, TSV, PSV) können Sie eine Spalte nicht zweimal zuordnen. Löschen Sie bei einer Zuordnung zu einer vorhandenen Spalte zunächst die neue Spalte.
  • Der Typ einer vorhandenen Spalte kann nicht geändert werden. Wenn Sie als Zuordnungsziel eine Spalte mit einem anderen Format verwenden, erhalten Sie ggf. leere Spalten.

Die Änderungen, die Sie an einer Tabelle vornehmen können, hängen von den folgenden Parametern ab:

  • Die Tabelle ist neu oder vorhanden.
  • Die Zuordnung ist neu oder vorhanden.
Tabellentyp Zuordnungstyp Verfügbare Anpassungen
Neue Tabelle Neue Zuordnung Spalte umbenennen, Datentyp ändern, Datenquelle ändern, Zuordnungstransformation, Spalte hinzufügen, Spalte löschen
Vorhandene Tabelle Neue Zuordnung Spalte hinzufügen (für die Sie dann den Datentyp ändern und die Sie umbenennen und aktualisieren können)
Vorhandene Tabelle Vorhandene Zuordnung Keine

Screenshot of columns open for editing.

Zuordnungstransformationen

Einige der Datenformatzuordnungen (Parquet, JSON und Avro) unterstützen einfache Transformationen während der Erfassung. Erstellen oder aktualisieren Sie zum Anwenden von Zuordnungstransformationen eine Spalte im Fenster Spalten bearbeiten.

Zuordnungstransformationen können für eine Spalte ausgeführt werden, für die als Typ der Wert „string“ oder „datetime“ und für Quelle der Datentyp „int“ oder „long“ angegeben ist. Die folgenden Zuordnungstransformationen werden unterstützt:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Erweiterte Optionen basierend auf dem Datentyp

Tabellarisch (CSV, TSV, PSV):

  • Wenn Sie Tabellenformate in eine bestehende Tabelle übernehmen, wählen Sie Erweitert>Tabellenschema beibehalten aus. Tabellendaten enthalten nicht unbedingt die Spaltennamen, die verwendet werden, um Quelldaten den vorhandenen Spalten zuzuordnen. Wenn diese Option aktiviert ist, wird die Zuordnung nach der geltenden Reihenfolge durchgeführt, und das Tabellenschema bleibt unverändert. Wenn diese Option deaktiviert ist, werden unabhängig von der Datenstruktur neue Spalten für eingehende Daten erstellt.

  • Wählen Sie Erweitert>Erste Zeile ist Spaltenüberschrift, um die erste Zeile als Spaltennamen zu verwenden.

    Screenshot of advanced CSV options.

JSON:

  • Wählen Sie Erweitert>Verschachtelte Ebenen, von 1 bis 100, um die Spaltenaufteilung der JSON-Daten festzulegen.

  • Wenn Sie Erweitert>JSON-Zeilen mit Fehlern überspringen wählen, werden die Daten im JSON-Format eingelesen. Wenn Sie das Kontrollkästchen nicht aktivieren, werden die Daten im MultiJSON-Format erfasst.

    Screenshot of advanced JSON options.

Zusammenfassung

Im Fenster Datenaufbereitung werden alle drei Schritte mit grünen Häkchen markiert, wenn die Datenerfassung erfolgreich abgeschlossen wurde. Sie können eine Karte auswählen, die abgefragt werden soll, die aufgenommenen Daten ablegen oder ein Dashboard Ihrer Erfassungszusammenfassung anzeigen.

Screenshot of summary page with successful ingestion completed.