Abrufen von Daten aus einer Datei
Die Datenerfassung ist der Prozess, mit dem Daten aus einer oder mehreren Quellen in eine Tabelle in Azure Data Explorer geladen werden. Nach der Erfassung sind die Daten für Abfragen verfügbar. In diesem Artikel erfahren Sie, wie Sie Daten aus einer lokalen Datei in eine neue oder vorhandene Tabelle abrufen.
Allgemeine Informationen zur Datenerfassung finden Sie unter Übersicht über die Azure Data Explorer-Datenerfassung.
Voraussetzungen
- Ein Microsoft-Konto oder eine Microsoft Entra Benutzeridentität. Ein Azure-Abonnement ist nicht erforderlich.
- Melden Sie sich bei der Azure Data Explorer-Webbenutzeroberfläche an.
- Schnellstart: Erstellen eines Azure Data Explorer-Clusters und einer Datenbank. Erstellen eines Clusters und einer Datenbank
Abrufen von Daten
Wählen Sie im Menü auf der linken Seite Abfrage aus.
Klicken Sie mit der rechten Maustaste auf die Datenbank, in der Sie die Daten erfassen möchten. Wählen Sie Daten abrufen aus.
Quelle
Im Fenster Daten abrufen ist die Registerkarte Quelle ausgewählt.
Wählen Sie die Datenquelle aus der liste verfügbar aus. In diesem Beispiel erfassen Sie Daten aus einer lokalen Datei.
Hinweis
Die Erfassung unterstützt eine maximale Dateigröße von 6 GB. Es wird empfohlen, Dateien zwischen 100 MB und 1 GB zu erfassen.
Konfigurieren
Wählen Sie eine Zieldatenbank und -tabelle aus. Wenn Sie Daten in einer neuen Tabelle erfassen möchten, wählen Sie + Neue Tabelle aus, und geben Sie einen Tabellennamen ein.
Hinweis
Tabellennamen können bis zu 1024 Zeichen umfassen, einschließlich Leerzeichen, alphanumerisch, Bindestrichen und Unterstrichen. Sonderzeichen werden nicht unterstützt.
Ziehen Sie entweder Dateien in das Fenster, oder wählen Sie Nach Dateien suchen aus.
Hinweis
Sie können bis zu 1.000 Dateien hinzufügen. Jede Datei kann maximal 1 GB unkomprimiert sein.
Wählen Sie Weiter aus.
Überprüfen
Die Registerkarte Überprüfen wird mit einer Vorschau der Daten geöffnet.
Um den Erfassungsprozess abzuschließen, wählen Sie Fertig stellen aus.
Optional:
- Wählen Sie Befehlsanzeige aus , um die automatischen Befehle anzuzeigen und zu kopieren, die aus Ihren Eingaben generiert werden.
- Verwenden Sie die Dropdownliste Schemadefinitionsdatei , um die Datei zu ändern, aus der das Schema abgeleitet wird.
- Ändern Sie das automatisch abgeleitete Datenformat, indem Sie das gewünschte Format aus der Dropdownliste auswählen. Informationen zur Erfassung finden Sie unter Von Azure Data Explorer unterstützte Datenformate.
- Bearbeiten von Spalten.
- Erkunden Sie erweiterte Optionen basierend auf dem Datentyp.
Spalten bearbeiten
Hinweis
- Bei tabellenbasierten Formaten (CSV, TSV, PSV) können Sie eine Spalte nicht zweimal zuordnen. Löschen Sie bei einer Zuordnung zu einer vorhandenen Spalte zunächst die neue Spalte.
- Der Typ einer vorhandenen Spalte kann nicht geändert werden. Wenn Sie als Zuordnungsziel eine Spalte mit einem anderen Format verwenden, erhalten Sie ggf. leere Spalten.
Die Änderungen, die Sie an einer Tabelle vornehmen können, hängen von den folgenden Parametern ab:
- Die Tabelle ist neu oder vorhanden.
- Die Zuordnung ist neu oder vorhanden.
Tabellentyp | Zuordnungstyp | Verfügbare Anpassungen |
---|---|---|
Neue Tabelle | Neue Zuordnung | Spalte umbenennen, Datentyp ändern, Datenquelle ändern, Zuordnungstransformation, Spalte hinzufügen, Spalte löschen |
Vorhandene Tabelle | Neue Zuordnung | Hinzufügen einer Spalte (für die Sie dann den Datentyp ändern, umbenennen und aktualisieren können) |
Vorhandene Tabelle | Vorhandene Zuordnung | Keine |
Zuordnungstransformationen
Einige der Datenformatzuordnungen (Parquet, JSON und Avro) unterstützen einfache Transformationen während der Erfassung. Um Zuordnungstransformationen anzuwenden, erstellen oder aktualisieren Sie eine Spalte im Fenster Spalten bearbeiten .
Zuordnungstransformationen können für eine Spalte vom Typ string oder datetime ausgeführt werden, wobei die Quelle den Datentyp int oder long aufweist. Die folgenden Zuordnungstransformationen werden unterstützt:
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconds
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
Erweiterte Optionen basierend auf dem Datentyp
Tabellarisch (CSV, TSV, PSV):
Wenn Sie tabellarische Formate in einer vorhandenen Tabelle erfassen, können Sie Erweitertes>Aktuelles Tabellenschema beibehalten auswählen. Tabellendaten enthalten nicht unbedingt die Spaltennamen, die verwendet werden, um Quelldaten den vorhandenen Spalten zuzuordnen. Wenn diese Option aktiviert ist, erfolgt die Zuordnung nach Reihenfolge, und das Tabellenschema bleibt unverändert. Wenn diese Option deaktiviert ist, werden neue Spalten für eingehende Daten erstellt, unabhängig von der Datenstruktur.
Um die erste Zeile als Spaltennamen zu verwenden, wählen Sie Erweitert>Erste Zeile ist Spaltenüberschrift aus.
JSON:
Um die Spaltenteilung von JSON-Daten zu bestimmen, wählen Sie Erweiterte>geschachtelte Ebenen von 1 bis 100 aus.
Wenn Sie Erweitert>Datenformatfehler ignorieren auswählen, werden die Daten im JSON-Format erfasst. Wenn Sie das Kontrollkästchen nicht aktivieren, werden die Daten im MultiJSON-Format erfasst.
Zusammenfassung
Im Fenster Datenaufbereitung sind alle drei Schritte mit grünen Häkchen gekennzeichnet, wenn die Datenerfassung erfolgreich abgeschlossen wurde. Sie können die Befehle anzeigen, die für jeden Schritt verwendet wurden, oder eine Karte auswählen, um die erfassten Daten abzufragen, zu visualisieren oder zu löschen.