Freigeben über


Importieren und Abfragen von Daten mithilfe des Azure Databricks Excel-Add-Ins

Von Bedeutung

Dieses Feature befindet sich in der Public Preview.

Das Azure Databricks Excel-Add-In verbindet Ihren Azure Databricks Arbeitsbereich mit Microsoft Excel, gesteuerte Lakehouse-Daten direkt in Ihre Tabellenkalkulationen zu bringen, damit Sie von Daten zu Entscheidungen schneller wechseln können.

Auf dieser Seite wird beschrieben, wie Sie das Azure Databricks Excel-Add-In zum Importieren und Analysieren von Daten aus Azure Databricks in Excel verwenden. Sie können Azure Databricks Tabellen über eine intuitive Benutzeroberfläche durchsuchen und importieren, in der keine SQL-Kenntnisse erforderlich sind. Während das Add-In die Flexibilität zum Ausführen benutzerdefinierter SQL-Abfragen bietet, ist es optional.

Voraussetzungen

Stellen Sie vor der Verwendung des Excel-Add-Ins sicher, dass es eingerichtet ist.

Auswählen eines SQL-Lagerlagers

Wählen Sie aus, welches SQL-Lager verwendet werden soll:

  1. Klicken Sie oben rechts im Add-In-Bereich Azure Databricks in Excel auf das Dropdownmenü.
  2. Wählen Sie aus, welches SQL-Lagerhaus Sie verwenden möchten.

Importieren von Daten aus Azure Databricks

Importieren Sie Daten aus Azure Databricks in Excel, indem Sie eine Tabelle auswählen, eine SQL-Abfrage schreiben oder eine PivotTable importieren.

Hinweis

Sie können Metrikansichten des Unity-Katalogs mithilfe von PivotTables, SQL-Abfragen und benutzerdefinierten Funktionen importieren.

PivotTables erstellen

So erstellen Sie eine PivotTable aus Unity-Katalogtabellen und -ansichten in Excel:

  1. Wählen Sie im Azure Databricks Excel-Add-In-Bereich unter der Registerkarte Neuer ImportAuswahldaten als Import-Methode aus.

  2. Wählen Sie unter "Katalog" die Tabelle aus, aus der Sie eine PivotTable erstellen möchten, und klicken Sie auf "Auswählen".

  3. Aktivieren Sie das Kontrollkästchen "Pivotdaten ".

  4. Konfigurieren Sie Ihre Zeile, Spalte, Wert und Filter nach Bedarf.

  5. (Optional) Wenn Sie ein Beispiel für den Import anzeigen möchten, klicken Sie auf "Vorschau".

  6. (Optional) Legen Sie einen Zeilengrenzwert für den Import fest.

  7. Importieren Sie Ihre Ergebnisse. Wählen Sie eine der folgenden Optionen aus:

    • Klicken Sie auf Speichern und importieren, um die Abfrage zur Wiederverwendung in der Excel Arbeitsmappe zu speichern und die Ergebnisse zu importieren.
    • Klicken Sie auf den Abwärtspfeil, und klicken Sie dann auf " Ergebnisse importieren", um die Ergebnisse zu importieren, ohne die Abfrage zu speichern. Verwenden Sie diese Option, wenn Sie mit der Bearbeitung eines Imports fortfahren möchten.

    Hinweis

    PivotTables können nur in ein neues Blatt importiert werden.

Wenn Sie mit Unity-Katalogmetriken in PivotTables arbeiten, könnte Sum(measure) in den Ergebnissen angezeigt werden. Dies wird erwartet, und es tritt keine zusätzliche Aggregation auf. Excel erfordert, dass Werte über eine Aggregationsfunktion verfügen, aber da die Daten eindeutige Werte enthalten, tritt keine Aggregation auf.

Tabellen auswählen

Daten werden als Excel-Tabelle-Objekt importiert. Sie können die Tabelle verschieben oder das Blatt umbenennen, und das Excel-Add-In aktualisiert Daten an der neuen Position.

Gehen Sie wie folgt vor, um Daten aus einer Azure Databricks Tabelle zu importieren:

  1. Wählen Sie im Azure Databricks Excel-Add-In-Bereich unter der Registerkarte Neuer ImportAuswahldaten als Import-Methode aus.

  2. Wählen Sie eine Tabelle aus, die aus dem Katalog-Explorer importiert werden soll. Sie können den Katalog mithilfe des Schiebereglersymbols nach Besitzer, Zertifizierungsstatus und anderen Eigenschaften filtern.

  3. Klicke auf Auswählen.

  4. Klicken Sie unter "Spalten" auf den Abwärtspfeil, und deaktivieren Sie die Auswahl der Spalten, die Sie nicht importieren möchten, oder lassen Sie alle Spalten ausgewählt, um die gesamte Tabelle zu importieren.

  5. (Optional) Wenn Sie Filter festlegen möchten, klicken Sie neben +", wählen Sie die Spalte aus, auf die Sie einen Filter anwenden möchten, und geben Sie dann die Filterbedingung ein. Eine Liste der verfügbaren Filter finden Sie unter "Unterstützte Filter".

    Für Filter, die einen Wert erfordern, können Sie eine der folgenden Aktionen ausführen:

    • Geben Sie den Wert ein.
    • Um eine Liste mit bis zu 75 unterschiedlichen Filterwerten zu generieren, die Sie verwenden können, klicken Sie auf "Werte" und dann auf "Filterwerte abrufen". Klicken Sie auf den Abwärtspfeil, und wählen Sie einen oder mehrere Werte aus der Liste aus.
    • Wenn Sie einen Zellbezug verwenden möchten, klicken Sie auf "Zellen", wählen Sie eine Zelle oder einen Zellbereich aus, und klicken Sie dann auf die Cursorschaltfläche.

    Hinweis

    Filterwerte können kein Komma enthalten. Verwenden Sie zum Filtern nach Werten, die Kommas enthalten, stattdessen die Write SQL-Importmethode .

  6. (Optional) Wenn Sie ein Beispiel für den Import anzeigen möchten, klicken Sie auf "Vorschau".

  7. (Optional) Sie können einen Zeilengrenzwert festlegen, um die Anzahl der importierten Zeilen einzuschränken.

  8. (Optional) Um ihre importierten Daten auf einfache Weise zu identifizieren, können Sie einen Importnamen eingeben.

  9. Wählen Sie unter "Ausgabeziel" aus, ob die Daten in ein neues Blatt oder das aktuelle Blatt importiert werden sollen. Wenn Sie in das aktuelle Blatt importieren, beginnen die Daten beim eingegebenen Zellbezug (standardmäßig A1).

  10. Importieren Sie Ihre Ergebnisse. Wählen Sie eine der folgenden Optionen aus:

    • Klicken Sie auf Speichern und importieren, um die Abfrage zur Wiederverwendung in der Excel Arbeitsmappe zu speichern und die Ergebnisse zu importieren.
    • Klicken Sie auf den Abwärtspfeil, und klicken Sie dann auf " Ergebnisse importieren", um die Ergebnisse zu importieren, ohne die Abfrage zu speichern. Verwenden Sie diese Option, wenn Sie mit der Bearbeitung eines Imports fortfahren möchten.

Unterstützte Filter

Wenn Sie Daten importieren, indem Sie eine Tabelle auswählen, können Sie Filter anwenden, um die Ergebnisse einzuschränken. In der folgenden Tabelle werden die einzelnen verfügbaren Filter und die erwarteten Eingaben beschrieben.

Filter Erwartete Eingabe Beschreibung
IS NULL Nichts Sucht Zeilen, bei denen der Spaltenwert null ist.
IS NOT NULL Nichts Sucht Zeilen, bei denen der Spaltenwert nicht NULL ist.
EQUALS Eine Zahl oder Eine Textzeichenfolge Sucht Zeilen, in denen der Spaltenwert exakt mit dem angegebenen Wert übereinstimmt.
NOT EQUALS Eine Zahl oder Eine Textzeichenfolge Sucht Zeilen, in denen der Spaltenwert nicht mit dem angegebenen Wert übereinstimmt.
IN Eine oder mehrere Zahlen oder Textzeichenfolgen, getrennt durch Kommas Sucht Zeilen, in denen der Spaltenwert mit einem der angegebenen Werte übereinstimmt.
NOT IN Eine oder mehrere Zahlen oder Textzeichenfolgen, getrennt durch Kommas Sucht Zeilen, bei denen der Spaltenwert keinem der angegebenen Werte entspricht.
LIKE Ein Muster, das % (beliebige Zeichen) und _ (ein einzelnes Zeichen) als Wildcards verwendet.
%smith entspricht einem beliebigen Wert, der in "smith" endet.
t_p passt zu Werten wie "tap", "tip" oder "top".
Sucht Zeilen, in denen der Spaltenwert dem Muster entspricht. Groß-/Kleinschreibung wird beachtet,
NOT LIKE Ein Muster, das % (beliebige Zeichen) und _ (einzelnes Zeichen) als Wildcards verwendet.
%test% schließt Werte aus, die "test" enthalten.
_at schließt Werte wie "Bat", "Katze" oder "Hut" aus.
Sucht Zeilen, bei denen der Spaltenwert nicht mit dem Muster übereinstimmt. Groß-/Kleinschreibung wird beachtet,
ILIKE Ein Muster, das % (beliebige Zeichen) und _ (ein einzelnes Zeichen) als Wildcards verwendet.
%Smith entspricht Werten wie "smith", "Smith" oder "SMITH".
_ob passt zu "Bob", "rob" oder "Rob".
Sucht Zeilen, in denen der Spaltenwert dem Muster entspricht. Groß-/Kleinschreibung wird nicht beachtet.
STARTS WITH Eine Textzeichenfolge Sucht Zeilen, in denen der Spaltenwert mit dem angegebenen Text beginnt.
ENDS WITH Eine Textzeichenfolge Sucht Zeilen, in denen der Spaltenwert mit dem angegebenen Text endet.
CONTAINS Eine Textzeichenfolge Sucht Zeilen, in denen der Spaltenwert den angegebenen Text an einer beliebigen Stelle in der Zeichenfolge enthält.

Schreiben von SQL-Abfragen

Die Write SQL-Importmethode unterstützt SQL-Funktionen und gespeicherte Prozeduren.

Gehen Sie wie folgt vor, um benutzerdefinierte SQL-Abfragen für Ihren Azure Databricks Arbeitsbereich auszuführen:

  1. Wählen Sie im Add-In-Bereich Azure Databricks Excel unter der Registerkarte Neuer ImportWrite SQL als Import-Methode aus.

  2. Geben Sie einen Namen für Ihre Abfrage ein, um sie später zu identifizieren.

  3. Schreiben Sie eine neue Abfrage, oder verwenden Sie eine vorhandene Abfrage aus Ihrem Azure Databricks Arbeitsbereich.

    • Schreiben Sie Ihre SQL-Abfrage im Editor. Sie können eine beliebige Tabelle im Unity-Katalog abfragen, auf die Sie über Zugriffsberechtigungen verfügen.

      • Klicken Sie auf das Symbol Katalog-Explorer zum Anzeigen Ihrer Schemas und Tabellen.
    • Wenn Sie eine Abfrage aus Ihrem Azure Databricks Arbeitsbereich oder einer vorhandenen Abfrage in Excel verwenden möchten, klicken Sie auf Folder icon. den Ordner. Wenn Sie eine vorhandene Abfrage aus Ihrem Azure Databricks Arbeitsbereich verwenden, werden in Excel vorgenommene Bearbeitungen nicht auf Azure Databricks wiedergegeben.

      Hinweis

      Abfragen müssen explizit in Azure Databricks mithilfe der Schaltfläche Speichern im Abfrage-Editor gespeichert werden, bevor sie in Excel angezeigt werden.

  4. (Optional) Wenn Sie Abfrageparameter hinzufügen möchten, klicken Sie neben "Parameter" auf "+Hinzufügen". Klicken Sie auf den Parameter, und geben Sie den Parameternamen und den Parameterwert ein.

    • Für den Parameterwert können Sie entweder einen bestimmten Wert eingeben oder auf das Feld und die Pfeilschaltfläche klicken, um einen Zellbezug anzugeben. Markieren Sie eine Zelle oder einen Zellbereich, und klicken Sie auf den Pfeil, um den Parameterwert automatisch auszufüllen.
  5. Wählen Sie unter "Ausgabeziel" aus, ob die Daten in ein neues Blatt oder das aktuelle Blatt importiert werden sollen. Wenn Sie in das aktuelle Blatt importieren, beginnen die Daten beim eingegebenen Zellbezug (standardmäßig A1).

  6. Klicken Sie auf "Ausführen", um eine Vorschau der Abfrageergebnisse anzuzeigen.

  7. Importieren Sie Ihre Ergebnisse. Wählen Sie eine der folgenden Optionen aus:

    • Klicken Sie auf Speichern und importieren, um die Abfrage zur Wiederverwendung in der Excel Arbeitsmappe zu speichern und die Ergebnisse zu importieren.
    • Klicken Sie auf den Abwärtspfeil, und klicken Sie dann auf " Ergebnisse importieren", um die Ergebnisse zu importieren, ohne die Abfrage zu speichern. Verwenden Sie diese Option, wenn Sie mit der Bearbeitung eines Imports fortfahren möchten.

Sie können auch benutzerdefinierte Funktionen verwenden, um Abfrageparameter hinzuzufügen. Siehe Schreiben von SQL.

Nutzung benutzerdefinierter Funktionen in Excel

Das Excel-Add-In stellt benutzerdefinierte Funktionen bereit, die Sie in Excel Formeln verwenden können, um Daten aus Azure Databricks zu importieren.

Auswählen einer Tabelle

Die DATABRICKS.Table Funktion importiert Daten aus einer Unity-Katalogtabelle.

Syntax:

=DATABRICKS.Table(catalog_name.schema_name.table_name, [column1, ...], [limit])

Parameter:

  • catalog_name.schema_name.table_name (erforderlich): Der vollqualifizierte Tabellenname.
  • columns (optional): Ein Array von Spaltennamen, die importiert werden sollen. Lassen Sie diesen Parameter aus, um alle Spalten zu importieren.
  • limit (optional): Die maximale Anzahl der zu importierenden Zeilen. Lassen Sie diesen Parameter aus, um alle Zeilen bis zum Grenzwert von 10 MB zu importieren.

Example:

=DATABRICKS.Table("main.default.customers", {"customer_id", "customer_name"}, 100)

Mit dieser Formel werden die customer_id Und customer_name Spalten aus der main.default.customers Tabelle importiert, die auf 100 Zeilen beschränkt sind.

SQL schreiben

Die DATABRICKS.SQL Funktion führt eine SQL-Abfrage aus, die Abfrageparameter verwendet und die Ergebnisse zurückgibt.

Syntax:

Geben Sie Parameter mithilfe von Werten an.

=DATABRICKS.SQL("query_text", {parameter1_name, parameter1_value; ...})

Geben Sie Parameter mithilfe eines Zellbereichs an. Die Parameter "Name" und "Wert" müssen in Zellen definiert werden, die sich in derselben Zeile befinden.

=DATABRICKS.SQL("query_text", {param_name_cell: param_value_cell; ...})

Parameter:

  • query_text (erforderlich): Die auszuführende SQL-Abfrage.
  • parameters (erforderlich): Eine Zuordnung von Parameterwerten, die in die Abfrage ersetzt werden sollen.

Example:

=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE longitude > :long_param AND latitude > :lat_param LIMIT 10", {"long_param",20; "lat_param",10})

=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE city = :city", M4:N4)

Mit dieser Formel wird eine Abfrage ausgeführt, die Verkaufsdaten durch longitude und latitude mithilfe der bereitgestellten Parameterwerte filtert.

Verwalten von Abfragen

Verwalten Sie Ihre vorhandenen Importe von der Importseite.

Bearbeiten eines vorhandenen Imports

So bearbeiten Sie einen vorhandenen Import:

  1. Klicken Sie im Azure Databricks-Add-In-Bereich in Excel auf die Registerkarte Imports.
  2. Suchen Sie den Import, den Sie bearbeiten möchten.
  3. Klicken Sie neben dem Import auf das Dreipunktmenü.
  4. Klicken Sie auf "Bearbeiten ", um den Import zu bearbeiten.

Aktualisieren von Daten

Das Excel-Add-In aktualisiert nicht automatisch importierte Daten. So aktualisieren Sie Ihre Daten mit den neuesten Werten aus Azure Databricks:

  • Gehen Sie wie folgt vor, um einen einzelnen Import zu aktualisieren:
    1. Klicken Sie im Azure Databricks-Add-In-Bereich in Excel auf die Registerkarte Imports.
    2. Klicken Sie auf das Aktualisieren-Symbol , um die Aktualisierung neben dem Import, den Sie aktualisieren möchten, durchzuführen.
  • Gehen Sie wie folgt vor, um alle Importe zu aktualisieren:
    1. Klicken Sie im Bereich des Azure Databricks Add-Ins auf Alle aktualisieren.

Das Add-In führt die ursprüngliche Abfrage- oder Tabellenauswahl erneut aus und aktualisiert das Arbeitsblatt mit neuen Daten.

Von Bedeutung

Beim Aktualisieren von Daten löscht das Excel-Add-In alle vorhandenen Daten in der angegebenen Tabelle und lädt die neuesten Daten aus Azure Databricks neu. Alle benutzerdefinierten Spalten, die Sie der Tabelle hinzugefügt haben, werden während des Aktualisierungsprozesses gelöscht.

Teilen von Auswirkungen

Wenn Sie eine Excel Arbeitsmappe freigeben, die Azure Databricks Daten enthält, sollten Sie die folgenden Auswirkungen auf den Datenzugriff und die Sicherheit berücksichtigen:

Sichtbarkeit für importierte Daten

Wenn ein Empfänger einen Import aktualisiert, verwendet das Add-In die Unity-Katalogberechtigungen des Empfängers. Wenn sie keinen Zugriff auf die zugrunde liegenden Daten haben, schlägt die Aktualisierung fehl.

Für Arbeitsmappen, bei denen der Datenschutz ein Problem darstellt, können Sie die folgende Problemumgehung verwenden:

  1. Erstellen Sie eine Arbeitsmappe mit allen erforderlichen Formeln und Importen.
  2. Löschen Sie die importierten Daten aus dem Blatt.
  3. Freigeben der Arbeitsmappe für den Empfänger.
  4. Lassen Sie den Empfänger die Daten aktualisieren.

Der Empfänger sieht nur Daten, auf die er Zugriff hat, basierend auf seinen Unity-Katalogberechtigungen.

Zugriff auf Arbeitsbereiche und Datenressourcen

  • Benutzer ohne Zugriff auf die Unity Catalog-Objekte, auf die in der Arbeitsmappe verwiesen wird, können die Daten nicht aktualisieren. Zum Aktualisieren von Daten benötigen Benutzer Leseberechtigungen für die zugrunde liegenden Tabellen und Ansichten im Unity-Katalog.
  • Benutzer müssen zugriff auf die zugrunde liegende Tabelle in Azure Databricks haben, um vorhandene Importe zu bearbeiten.

Sichtbarkeit von Abfragen

Benutzer mit Bearbeitungszugriff auf die Arbeitsmappe können die Abfragen anzeigen, die zum Generieren der Daten über das Azure Databricks-Add-In verwendet werden, auch wenn sie keinen Zugriff auf die zugrunde liegenden Daten im Unity-Katalog haben.

Einschränkungen

  • Benutzerdefinierte Funktionen: Für benutzerdefinierte Funktionen sind Abfrageergebnisse aufgrund von Einschränkungen der SQL-Ausführungs-API auf 25 MiB beschränkt.
  • Datenladevorgang: Fehler beim Laden von Daten, wenn sich eine Zelle in der Arbeitsmappe im Bearbeitungsmodus befindet.
  • Excel Grenzwert für Desktopzeilen: Excel Desktop unterstützt maximal 1.048.576 Zeilen pro Blatt.
  • Excel für das Web Dateigrößenbeschränkung: Excel für das Web unterstützt eine maximale Dateigröße von ca. 25 MB zum Anzeigen und Bearbeiten.