Teilen über


Verbinden von Tableau und Azure Databricks

Tableau ist eine Business Intelligence- und Datenvisualisierungsplattform, die Benutzern hilft, ihre Daten zu verbinden, zu analysieren und freizugeben, indem sie interaktive Dashboards und Berichte erstellen und letztendlich datengesteuerte Entscheidungsfindung ermöglichen. In diesem Artikel erfahren Sie, wie Sie Partner Connect verwenden, um eine Verbindung von Azure Databricks zu Tableau Desktop und von Tableau Desktop oder Tableau Cloud zu Azure Databricks herzustellen. Dieser Artikel enthält auch Informationen zu Tableau Server auf Linux.

Hinweis

Informationen zum Konfigurieren der Azure Databricks-Anmeldung von Tableau Server finden Sie unter Konfigurieren der Azure Databricks-Anmeldung von Tableau Server.

Wenn Sie Azure Databricks als Datenquelle für Tableau verwenden, können Sie leistungsstarke interaktive Analysen durchführen und die Arbeit Ihrer Data Scientists und Data Engineers durch die Skalierung riesiger Datasets für Ihre Business Analysts nutzbar machen.

Erkunden Sie in Tableau Cloud von Azure Databricks aus

Wenn Sie Azure Databricks als Datenquelle mit Tableau Cloud verwenden, können Sie Tableau-Datenquellen aus Tabellen oder Schemas direkt aus der Databricks-Benutzeroberfläche erstellen.

Anforderungen

  • Ihre Daten müssen sich im Unity-Katalog befinden, und Ihr Cluster muss für den Unity-Katalog aktiviert sein. Der Hive-Metaspeicher wird derzeit nicht unterstützt.

Erkunden Sie Azure Databricks-Tabellen in Tableau Cloud

  1. Melden Sie sich bei Ihrem Databricks-Arbeitsbereich an, und klicken Sie auf das Datensymbol.Katalog in der Randleiste zum Öffnen des Katalog-Explorers.
  2. Wählen Sie im Katalogbereich oben links eine Computeressource aus.
  3. Öffnen Sie einen Katalog, und wählen Sie das Schema oder die Tabelle aus, das Sie erkunden möchten. Wählen Sie nicht aus einem Hive-Metastore oder dem Katalog mit den Beispielen aus.
  4. Klicken Sie oben rechts auf "Mit BI-Tools verwenden" für ein Schema oder "In einem Dashboard für eine Tabelle öffnen".
  5. Wählen Sie im Dropdownmenü "Erkunden" in Tableau Cloud aus.
  6. Vergewissern Sie sich, dass die ausgewählten Compute sowie das Schema oder die Tabelle korrekt sind, und klicken Sie dann auf 'In Tableau Cloud erkunden'.
  7. Eine neue Registerkarte wird geöffnet, und Sie werden aufgefordert, sich bei Ihrem Tableau Cloud-Konto anzumelden.
  8. Nach der Anmeldung bei Tableau werden Sie aufgefordert, sich wieder bei Azure Databricks anzumelden.
  9. Nachdem Sie sich bei Azure Databricks angemeldet haben, können Sie mit dem Erstellen eines Tableau-Dashboards im Arbeitsmappen-Editor beginnen.

Funktionen und Notizen

  • Sie können entweder eine Tabelle oder ein Schema erkunden. Beim Untersuchen eines Schemas müssen Sie eine Tabelle aus dem Tableau-Datenquellenbereich auswählen, bevor Sie mit dem Erstellen eines Dashboards beginnen können.
  • Databricks erzwingt OAuth als Authentifizierungsmodus beim Veröffentlichen in Tableau Cloud.
  • Die veröffentlichte Datenquelle befindet sich im Entwurfsmodus und wird nicht an einer beliebigen Stelle gespeichert. Sie müssen sie in Tableau Cloud speichern, um sie für andere zugänglich zu machen.

Allgemeine Anforderungen zum Verbinden von Tableau und Azure Databricks

Herstellen einer Verbindung von Azure Databricks zu Tableau Desktop mithilfe von Partner Connect

Mithilfe von Partner Connect können Sie mit wenigen Klicks eine Verbindung zwischen einer Compute-Ressource oder einem SQL-Warehouse und Tableau Desktop herstellen.

  1. Stellen Sie sicher, dass Ihr Azure Databricks-Konto, -Arbeitsbereich und der angemeldete Benutzer alle Anforderungen für Partner Connect erfüllen.
  2. Klicken Sie auf der Randleiste auf Marketplace-Symbol.
  3. Klicken Sie in Partner Connect-Integrationen auf "Alle anzeigen".
  4. Klicken Sie auf die Kachel Tableau.
  5. Wählen Sie im Dialogfeld "Mit Partner verbinden" für "Compute" den Namen der Azure Databricks-Computeressource aus, die Sie verbinden möchten.
  6. Wählen Sie "Verbindungsdatei herunterladen" aus.
  7. Öffnen Sie die heruntergeladene Verbindungsdatei, wodurch Tableau Desktop gestartet wird.
  8. Wählen Sie in Tableau Desktop Ihre Authentifizierungsmethode aus, und geben Sie die angeforderten Informationen ein (falls vorhanden).

Verbinden von Tableau Desktop mit Azure Databricks

Befolgen Sie diese Anweisungen, um eine Verbindung von Tableau Desktop zu einer Compute-Ressource oder einem SQL-Warehouse herzustellen.

Hinweis

Verwenden Sie Partner Connect, um schneller eine Verbindung mit Tableau Desktop herzustellen.

  1. Starten Sie Tableau Desktop.
  2. Klicken Sie auf Datei > Neu.
  3. Klicken Sie auf der Registerkarte "Daten " auf "Mit Daten verbinden".
  4. Klicken Sie in der Liste der Connectors auf "Databricks".
  5. Geben Sie den Serverhost undden HTTP-Pfad ein.
  6. Wählen Sie Ihre Authentifizierungsmethode aus und geben Sie die angeforderten Informationen ein (falls vorhanden).

Wenn Unity Catalog für Ihren Arbeitsbereich aktiviert ist, legen Sie zusätzlich den Standardkatalog fest. Fügen Sie auf der Registerkarte "Erweitert " für Verbindungseigenschaften hinzu Catalog=<catalog-name>. Um den Standardkatalog zu ändern, geben Sie auf der Registerkarte "Initial SQL " die Zeichenfolge USE CATALOG <catalog-name>ein.

Verbinden von Tableau Cloud mit Azure Databricks

Befolgen Sie diese Anweisungen, um eine Verbindung zwischen einer Compute-Ressource oder einem SQL-Warehouse und Tableau Cloud herzustellen.

  1. Starten einer neuen Arbeitsmappe
  2. Klicken Sie auf der Menüleiste auf ">Neue Datenquelle".
  3. Klicken Sie auf der Seite „Mit Daten verbinden“ auf Connectors>Databricks.
  4. Geben Sie auf der Seite "Azure Databricks" den Server-Hostname und die HTTP-Pfad Werte ein.
  5. Wählen Sie Ihre Authentifizierungsmethode aus und geben Sie die angeforderten Informationen ein (falls vorhanden).
  6. Klicken Sie auf "Anmelden".

Tableau Server unter Linux

Bearbeiten Sie /etc/odbcinst.ini, um Folgendes einzuschließen:

[Simba Spark ODBC Driver 64-bit]
Description=Simba Spark ODBC Driver (64-bit)
Driver=/opt/simba/spark/lib/64/libsparkodbc_sb64.so

Hinweis

Für Tableau Server unter Linux wird die 64-Bit-Verarbeitungsarchitektur empfohlen.

Veröffentlichen und Aktualisieren einer Arbeitsmappe in Tableau Cloud aus Tableau Desktop

In diesem Artikel wird gezeigt, wie Sie eine Arbeitsmappe aus Tableau Desktop in Tableau Cloud veröffentlichen und aktualisieren, wenn sich die Datenquelle ändert. Sie benötigen eine Arbeitsmappe in Tableau Desktop und ein Tableau Cloud-Konto .

  1. Extrahieren Sie die Daten der Arbeitsmappe aus Tableau Desktop: Klicken Sie in Tableau Desktop mit der Arbeitsmappe, die Sie veröffentlichen möchten, auf "Daten ><data-source-name>> extrahieren".
  2. Klicken Sie im Dialogfeld "Daten extrahieren " auf "Extrahieren".
  3. Navigieren Sie zu einem Speicherort auf Ihrem lokalen Computer, an dem Sie die extrahierten Daten speichern möchten, und klicken Sie dann auf "Speichern".
  4. Veröffentlichen Sie die Datenquelle der Arbeitsmappe in Tableau Cloud: Klicken Sie in Tableau Desktop auf Server > Datenquelle veröffentlichen ><data-source-name>.
  5. Wenn das Dialogfeld " Tableau Server-Anmeldung " angezeigt wird, klicken Sie auf den Tableau Cloud-Link , und folgen Sie den Anweisungen auf dem Bildschirm, um sich bei Tableau Cloud anzumelden.
  6. Klicken Sie im Dialogfeld "Datenquelle in Tableau Cloud veröffentlichen" neben "Aktualisierung nicht aktiviert" auf den Link "Bearbeiten".
  7. Ändern Sie im angezeigten Flyoutfeld unter Authentifizierung die Option Aktualisieren nicht aktiviert in Aktualisierungszugriff zulassen.
  8. Klicken Sie auf eine beliebige Stelle außerhalb dieses Flyouts, um es auszublenden.
  9. Wählen Sie "Arbeitsmappe aktualisieren" aus, um die veröffentlichte Datenquelle zu verwenden.
  10. Klicken Sie auf "Veröffentlichen". Die Datenquelle wird in Tableau Cloud angezeigt.
  11. Klicken Sie in Tableau Cloud im Dialogfeld " Veröffentlichung abgeschlossen " auf "Zeitplan", und folgen Sie den Anweisungen auf dem Bildschirm.
  12. Veröffentlichen Sie die Arbeitsmappe in Tableau Cloud: In Tableau Desktop gehen Sie mit der Arbeitsmappe, die Sie veröffentlichen möchten, zu > und klicken dann auf >.
  13. Klicken Sie im Dialogfeld "Arbeitsmappe in Tableau Cloud veröffentlichen" auf "Veröffentlichen". Die Arbeitsmappe wird in Tableau Cloud angezeigt.

Tableau Cloud überprüft die Datenquelle gemäß dem von Ihnen festgelegten Zeitplan auf Änderungen und aktualisiert die veröffentlichte Arbeitsmappe, wenn Änderungen erkannt werden.

Weitere Informationen finden Sie hier auf der Tableau-Website:

Bewährte Methoden und Problembehandlung

Sie können Tableau-Abfragen auf zwei Arten optimieren:

  • Reduzieren Sie die Anzahl der Datensätze, die in einem einzelnen Diagramm oder Dashboard abgefragt und visualisiert werden.
  • Reduzieren Sie die Anzahl der Abfragen, die von Tableau in einem einzelnen Diagramm oder Dashboard gesendet werden.

Die Entscheidung, welche Methode Sie zuerst probieren möchten, hängt von Ihrem Dashboard ab. Wenn Sie eine Reihe verschiedener Diagramme für einzelne Benutzer im selben Dashboard haben, ist es wahrscheinlich, dass Tableau zu viele Abfragen an Azure Databricks sendet. Wenn Sie nur über wenige Diagramme verfügen, deren Ladezeit jedoch sehr lang ist, werden wahrscheinlich zu viele Datensätze von Azure Databricks zurückgegeben, um einen effektiven Ladevorgang zu ermöglichen.

Tableau-Leistungsaufzeichnungen, die sowohl in Tableau Desktop als auch tableau Server verfügbar sind, können Ihnen dabei helfen, Leistungsengpässe zu erkennen, indem Sie Prozesse identifizieren, die zu Latenz führen, wenn Sie einen bestimmten Workflow oder ein bestimmtes Dashboard ausführen.

Aktivieren der Leistungsaufzeichnung zum Debuggen von Problemen mit Tableau

Wenn beispielsweise die Abfrageausführung das Problem ist, wissen Sie, dass dies mit dem Prozess der Daten-Engine oder der Datenquelle zu tun hat, die Sie abfragen. Wenn das visuelle Layout langsam ist, wissen Sie dass das Problem bei VizQL liegt.

Wenn die Leistungsaufzeichnung angibt, dass die Latenz in der ausgeführten Abfrage liegt, nimmt es wahrscheinlich entweder zu viel Zeit in Anspruch, dass Azure Databricks die Ergebnisse zurückgibt, oder die ODBC/Connector-Überlagerung erfordert zu viel Zeit, um die Daten in SQL für VizQL zu verarbeiten. Wenn dies der Fall ist, sollten Sie analysieren, was Sie zurückgeben, und versuchen, das Analysemuster so zu ändern, dass Sie ein Dashboard pro Gruppe, Segment oder Artikel verwenden, anstatt zu versuchen, alles in ein Dashboard zu packen und sich auf Schnellfilter zu verlassen.

Wenn die schlechte Leistung durch das Sortieren oder das visuelle Layout verursacht wird, kann das Problem bei der Anzahl der Markierungen liegen, die das Dashboard zurückgeben soll. Azure Databricks kann eine Million Datensätze schnell zurückgeben, Tableau ist jedoch möglicherweise nicht in der Lage, das Layout zu berechnen und die Ergebnisse zu sortieren. Wenn dieses Problem auftritt, fassen Sie die Abfrage zusammen und führen Sie eine detaillierte Analyse der unteren Ebenen durch. Sie können auch einen größeren Computer ausprobieren, da Tableau nur durch physische Ressourcen auf dem Computer eingeschränkt wird, auf dem sie ausgeführt wird.

Ein ausführliches Lernprogramm zum Leistungsrekorder finden Sie unter Erstellen einer Leistungsaufzeichnung.

Leistung in Tableau Server im Vergleich zu Tableau Desktop

Im Allgemeinen ist ein Workflow, der in Tableau Desktop ausgeführt wird, in Tableau Server nicht schneller. Ein Dashboard, das nicht auf Tableau Desktop ausgeführt wird, wird nicht auf Tableau Server ausgeführt.

Die Verwendung von Desktop ist eine wesentlich bessere Problembehandlungsmethode, da Tableau Server bei der Problembehandlung mehr Prozesse berücksichtigen kann. Wenn Dinge in Tableau Desktop funktionieren, aber nicht in Tableau Server, können Sie das Problem sicher auf die Prozesse in Tableau Server beschränken, die sich nicht in Tableau Desktop befinden.

Konfiguration

Die Parameter der Verbindungs-URL überschreiben standardmäßig die Parameter in dem ODBC-DSN von Simba. Sie können die ODBC-Konfigurationen von Tableau auf zwei Arten anpassen:

  • Eine .tds-Datei für eine einzelne Datenquelle:

    1. Folgen Sie den Anweisungen unter "Datenquellen speichern ", um die .tds Datei für die Datenquelle zu exportieren.
    2. Suchen Sie die Eigenschaftszeile odbc-connect-string-extras='' in der .tds-Datei, und legen Sie die Parameter fest. Sie können die Zeile beispielsweise in AutoReconnect ändern, um UseNativeQuery und odbc-connect-string-extras='AutoReconnect=1,UseNativeQuery=1' zu aktivieren.
    3. Laden Sie die .tds-Datei erneut, indem Sie die Verbindung erneut herstellen.

    Die Rechenressource ist optimiert, um weniger Heap-Speicher für das Sammeln großer Ergebnisse zu nutzen, sodass mehr Zeilen pro Abrufblock als in den Simba ODBC-Standardeinstellungen bereitgestellt werden können. Fügen Sie RowsFetchedPerBlock=100000' an den Wert der Eigenschaft odbc-connect-string-extras an.

  • Eine .tdc-Datei für alle Datenquellen:

    1. Wenn Sie noch nie eine .tdc Datei erstellt haben, können Sie TableauTdcExample.tdc dem Ordner Document/My Tableau Repository/Datasourceshinzufügen.
    2. Fügen Sie die Datei allen Tableau Desktop-Installationen aller Entwickler hinzu, damit sie funktioniert, wenn die Dashboards freigegeben werden.

Optimieren von Diagrammen (Arbeitsblättern)

Sie können Diagramme auf mehrere Arten taktisch optimieren, um die Leistung Ihrer Tableau-Arbeitsblätter zu verbessern.

Verwenden Sie für Filter, die sich nicht häufig ändern und nicht mit denen interagiert werden soll, Kontextfilter, die die Ausführungszeit beschleunigen. Eine weitere gute Faustregel ist, dass in Abfragen if/else-Anweisungen anstelle von case/when-Anweisungen verwendet werden sollten.

Tableau kann Datenquellen filtern, was die Abfragegeschwindigkeiten verbessern kann. Weitere Informationen zu Pushdownfiltern für Datenquellen finden Sie unter "Filtern über mehrere Datenquellen mithilfe eines Parameters und Filtern von Daten über mehrere Datenquellen hinweg".

Versuchen Sie, Tabellenberechnungen zu vermeiden, da diese das vollständige DataSet scannen. Weitere Informationen zu Tabellenberechnungen finden Sie unter Transformieren von Werten mit Tabellenberechnungen.

Optimieren von Dashboards

Nachfolgend finden Sie eine Reihe von Tipps und Strategien zur Problembehandlung, mit denen Sie die Leistung Ihres Tableau-Dashboards verbessern können.

Bei Tableau-Dashboards, die mit Azure Databricks verbunden sind, können Schnellfiltern in einzelnen Dashboards, die eine Reihe an verschiedenen Benutzer*innen, Funktionen oder Segmenten abdecken, eine häufige Ursache für Probleme sein. Sie können Schnellfilter an alle Diagramme auf dem Dashboard anfügen. Ein Schnellfilter in einem Dashboard mit fünf Diagrammen bewirkt, dass mindestens zehn Abfragen an Azure Databricks gesendet werden. Diese Zahl kann größer werden, wenn weitere Filter hinzugefügt werden, und es kann zu Leistungsproblemen führen, da Spark nicht dafür ausgelegt ist, viele gleichzeitige Abfragen zu verarbeiten, die genau zum selben Zeitpunkt erfolgen. Das wird insbesondere dann problematisch, wenn der verwendete Azure Databricks-Cluster oder das verwendete SQL-Warehouse nicht groß genug ist, um das hohe Abfragevolumen zu verarbeiten.

Es wird empfohlen, zunächst die Tableau-Leistungsaufzeichnung zu verwenden, um die Ursache des Problems zu beheben.

Wenn die schlechte Leistung durch Sortierung oder visuelles Layout verursacht wird, kann das Problem die Anzahl der Markierungen sein, die das Dashboard zurückgeben möchte. Azure Databricks kann eine Million Datensätze schnell zurückgeben, Tableau ist jedoch möglicherweise nicht in der Lage, das Layout zu berechnen und die Ergebnisse zu sortieren. Wenn dieses Problem auftritt, fassen Sie die Abfrage zusammen und führen Sie eine detaillierte Analyse der unteren Ebenen durch. Sie können auch einen größeren Computer ausprobieren, da Tableau nur durch die physischen Ressourcen auf dem Computer eingeschränkt wird, auf dem sie ausgeführt wird.

Informationen zur Vertiefung in Tableau finden Sie unter Vertiefung in die Details.

Wenn viele granulare Markierungen angezeigt werden, ist dies häufig ein schlechtes analytisches Muster, da es keinen Einblick liefert. Das Drilldown von höheren Aggregationsebenen ist sinnvoller und reduziert die Anzahl der Datensätze, die verarbeitet und visualisiert werden müssen.

Durchführen von Aktionen zum Optimieren von Dashboards

Verwenden Sie Tableau _actions, um auf eine Markierung (z. B. einen Zustand auf einer Karte) zu klicken und an ein anderes Dashboard zu senden, das basierend auf dem von Ihnen geklickten Zustand filtert. Die Verwendung von _actions reduziert die Notwendigkeit mehrerer Filter auf einem Dashboard und die Anzahl der Datensätze, die generiert werden müssen. (Sie richten eine Aktion ein, mit der keine Datensätze erzeugt werden, bis sie ein Prädikat zum Filtern erhält.

Weitere Informationen finden Sie unter "Aktionen " und "6 Tipps", um Ihre Dashboards effizienter zu gestalten.

Zwischenspeicherung

Das Zwischenspeichern von Daten ist eine gute Möglichkeit, die Leistung von Arbeitsblättern und Dashboards zu verbessern.

Zwischenspeichern in Tableau

Tableau verfügt über vier Ebenen der Zwischenspeicherung, bevor es auf die Daten zurückgreift. Dabei spielt es keine Rolle, ob diese Daten in einer Liveverbindung oder einer Extraktion vorliegen:

  • Kacheln: Wenn jemand dasselbe Dashboard lädt und nichts ändert, versucht Tableau, dieselben Kacheln für die Diagramme wiederzuverwenden. Dies ähnelt den Kacheln bei Google Maps.
  • Modell: Wenn der Kachelcache nicht verwendet werden kann, wird der Modellcache mathematischer Berechnungen zum Generieren von Visualisierungen verwendet. Tableau Server versucht, die gleichen Modelle zu verwenden.
  • Abstract: Aggregierte Ergebnisse von Abfragen werden ebenfalls gespeichert. Dies ist die dritte „Verteidigungsebene“. Wenn eine Abfrage „Sum(Sales)“, „Count(orders)“ und „Sum(Cost)“ in einer vorherigen Abfrage zurückgegeben hat und eine zukünftige Abfrage nur „Sum(Sales)“ benötigt, dann greift Tableau auf dieses Ergebnis zurück und verwendet es.
  • Nativer Cache: Wenn die Abfrage mit einem anderen identisch ist, verwendet Tableau dieselben Ergebnisse. Dies ist die letzte Ebene der Zwischenspeicherung. Wenn dies fehlschlägt, wechselt Tableau zu den Daten.

Häufigkeit von Zwischenspeicherungen in Tableau

In Tableau kann eingestellt werden, ob Zwischenspeicherungen häufiger oder seltener durchgeführt werden sollen. Wenn der Server auf "Weniger häufig aktualisieren" festgelegt ist, behält Tableau Daten bis zu 12 Stunden im Cache bei. Wenn der Server auf Häufiger aktualisieren festgelegt ist, ruft Tableau die Daten bei jeder Seitenaktualisierung ab.

Kunden, die dasselbe Dashboard wiederholt verwenden, z. B. "Montagmorgen-Pipelineberichte", sollten sich auf einem Server befinden, der auf "Weniger häufig aktualisieren" festgelegt ist, damit alle Dashboards denselben Cache verwenden.

Cachewarming in Tableau

In Tableau können Sie den Cache aufwärmen, indem Sie ein Abonnement für das Dashboard einrichten, das gesendet wird, bevor das Dashboard angezeigt werden soll. (Das Dashboard muss gerendert werden, um das Abonnement-E-Mail-Bild zu generieren.) Siehe "Erwärmen des Tableau Server-Caches mithilfe von Abonnements".

Tableau Desktop: Fehler The drivers... are not properly installed

Problem: Wenn Sie versuchen, Tableau Desktop mit Databricks zu verbinden, zeigt Tableau im Verbindungsdialogfeld eine Fehlermeldung mit einem Link zur Treiberdownloadseite an, auf der Sie Treiberlinks und Installationsanweisungen finden können.

Ursache: Ihre Installation von Tableau Desktop führt keinen unterstützten Treiber aus.

Lösung: Laden Sie den Databricks ODBC-Treiber , Version 2.6.15 oder höher, herunter.

Siehe auch: Fehler „Die Treiber ... sind nicht ordnungsgemäß installiert“ auf der Tableau-Website.

Constraints für Primär- / Fremdschlüssel

Um Constraints für Primärschlüssel (PK) und Fremdschlüssel (FK) von Azure Databricks an Tableau zu verteilen, müssen Sie die Funktionalitäten und Grenzwerte beider Plattformen hinsichtlich Constraints verstehen.

Grundlegendes zu Azure Databricks-Constraints

Azure Databricks unterstützt Constraints für Primär- und Fremdschlüssel ab Databricks Runtime 15.2. Diese Constraints sind informationell und werden nicht standardmäßig erzwungen, d. h. sie verhindern keine Datenintegritätsverstöße, können jedoch verwendet werden, um Abfragen zu optimieren und Metadaten zu Datenbeziehungen bereitzustellen. Siehe Deklarieren von Primärschlüssel- und Fremdschlüsselbeziehungen.

Grundlegendes dazu, wie Tableau Constraints zum Erstellen von Tabellenbeziehungen verwendet

Tableau erzwingt Primär- und Fremdschlüsseleinschränkungen nicht direkt. Stattdessen verwendet Tableau Beziehungen zum Modellieren von Datenverbindungen. Um mit Einschränkungen in Tableau zu arbeiten, müssen Sie wissen, dass das Datenmodell von Tableau zwei Modellierungsebenen bietet: eine logische Ebene und eine physische Ebene. Siehe Tableau-Datenmodell. Die Auswirkungen dieses zweistufigen Datenmodells auf Azure Databricks-Constraints, die als Beziehungen in Tableau erkannt werden, werden weiter unten erläutert.

Verbinden von Azure Databricks mit Tableau

Wenn Sie Azure Databricks mit Tableau verbinden, versucht Tableau, Beziehungen auf der physischen Ebene zwischen Tabellen basierend auf vorhandenen Schlüssel-Constraints und übereinstimmenden Feldern zu erstellen. Tableau versucht automatisch, Beziehungen auf der physischen Ebene basierend auf in Azure Databricks definierten Constraints für Primär- und Fremdschlüssel zu erkennen und zu erstellen. Wenn keine Schlüssel-Constraints definiert sind, verwendet Tableau übereinstimmende Spaltennamen, um Verknüpfungen automatisch zu generieren. Auf der logischen Ebene werden nur Übereinstimmungen von Einzelspaltennamen verwendet, um eine Beziehung zu bestimmen. Auf der physischen Ebene erkennt dieser Spaltennamensabgleich sowohl einfache (einspaltige) als auch zusammengesetzte (mehrspaltige) Schlüsselbeziehungen.

Wenn Tableau die übereinstimmenden Felder nicht ermitteln kann, müssen Sie die Verknüpfungsbeziehung zwischen den beiden Tabellen auf der physischen Ebene manuell angeben, indem Sie die Spalten, Die Bedingung und den Typ der Einschränkung angeben. Um von der logischen Ebene in der Benutzeroberfläche zur physischen Ebene zu wechseln, doppelklicken Sie auf die Tabelle auf der logischen Ebene.

Zusätzliche Ressourcen