Freigeben über


Verbinden von Tableau und Azure Databricks

In diesem Artikel erfahren Sie, wie Sie Partner Connect verwenden, um eine Verbindung von Azure Databricks zu Tableau Desktop und von Tableau Desktop oder Tableau Cloud zu Azure Databricks herzustellen. Dieser Artikel enthält auch Informationen zu Tableau Server auf Linux.

Hinweis

Informationen zum Konfigurieren der Azure Databricks-Anmeldung über Tableau Server finden Sie unter Konfigurieren der Azure Databricks-Anmeldung über Tableau Server.

Wenn Sie Azure Databricks als Datenquelle für Tableau verwenden, können Sie leistungsstarke interaktive Analysen durchführen und die Arbeit Ihrer Data Scientists und Data Engineers durch die Skalierung riesiger Datasets für Ihre Business Analysts nutzbar machen.

Anforderungen für die Verbindung von Tableau und Azure Databricks

Herstellen einer Verbindung von Azure Databricks zu Tableau Desktop mithilfe von Partner Connect

Mithilfe von Partner Connect können Sie mit wenigen Klicks eine Verbindung zwischen einer Compute-Ressource oder einem SQL-Warehouse und Tableau Desktop herstellen.

  1. Stellen Sie sicher, dass Ihr Konto und Arbeitsbereich in Azure Databricks sowie der angemeldete Benutzer die Anforderungen für Partner Connect erfüllen.
  2. Klicken Sie in der Randleiste auf Partner Connect-Schaltfläche Partner Connect.
  3. Klicken Sie auf die Kachel Tableau.
  4. Wählen Sie im Dialogfeld Connect to partner (Verbindung mit dem Partner herstellen) für Compute den Namen der Azure Databricks-Computeressource aus, für die Sie eine Verbindung herstellen möchten.
  5. Wählen Sie Download connection file (Verbindungsdatei herunterladen) aus.
  6. Öffnen Sie die heruntergeladene Verbindungsdatei, wodurch Tableau gestartet wird.
  7. Geben Sie in Tableau Desktop Ihre Anmeldeinformationen zur Authentifizierung ein, und klicken Sie dann auf Anmelden:
    • Um ein Microsoft Entra-ID-Token zu verwenden, geben Sie Token unter Username (Benutzername) und Ihr Microsoft Entra ID-Token für Password (Kennwort) ein.
    • Um ein persönliches Zugriffstoken für Azure Databricks zu verwenden, geben Sie token unter Nutzername und Ihr persönliches Zugriffstoken als Passwort ein.
    • Wenn Sie Ihre Microsoft Entra ID-Anmeldeinformationen verwenden möchten, klicken Sie auf Verbindung bearbeiten, doppelklicken Sie auf die Datenbank auf der Registerkarte Daten, und wählen Sie dann aus der Liste Authentifizierung die Option Microsoft Entra ID aus.
      • Für Tableau Desktop (Version 2021.1 und höher) gilt:

        1. Wenn Sie kein B2B-Gastkonto für Microsoft Entra ID (früher Azure Active Directory) nutzen oder nicht über Azure Databricks in Azure Government verfügen, können Sie einfach https://login.microsoftonline.com/common als OAuth-Endpunkt eingeben.

        Konfigurieren der Authentifizierung

        1. Wenn Sie ein B2B-Gastkonto für Microsoft Entra ID oder Azure Databricks in Azure Government verwenden, kontaktieren Sie Ihre*n Administrator*in, um ein dediziertes Microsoft Entra ID-Warehouse zu erhalten.

        Hinweis

        Wenn Sie kein Administrator sind, wird der Fehler Admin-Genehmigung erforderlich angezeigt. Bitten Sie Cloudanwendungsadministrator*innen oder Anwendungsadministrator*innen, Ihnen Berechtigungen für die Verbindung mit Tableau zu erteilen, und versuchen Sie dann erneut, sich anzumelden.

        Wenn Ihr Microsoft Entra ID-Konto den Workflow für die Administratoreinwilligung aktiviert hat, fordert Tableau Desktop Sie auf, den Zugriff auf Tableau anzufordern. Nachdem Cloudanwendungsadministrator*innen oder Anwendungsadministrator*innen die Anforderung genehmigt haben, versuchen Sie, sich erneut anzumelden.

Verbinden von Tableau Desktop mit Azure Databricks

Befolgen Sie diese Anweisungen, um eine Verbindung von Tableau Desktop zu einer Compute-Ressource oder einem SQL-Warehouse herzustellen.

Hinweis

Verwenden Sie Partner Connect, um schneller eine Verbindung mit Tableau Desktop herzustellen.

  1. Starten Sie Tableau Desktop.

  2. Klicken Sie auf Datei > Neu.

  3. Klicken Sie auf der Registerkarte Daten auf Mit Daten verbinden.

  4. Klicken Sie in der Liste der Connectors auf Databricks.

  5. Geben Sie den Hostnamen des Servers und den HTTP-Pfad ein.

  6. Wählen Sie unter Authentifizierung Ihre Authentifizierungsmethode aus, und geben Sie Ihre Anmeldeinformationen zur Authentifizierung ein. Klicken Sie dann auf Anmelden.

    • Um ein Microsoft Entra ID-Token zu verwenden, wählen Sie Personal Access Token (Persönliches Zugriffstoken) aus, und geben Sie unter Password (Kennwort) Ihr Microsoft Entra ID-Token ein.

    • Um ein persönliches Zugriffstoken für Azure Databricks zu verwenden, wählen Sie Persönliches Zugriffstoken aus und geben Sie Ihr persönliches Zugriffstoken als Passwort ein.

    • Wenn Sie Ihre Microsoft Entra ID-Anmeldeinformationen verwenden möchten, wählen Sie Microsoft Entra ID aus.

      Für Tableau Desktop (Version 2021.1 und höher) gilt:

      • Wenn Sie kein B2B-Gastkonto für Microsoft Entra ID (früher Azure Active Directory) nutzen oder nicht über Azure Databricks in Azure Government verfügen, können Sie einfach https://login.microsoftonline.com/common als OAuth-Endpunkt eingeben.

        Konfigurieren der Authentifizierung

        • Wenn Sie ein B2B-Gastkonto für Microsoft Entra ID oder Azure Databricks in Azure Government verwenden, kontaktieren Sie Ihre*n Administrator*in, um ein dediziertes Microsoft Entra ID-Warehouse zu erhalten.

      Hinweis

      Wenn Sie kein Administrator sind, wird der Fehler Admin-Genehmigung erforderlich angezeigt. Bitten Sie Cloudanwendungsadministrator*innen oder Anwendungsadministrator*innen, Ihnen Berechtigungen für die Verbindung mit Tableau zu erteilen, und versuchen Sie dann erneut, sich anzumelden.

      Wenn Ihr Microsoft Entra ID-Konto den Workflow für die Administratoreinwilligung aktiviert hat, fordert Tableau Desktop Sie auf, den Zugriff auf Tableau anzufordern. Nachdem Cloudanwendungsadministrator*innen oder Anwendungsadministrator*innen die Anforderung genehmigt haben, versuchen Sie, sich erneut anzumelden.

    Wenn Unity Catalog für Ihren Arbeitsbereich aktiviert ist, legen Sie zusätzlich den Standardkatalog fest. Fügen Sie auf der Registerkarte Erweitert für Verbindungseigenschaften entsprechend Catalog=<catalog-name> hinzu. Um den Standardkatalog zu ändern, geben Sie auf der Registerkarte Ursprüngliches SQL den Wert USE CATALOG <catalog-name> ein.

Verbinden von Tableau Cloud mit Azure Databricks

Befolgen Sie diese Anweisungen, um eine Verbindung zwischen einer Compute-Ressource oder einem SQL-Warehouse und Tableau Cloud herzustellen.

  • Starten einer neuen Arbeitsmappe
  • Klicken Sie in der Menüleiste auf Daten>Neue Datenquelle.
  • Klicken Sie auf der Seite „Mit Daten verbinden“ auf Connectors>Databricks.
  • Geben Sie auf der Seite „Azure Databricks“ die Werte Serverhostname und HTTP-Pfad ein.
  • Wählen Sie Ihre Authentifizierungsmethode aus und geben Sie die angeforderten Informationen ein (falls vorhanden).
  • Klicken Sie auf Anmelden.

Tableau Server unter Linux

Bearbeiten Sie /etc/odbcinst.ini, um Folgendes einzuschließen:

[Simba Spark ODBC Driver 64-bit]
Description=Simba Spark ODBC Driver (64-bit)
Driver=/opt/simba/spark/lib/64/libsparkodbc_sb64.so

Hinweis

Für Tableau Server unter Linux wird die 64-Bit-Verarbeitungsarchitektur empfohlen.

Veröffentlichen und Aktualisieren einer Arbeitsmappe in Tableau Cloud aus Tableau Desktop

In diesem Artikel erfahren Sie, wie Sie eine Arbeitsmappe aus Tableau Desktop in Tableau Cloud veröffentlichen und sie auf dem neuesten Stand halten können, wenn sich die Datenquelle ändert. Sie benötigen eine Arbeitsmappe in Tableau Desktop und ein Tableau Cloud-Konto.

  1. Extrahieren Sie die Daten der Arbeitsmappe aus Tableau Desktop: Klicken Sie in Tableau Desktop in der Arbeitsmappe, die veröffentlicht werden soll, auf Daten > <data-source-name> > Daten extrahieren.
  2. Klicken Sie im Dialogfeld Daten extrahieren auf Extrahieren.
  3. Navigieren Sie zu einem Speicherort auf Ihrem lokalen Computer, an dem Sie die extrahierten Daten speichern möchten, und klicken Sie dann auf Speichern.
  4. Veröffentlichen Sie die Datenquelle der Arbeitsmappe in Tableau Cloud: Klicken Sie in Tableau Desktop auf Server > Datenquelle veröffentlichen> <data-source-name>.
  5. Wenn der Dialog Tableau Server-Anmeldung angezeigt wird, klicken Sie auf den Link Tableau Cloud, und befolgen Sie die Anweisungen am Bildschirm, um sich in Tableau Cloud anzumelden.
  6. Klicken Sie im Dialog Datenquelle in Tableau Cloud veröffentlichen neben Aktualisieren nicht aktiviert auf den Link Bearbeiten.
  7. Ändern Sie im angezeigten Flyoutfeld unter AuthentifizierungRefresh Not Enabled zu Allow refresh access.
  8. Klicken Sie auf eine beliebige Stelle außerhalb dieses Flyouts, um es auszublenden.
  9. Wählen Sie Update workbook to use the published data source (Arbeitsmappe aktualisieren, um die veröffentlichte Datenquelle zu verwenden) aus.
  10. Klicken Sie auf Veröffentlichen. Die Datenquelle wird in Tableau Cloud angezeigt.
  11. Klicken Sie in Tableau Cloud im Dialog Veröffentlichung abgeschlossen auf Zeitplan, und befolgen Sie die Anweisungen am Bildschirm.
  12. Veröffentlichen Sie die Arbeitsmappe in Tableau Cloud: Klicken Sie in Tableau Desktop, während die Arbeitsmappe, die Sie veröffentlichen möchten, angezeigt wird, auf Server > Arbeitsmappe veröffentlichen.
  13. Klicken Sie im Dialog Arbeitsmappe in Tableau Cloud veröffentlichen auf Veröffentlichen. Die Arbeitsmappe wird in Tableau Cloud angezeigt.

Tableau Cloud überprüft die Datenquelle gemäß dem von Ihnen festgelegten Zeitplan auf Änderungen und aktualisiert die veröffentlichte Arbeitsmappe, wenn Änderungen erkannt werden.

Weitere Informationen finden Sie hier auf der Tableau-Website:

Bewährte Methoden und Problembehandlung

Sie können Tableau-Abfragen auf zwei Arten optimieren:

  • Reduzieren Sie die Anzahl der Datensätze, die in einem einzelnen Diagramm oder Dashboard abgefragt und visualisiert werden.
  • Reduzieren Sie die Anzahl der Abfragen, die von Tableau in einem einzelnen Diagramm oder Dashboard gesendet werden.

Die Entscheidung, welche Methode Sie zuerst probieren möchten, hängt von Ihrem Dashboard ab. Wenn Sie über mehrere unterschiedliche Diagramme für Einzelbenutzer*innen im selben Dashboard verfügen, sendet Tableau wahrscheinlich zu viele Abfragen an Azure Databricks. Wenn Sie nur über wenige Diagramme verfügen, deren Ladezeit jedoch sehr lang ist, werden wahrscheinlich zu viele Datensätze von Azure Databricks zurückgegeben, um einen effektiven Ladevorgang zu ermöglichen.

Mit der Tableau-Leistungsaufzeichnung, die sowohl in Tableau Desktop als auch in Tableau Server verfügbar ist, können Sie nachvollziehen, wo es Leistungsengpässe gibt, indem Sie Prozesse identifizieren, die beim Ausführen eines bestimmten Workflows oder Dashboards Latenz verursachen.

Aktivieren der Leistungsaufzeichnung zum Debuggen von Problemen mit Tableau

Wenn beispielsweise die Abfrageausführung das Problem ist, wissen Sie, dass dies mit dem Prozess der Daten-Engine oder der Datenquelle zu tun hat, die Sie abfragen. Wenn das visuelle Layout langsam ist, wissen Sie dass das Problem bei VizQL liegt.

Wenn die Leistungsaufzeichnung anzeigt, dass die Latenz bei der Ausführung der Abfrage auftritt, ist es wahrscheinlich, dass Azure Databricks bei der Rückgabe der Ergebnisse oder das ODBC- bzw. Connector-Overlay bei der Umwandlung der Daten in SQL für VizQL zu viel Zeit benötigt. Wenn dies der Fall ist, sollten Sie analysieren, was Sie zurückgeben, und versuchen, das Analysemuster so zu ändern, dass Sie ein Dashboard pro Gruppe, Segment oder Artikel verwenden, anstatt zu versuchen, alles in ein Dashboard zu packen und sich auf Schnellfilter zu verlassen.

Wenn die schlechte Leistung durch das Sortieren oder das visuelle Layout verursacht wird, kann das Problem bei der Anzahl der Markierungen liegen, die das Dashboard zurückgeben soll. Azure Databricks kann eine Million Datensätze schnell zurückgeben, Tableau ist jedoch möglicherweise nicht in der Lage, das Layout zu berechnen und die Ergebnisse zu sortieren. Wenn dieses Problem auftritt, aggregieren Sie die Abfrage, und führen Sie einen Drilldown für die unteren Ebenen durch. Sie können auch versuchen, einen leistungsstärkeren Computer zu verwenden, da das Tableau-Programm nur von den physischen Ressourcen des Computers eingeschränkt wird, auf dem es ausgeführt wird.

Ein ausführliches Tutorial zur Leistungsaufzeichnung finden Sie unter Erstellen einer Leistungsaufzeichnung.

Leistung in Tableau Server im Vergleich zu Tableau Desktop

Im Allgemeinen ist ein Workflow, der in Tableau Desktop ausgeführt wird, in Tableau Server nicht schneller. Ein Dashboard, das in Tableau Desktop nicht ausgeführt werden kann, kann auch nicht in Tableau Server ausgeführt werden.

Es ist viel einfacher, Probleme in Tableau Desktop zu behandeln, da bei Tableau Server bei der Problembehandlung mehr Prozesse berücksichtigt werden müssen. Wenn alles in Tableau Desktop, nicht jedoch in Tableau Server funktioniert, muss das Problem bei einem der Prozesse liegen, die in Tableau Server, aber nicht in Tableau Desktop ausgeführt werden.

Konfiguration

Die Parameter der Verbindungs-URL überschreiben standardmäßig die Parameter in dem ODBC-DSN von Simba. Sie können die ODBC-Konfigurationen von Tableau auf zwei Arten anpassen:

  • Mit einer .tds-Datei bei einer einzelnen Datenquelle:

    1. Befolgen Sie die Anweisungen in Speichern von Datenquellen, um die .tds-Datei für die Datenquelle zu exportieren.
    2. Suchen Sie die Eigenschaftszeile odbc-connect-string-extras='' in der .tds-Datei, und legen Sie die Parameter fest. Sie können die Zeile beispielsweise in odbc-connect-string-extras='AutoReconnect=1,UseNativeQuery=1' ändern, um AutoReconnect und UseNativeQuery zu aktivieren.
    3. Laden Sie die .tds-Datei erneut, indem Sie die Verbindung erneut herstellen.

    Die Computeressource ist so optimiert, dass sie weniger Heapspeicher für das Abrufen großer Ergebnisse verwendet, so dass sie mehr Zeilen pro Abrufblock liefern kann als der ODBC-Standardtreiber von Simba. Fügen Sie RowsFetchedPerBlock=100000' an den Wert der Eigenschaft odbc-connect-string-extras an.

  • Mit einer .tdc-Datei bei allen Datenquellen:

    1. Wenn Sie noch nie eine .tdc-Datei erstellt haben, können Sie TableauTdcExample.tdc zum Ordner Document/My Tableau Repository/Datasources hinzufügen.
    2. Fügen Sie die Datei zu allen Tableau Desktop-Installationen der Entwickler*innen hinzu, damit sie auch funktioniert, wenn die Dashboards freigegeben werden.

Optimieren von Diagrammen (Arbeitsblättern)

Sie können Diagramme auf mehrere Arten taktisch optimieren, um die Leistung Ihrer Tableau-Arbeitsblätter zu verbessern.

Verwenden Sie Kontextfilter für Filter, die nicht oft geändert werden und mit denen nicht interagiert werden soll. Dadurch wird die Ausführung beschleunigt. Eine weitere gute Faustregel ist, dass in Abfragen if/else-Anweisungen anstelle von case/when-Anweisungen verwendet werden sollten.

Tableau kann Filter in Datenquellen weitergeben, was die Abfragegeschwindigkeit verbessern kann. Weitere Informationen zum Filtern von Datenquellen finden Sie unter Filtern von mehreren Datenquellen mithilfe eines Parameters und Filtern von Daten in mehreren Datenquellen.

Versuchen Sie, Tabellenberechnungen zu vermeiden, da diese das vollständige DataSet scannen. Weitere Informationen zu Tabellenberechnungen finden Sie unter Transformieren von Werten mit Tabellenberechnungen.

Optimieren von Dashboards

Nachfolgend finden Sie eine Reihe von Tipps und Strategien zur Problembehandlung, mit denen Sie die Leistung Ihres Tableau-Dashboards verbessern können.

Bei Tableau-Dashboards, die mit Azure Databricks verbunden sind, können Schnellfiltern in einzelnen Dashboards, die eine Reihe an verschiedenen Benutzer*innen, Funktionen oder Segmenten abdecken, eine häufige Ursache für Probleme sein. Sie können Schnellfilter an alle Diagramme auf dem Dashboard anfügen. Ein Schnellfilter in einem Dashboard mit fünf Diagrammen bewirkt, dass mindestens zehn Abfragen an Azure Databricks gesendet werden. Diese Zahl kann größer werden, wenn weitere Filter hinzugefügt werden, und es kann zu Leistungsproblemen führen, da Spark nicht dafür ausgelegt ist, viele gleichzeitige Abfragen zu verarbeiten, die genau zum selben Zeitpunkt erfolgen. Das wird insbesondere dann problematisch, wenn der verwendete Azure Databricks-Cluster oder das verwendete SQL-Warehouse nicht groß genug ist, um das hohe Abfragevolumen zu verarbeiten.

Es wird empfohlen, zunächst die Tableau-Leistungsaufzeichnung zu verwenden, um die Ursache des Problems zu beheben.

Wenn die schlechte Leistung durch das Sortieren oder das visuelle Layout verursacht wird, kann das Problem bei der Anzahl der Markierungen liegen, die das Dashboard zurückgeben soll. Azure Databricks kann eine Million Datensätze schnell zurückgeben, Tableau ist jedoch möglicherweise nicht in der Lage, das Layout zu berechnen und die Ergebnisse zu sortieren. Wenn dieses Problem auftritt, aggregieren Sie die Abfrage, und führen Sie einen Drilldown für die unteren Ebenen durch. Sie können auch versuchen, einen leistungsstärkeren Computer zu verwenden, da das Tableau-Programm nur von den physischen Ressourcen des Computers eingeschränkt wird, auf dem es ausgeführt wird.

Weitere Informationen zum Ausführen von Drilldowns in Tableau finden Sie unter Anzeigen von Detailinformationen.

Allgemein ist das Anzeigen vieler präziser Markierungen oftmals ein schlechtes Analysemuster, da dadurch keine Erkenntnisse vermittelt werden. Die Ausführung eines Drilldowns von höheren Aggregationsebenen ist sinnvoller und reduziert die Anzahl der Datensätze, die verarbeitet und visualisiert werden müssen.

Durchführen von Aktionen zum Optimieren von Dashboards

Verwenden Sie _actions von Tableau, um auf eine Markierung (z. B. einen Staat auf einer Karte) zu klicken und zu einem anderen Dashboard weitergeleitet werden, das nach dem von Ihnen angeklickten Staat filtert. Dadurch verringert sich die Notwendigkeit mehrerer Filter in einem Dashboard und die Anzahl der Datensätze, die generiert werden müssen. (Sie legen eine Aktion so fest, dass Datensätze erst generiert werden, wenn es ein Prädikat zum Filtern erhält.

Weitere Informationen finden Sie unter Aktionen und 6 Tipps, mit denen Sie Ihre Dashboard leistungsfähiger gestalten können.

Caching

Das Zwischenspeichern von Daten ist eine gute Möglichkeit, die Leistung von Arbeitsblättern und Dashboards zu verbessern.

Zwischenspeichern in Tableau

Tableau verfügt über vier Ebenen der Zwischenspeicherung, bevor es auf die Daten zurückgreift. Dabei spielt es keine Rolle, ob diese Daten in einer Liveverbindung oder einer Extraktion vorliegen:

  • Kacheln: Wenn jemand das genau gleiche Dashboard lädt und sich nichts ändert, versucht Tableau, die gleichen Kacheln für die Diagramme wiederzuverwenden. Dies ähnelt den Kacheln bei Google Maps.
  • Modell: Es gibt mathematische Berechnungen, die zur Generierung von Visualisierungen verwendet werden können, wenn Kacheln nicht verwendet werden können. Tableau Server versucht, die gleichen Modelle zu verwenden.
  • Zusammenfassung: Aggregierte Ergebnisse von Abfragen werden ebenfalls gespeichert. Dies ist die dritte „Verteidigungsebene“. Wenn eine Abfrage „Sum(Sales)“, „Count(orders)“ und „Sum(Cost)“ in einer vorherigen Abfrage zurückgegeben hat und eine zukünftige Abfrage nur „Sum(Sales)“ benötigt, dann greift Tableau auf dieses Ergebnis zurück und verwendet es.
  • Natives Cache: Wenn die Abfrage mit einer anderen identisch ist, verwendet Tableau die gleichen Ergebnisse. Dies ist die letzte Ebene der Zwischenspeicherung. Wenn dies fehlschlägt, greift Tableau auf die Daten zu.

Häufigkeit von Zwischenspeicherungen in Tableau

In Tableau kann eingestellt werden, ob Zwischenspeicherungen häufiger oder seltener durchgeführt werden sollen. Wenn auf dem Server die Einstellung Refresh Less Often (Seltener aktualisieren) festgelegt ist, speichert Tableau die Daten bis zu 12 Stunden im Cache. Wenn die Einstellung Refresh More Often (Häufiger aktualisieren) festgelegt ist, ruft Tableau die Daten bei jeder Seitenaktualisierung ab.

Kund*innen, die dasselbe Dashboard immer wieder verwenden (z. B. „Pipelineberichte am Montagmorgen“), sollten auf einem Server mit der Einstellung „Refresh Less Often“ arbeiten, damit alle Dashboards denselben Cache verwenden.

Cachewarming in Tableau

Sie können den Cache in Tableau aufwärmen, indem Sie eine Subscription für das Dashboard einstellen, die gesendet wird, bevor das Dashboard angezeigt werden soll. Dies liegt daran, dass das Dashboard gerendert werden muss, um das Bild für die Abonnement-E-Mail zu generieren. Weitere Informationen finden Sie unter Warming des Tableau Server-Caches mithilfe von Abonnements.

Tableau Desktop: Der Fehler The drivers... are not properly installed wird angezeigt.

Problem: Wenn Sie versuchen, Tableau Desktop mit Databricks zu verbinden, zeigt Tableau eine Fehlermeldung im Verbindungsdialogfeld an, die einen Link zur Seite mit den Treiberdownloads enthält, auf der Sie die Treiberlinks und Installationsanweisungen finden.

Ursache: Ihre Installation von Tableau Desktop führt keinen unterstützten Treiber aus.

Lösung: Laden Sie den ODBC-Treiber von Databricks (Version 2.6.15 oder höher) herunter.

Hier finden Sie weitere Informationen: Beschreibung des Fehlers „The drivers...are not properly installed“ auf der Website von Tableau

Constraints für Primär- / Fremdschlüssel

Um Constraints für Primärschlüssel (PK) und Fremdschlüssel (FK) von Azure Databricks an Tableau zu verteilen, müssen Sie die Funktionalitäten und Grenzwerte beider Plattformen hinsichtlich Constraints verstehen.

Grundlegendes zu Azure Databricks-Constraints

Azure Databricks unterstützt Constraints für Primär- und Fremdschlüssel ab Databricks Runtime 15.2. Diese Constraints sind informationell und werden nicht standardmäßig erzwungen, d. h. sie verhindern keine Datenintegritätsverstöße, können jedoch verwendet werden, um Abfragen zu optimieren und Metadaten zu Datenbeziehungen bereitzustellen. Siehe Deklarieren von Primärschlüssel- und Fremdschlüsselbeziehungen.

Grundlegendes dazu, wie Tableau Constraints zum Erstellen von Tabellenbeziehungen verwendet

Tableau erzwingt Constraints für Primär- und Fremdschlüssel nicht direkt, verwendet jedoch Beziehungen zum Modellieren von Datenverbindungen. Um mit Constraints in Tableau zu arbeiten, müssen Sie wissen, dass das Datenmodell von Tableau zwei Modellierungsebenen bietet: eine logische Ebene und eine physische Ebene. Siehe Tableau-Datenmodell. Die Auswirkungen dieses zweistufigen Datenmodells auf Azure Databricks-Constraints, die als Beziehungen in Tableau erkannt werden, werden weiter unten erläutert.

Verbinden von Azure Databricks mit Tableau

Wenn Sie Azure Databricks mit Tableau verbinden, versucht Tableau, Beziehungen auf der physischen Ebene zwischen Tabellen basierend auf vorhandenen Schlüssel-Constraints und übereinstimmenden Feldern zu erstellen. Tableau versucht automatisch, Beziehungen auf der physischen Ebene basierend auf in Azure Databricks definierten Constraints für Primär- und Fremdschlüssel zu erkennen und zu erstellen. Wenn keine Schlüssel-Constraints definiert sind, verwendet Tableau übereinstimmende Spaltennamen, um Verknüpfungen automatisch zu generieren. Auf der logischen Ebene werden nur Übereinstimmungen mit einzelspaltigen Namen verwendet, um eine Beziehung zu bestimmen. Auf der physischen Ebene erkennt dieser Spaltennamensabgleich sowohl einfache (einspaltige) als auch zusammengesetzte (mehrspaltige) Schlüsselbeziehungen.

Wenn Tableau die übereinstimmenden Felder nicht ermitteln kann, müssen Sie die Verknüpfungsbeziehung zwischen den beiden Tabellen auf der physischen Ebene manuell angeben, indem Sie die Spalten, die Bedingung und den Typ der Constraint angeben. Von der logischen Ebene in der Benutzeroberfläche zur physischen Ebene wechseln können Sie mit einem Doppelklick Sie auf die Tabelle auf der logischen Ebene.

Zusätzliche Ressourcen