Megosztás a következőn keresztül:


A Tableau és az Azure Databricks csatlakoztatása

Ez a cikk bemutatja, hogyan csatlakozhat a Partner Connect használatával az Azure Databricksből a Tableau Desktophoz, illetve a Tableau Desktopból vagy a Tableau Cloudból az Azure Databrickshez. Ez a cikk a Linuxon futó Tableau Serverről is tartalmaz információkat.

Feljegyzés

Az Azure Databricks Tableau Serverről való bejelentkezésének konfigurálásához tekintse meg az Azure Databricks tableau serverről való bejelentkezésének konfigurálását.

Ha az Azure Databrickset adatforrásként használja a Tableauval, hatékony interaktív elemzéseket végezhet, így az adattudósok és adatmérnökök közreműködését nagy adathalmazokra skálázhatja az üzleti elemzők számára.

A Tableau és az Azure Databricks csatlakoztatásának követelményei

Az Azure Databricks csatlakoztatása a Tableau Desktophoz a Partner Connect használatával

A Partner Connect segítségével mindössze néhány kattintással csatlakoztathat számítási erőforrást vagy SQL Warehouse-t a Tableau Desktophoz.

  1. Győződjön meg arról, hogy az Azure Databricks-fiók, a munkaterület és a bejelentkezett felhasználó mind megfelelnek a Partner Connect követelményeinek .
  2. Az oldalsávon kattintson Partnercsatlakozás gomb a Partner Connect elemre.
  3. Kattintson a Tableau csempére.
  4. A Csatlakozás partnerhez párbeszédpanel Compute esetében válassza ki a csatlakoztatni kívánt Azure Databricks számítási erőforrás nevét.
  5. Válassza a Kapcsolatfájl letöltése lehetőséget.
  6. Nyissa meg a letöltött kapcsolatfájlt, amely elindítja a Tableau Desktopot.
  7. A Tableau Desktopban adja meg a hitelesítési hitelesítő adatait, majd kattintson a Bejelentkezés gombra:
    • A Microsoft Entra ID-jogkivonat használatához adja meg a felhasználónév és a Microsoft Entra azonosító jogkivonatát a jelszóhoz.
    • Az Azure Databricks személyes hozzáférési jogkivonatának használatához adja meg a felhasználónév és a jelszóhoz tartozó személyes hozzáférési jogkivonat jogkivonatát.
    • A Microsoft Entra-azonosító hitelesítő adatainak használatához kattintson a Kapcsolat szerkesztése elemre, kattintson duplán az adatbázisra az Adatok lapon, majd válassza a Microsoft Entra-azonosítót a Hitelesítési listában.
      • Tableau Desktop 2021.1 és újabb verziók esetén:

        1. Ha nem használ Microsoft Entra-azonosítót (korábban Azure Active Directory) B2B-vendégfiókot vagy Azure Databrickset az Azure Governmentben, egyszerűen beírhatja https://login.microsoftonline.com/common OAuth-végpontként.

        Hitelesítés konfigurálása

        1. Ha Microsoft Entra ID B2B-vendégfiókot vagy Azure Databricks-et használ az Azure Governmentben, forduljon a rendszergazdához egy dedikált Microsoft Entra-azonosítóraktár beszerzéséhez.

        Feljegyzés

        Ha Ön nem rendszergazda, megjelenik a Szükséges rendszergazdai jóváhagyási hiba. Kérje meg egy felhőalkalmazás-rendszergazdát vagy alkalmazásadminisztrátort, hogy adjon engedélyeket a Tableauhoz való csatlakozáshoz, majd próbáljon meg újra bejelentkezni.

        Ha a Microsoft Entra ID-fiókjában engedélyezve van a rendszergazdai hozzájárulási munkafolyamat, a Tableau Desktop kéri, hogy kérjen hozzáférést a Tableau-hoz. Miután egy felhőalkalmazás-rendszergazda vagy alkalmazásadminisztrátor jóváhagyta a kérést, próbáljon meg újra bejelentkezni.

A Tableau Desktop csatlakoztatása az Azure Databrickshez

Az alábbi utasításokat követve csatlakozhat a Tableau Desktopból egy számítási erőforráshoz vagy sql warehouse-hoz.

Feljegyzés

Ha gyorsabban szeretne csatlakozni a Tableau Desktophoz, használja a Partner Connectet.

  1. Indítsa el a Tableau Desktopot.

  2. Kattintson az Új fájl > gombra.

  3. Az Adatok lapon kattintson a Csatlakozás az adatokhoz elemre.

  4. Az összekötők listájában kattintson a Databricks elemre.

  5. Adja meg a kiszolgáló állomásnevét és HTTP-elérési útját.

  6. Hitelesítéshez válassza ki a hitelesítési módszert, adja meg a hitelesítési hitelesítő adatait, majd kattintson a Bejelentkezés gombra.

    • Microsoft Entra-azonosító jogkivonat használatához válassza a Személyes hozzáférési jogkivonatot, és adja meg a Jelszóhoz tartozó Microsoft Entra-azonosító jogkivonatot.

    • Az Azure Databricks személyes hozzáférési jogkivonatának használatához válassza a Személyes hozzáférési jogkivonatot, és adja meg a jelszóhoz tartozó személyes hozzáférési jogkivonatot.

    • A Microsoft Entra-azonosító hitelesítő adatainak használatához válassza a Microsoft Entra-azonosítót.

      Tableau Desktop 2021.1 és újabb verziók esetén:

      Feljegyzés

      Ha Ön nem rendszergazda, megjelenik a Szükséges rendszergazdai jóváhagyási hiba. Kérje meg egy felhőalkalmazás-rendszergazdát vagy alkalmazásadminisztrátort, hogy adjon engedélyeket a Tableauhoz való csatlakozáshoz, majd próbáljon meg újra bejelentkezni.

      Ha a Microsoft Entra ID-fiókjában engedélyezve van a rendszergazdai hozzájárulási munkafolyamat, a Tableau Desktop kéri, hogy kérjen hozzáférést a Tableau-hoz. Miután egy felhőalkalmazás-rendszergazda vagy alkalmazásadminisztrátor jóváhagyta a kérést, próbáljon meg újra bejelentkezni.

    Ha a Unity Catalog engedélyezve van a munkaterületen, állítsa be az alapértelmezett katalógust is. A Speciális lapon adja hozzá Catalog=<catalog-name>a Kapcsolat tulajdonságai lehetőséget. Az alapértelmezett katalógus módosításához a Kezdeti SQL lapon írja be a következőt USE CATALOG <catalog-name>:

Tableau Cloud csatlakoztatása az Azure Databrickshez

Az alábbi utasításokat követve csatlakozhat számítási erőforráshoz vagy SQL-raktárhoz a Tableau Cloudból.

  • Új munkafüzet indítása
  • A menüsávon kattintson az Új adatforrás adatai elemre>.
  • A Csatlakozás az adatokhoz lapon kattintson az Összekötők>Databricks elemre.
  • Az Azure Databricks lapon adja meg a kiszolgáló állomásnevét és a HTTP-elérési utat .
  • Válassza ki a hitelesítési módszert, és adja meg a kért adatokat (ha vannak ilyenek).
  • Kattintson a Bejelentkezés elemre.

Tableau Server Linuxon

Szerkesztés /etc/odbcinst.ini a következők belefoglalásához:

[Simba Spark ODBC Driver 64-bit]
Description=Simba Spark ODBC Driver (64-bit)
Driver=/opt/simba/spark/lib/64/libsparkodbc_sb64.so

Feljegyzés

A Tableau Server Linuxon a 64 bites feldolgozási architektúrát javasolja.

Munkafüzet közzététele és frissítése a Tableau Cloudban a Tableau Desktopból

Ez a cikk bemutatja, hogyan tehet közzé munkafüzetet a Tableau Desktopból a Tableau Cloudba, és hogyan tarthatja naprakészen, amikor az adatforrás megváltozik. Szüksége van egy munkafüzetre a Tableau Desktopban és egy Tableau Cloud-fiókban.

  1. A munkafüzet adatainak kinyerése a Tableau Desktopból: a Tableau Desktopban a közzétenni kívánt munkafüzettel kattintson az Adatok > <data-source-name>> kinyerése elemre.
  2. Az Adatok kinyerése párbeszédpanelen kattintson a Kinyerés gombra.
  3. Keresse meg a helyi gépen azt a helyet, ahová menteni szeretné a kinyert adatokat, majd kattintson a Mentés gombra.
  4. Tegye közzé a munkafüzet adatforrását a Tableau Cloudban: a Tableau Desktopban kattintson a Kiszolgáló > közzététele adatforrás > <data-source-name>elemre.
  5. Ha megjelenik a Tableau Server Bejelentkezési párbeszédpanel, kattintson a Tableau Cloud hivatkozásra, és kövesse a képernyőn megjelenő utasításokat a Tableau Cloudba való bejelentkezéshez.
  6. Az Adatforrás közzététele a Tableau Cloudban párbeszédpanelEn a Nem engedélyezett frissítés mellett kattintson a Szerkesztés hivatkozásra.
  7. A hitelesítéshez megjelenítendő úszó panelen módosítsa a Frissítés nem engedélyezve lehetőséget a frissítési hozzáférés engedélyezésére.
  8. A úszó panelen kívülre kattintva elrejtheti azt.
  9. Válassza a Munkafüzet frissítése lehetőséget a közzétett adatforrás használatához.
  10. Kattintson a Közzététel gombra. Az adatforrás a Tableau Cloudban jelenik meg.
  11. A Tableau Cloud Közzététel kész párbeszédpanelén kattintson az Ütemezés gombra, és kövesse a képernyőn megjelenő utasításokat.
  12. Tegye közzé a munkafüzetet a Tableau Cloudban: a Tableau Desktopban a közzétenni kívánt munkafüzettel kattintson a Kiszolgálói > közzétételi munkafüzet elemre.
  13. A Munkafüzet közzététele a Tableau Cloudban párbeszédpanelen kattintson a Közzététel gombra. A munkafüzet a Tableau Cloudban jelenik meg.

A Tableau Cloud a beállított ütemezésnek megfelelően ellenőrzi az adatforrás módosításait, és ha módosításokat észlel, frissíti a közzétett munkafüzetet.

További információt a Tableau webhelyén talál:

Ajánlott eljárások és hibaelhárítás

A Tableau-lekérdezések optimalizálásának két alapvető művelete:

  • Csökkentse a lekérdezett és vizualizált rekordok számát egyetlen diagramon vagy irányítópulton.
  • Csökkentse a Tableau által egyetlen diagramon vagy irányítópulton küldött lekérdezések számát.

Annak eldöntése, hogy melyiket próbálja először, az irányítópulttól függ. Ha számos különböző diagramot használ az egyes felhasználók számára ugyanazon az irányítópulton, valószínű, hogy a Tableau túl sok lekérdezést küld az Azure Databricksnek. Ha csak néhány diagramot használ, de ezek betöltése hosszú időt vesz igénybe, az Azure Databricks valószínűleg túl sok rekordot ad vissza a hatékony betöltéshez.

A Tableau Desktopon és a Tableau Serveren egyaránt elérhető tableaui teljesítményrögzítés segíthet megérteni, hogy hol vannak a teljesítmény szűk keresztmetszetei, ha azonosítja azokat a folyamatokat, amelyek késést okoznak egy adott munkafolyamat vagy irányítópult futtatásakor.

Teljesítményrögzítés engedélyezése a Tableau-problémák hibakereséséhez

Ha például a lekérdezés végrehajtása a probléma, akkor tudja, hogy ennek az adatmotor folyamatához vagy a lekérdezett adatforráshoz kell köze. Ha a vizualizáció elrendezése lassan halad, akkor tudja, hogy ez a VizQL.

Ha a teljesítményrögzítés azt jelzi, hogy a késés a lekérdezés végrehajtásában van, akkor valószínű, hogy az Azure Databricks túl sok időt vesz igénybe az eredmények visszaadásával, vagy az ODBC/Connector overlay feldolgozásával az adatokat a VizQL-hez készült SQL-be. Ha ez történik, elemeznie kell a visszaadott adatokat, és meg kell kísérelnie módosítani az elemzési mintát úgy, hogy csoportonként, szegmensenként vagy cikkenként legyen irányítópult ahelyett, hogy mindent egy irányítópultba próbálna beszedni, és gyorsszűrőkre támaszkodna.

Ha a gyenge teljesítményt rendezés vagy vizualizáció elrendezése okozza, a probléma az irányítópult által visszaadni kívánt jelek száma lehet. Az Azure Databricks gyorsan visszaadhat egymillió rekordot, de a Tableau nem tudja kiszámítani az elrendezést és rendezni az eredményeket. Ha ez probléma, összesítsd a lekérdezést, és részletezd az alsó szinteket. Nagyobb gépet is kipróbálhat, mivel a Tableau-t csak azon a gépen lévő fizikai erőforrások korlátozzák, amelyen fut.

A teljesítményrögzítővel kapcsolatos részletes oktatóanyagért lásd : Teljesítményrögzítés létrehozása.

A Tableau Server és a Tableau Desktop teljesítménye

A Tableau Desktopon futó munkafolyamatok általában nem gyorsabbak a Tableau Serveren. A Tableau Desktopon nem futó irányítópultok nem lesznek végrehajtva a Tableau Serveren.

A Desktop használata sokkal jobb hibaelhárítási módszer, mivel a Tableau Server több folyamattal rendelkezik, amelyeket figyelembe kell venni a hibaelhárítás során. Ha a dolgok a Tableau Desktopban működnek, de a Tableau Serverben nem, akkor a problémát biztonságosan szűkítheti a Tableau Server azon folyamatára, amelyek nem a Tableau Desktopban találhatóak.

Konfiguráció

Alapértelmezés szerint a kapcsolati URL-cím paraméterei felülbírálják a Simba ODBC DSN-ben lévő paramétereket. Az ODBC-konfigurációkat kétféleképpen szabhatja testre a Tableauból:

  • .tds egyetlen adatforrás fájlja:

    1. Az adatforrás fájljának exportálásához .tds kövesse az Adatforrások mentése című témakör utasításait.
    2. Keresse meg a tulajdonságsort odbc-connect-string-extras='' a .tds fájlban, és állítsa be a paramétereket. Például a sor engedélyezéséhez AutoReconnect és UseNativeQuerymódosításához módosítsa a következőre odbc-connect-string-extras='AutoReconnect=1,UseNativeQuery=1': .
    3. Töltse be újra a .tds fájlt a kapcsolat újracsatlakoztatásával.

    A számítási erőforrás úgy van optimalizálva, hogy kevesebb halommemóriát használjon a nagy eredmények gyűjtéséhez, így több sort képes kiszolgálni beolvasási blokkonként, mint a Simba ODBC alapértelmezett értéke. Fűzze RowsFetchedPerBlock=100000' hozzá a odbc-connect-string-extras tulajdonság értékét.

  • .tdc fájl minden adatforráshoz:

    1. Ha még soha nem hozott létre .tdc fájlt, hozzáadhatja a TableauTdcExample.tdc fájlt a mappához Document/My Tableau Repository/Datasources.
    2. Adja hozzá a fájlt az összes fejlesztői Tableau Desktop-telepítéshez, hogy működjön az irányítópultok megosztásakor.

Diagramok (munkalapok) optimalizálása

Számos taktikai diagramoptimalizálás segíthet a Tableau-munkalapok teljesítményének javításában.

Olyan szűrők esetén, amelyek nem változnak gyakran, és nem kezelhetők, használjon környezeti szűrőket, amelyek felgyorsítják a végrehajtási időt. Egy másik jó hüvelykujjszabály az utasítások használata if/else a lekérdezésekben lévő utasítások helyett case/when .

A Tableau le tudja küldeni a szűrőket az adatforrásokba, ami javíthatja a lekérdezési sebességet. Az adatforrások leküldéses szűrőivel kapcsolatos további információkért tekintse meg a Több adatforrás szűrése paraméter használatával és az Adatok szűrése több adatforrás között című témakört.

Próbálja meg elkerülni a táblaszámításokat, mivel a teljes adatkészletet beolvasják. A táblaszámításokról további információt az Értékek átalakítása táblázatszámításokkal című témakörben talál.

Irányítópultok optimalizálása

Az alábbiakban néhány tippet és hibaelhárítási gyakorlatot talál, amelyeket a Tableau-irányítópult teljesítményének javítása érdekében alkalmazhat.

Az Azure Databrickshez csatlakoztatott Tableau-irányítópultok esetében gyakori problémaforrás lehet az egyes irányítópultok gyors szűrői, amelyek számos különböző felhasználót, függvényt vagy szegmenst szolgálnak ki. Az irányítópult összes diagramjára csatolhat gyorsszűrőket. Egy öt diagramot tartalmazó irányítópult gyors szűrője legalább 10 lekérdezést küld az Azure Databricksnek. Ez nagyobb számra nőhet, ha több szűrőt adnak hozzá, és teljesítményproblémákat okozhat, mivel a Spark nem azért van létrehozva, hogy sok egyidejű lekérdezést kezeljen ugyanabban a pillanatban. Ez akkor válik problémássá, ha a használt Azure Databricks-fürt vagy SQL Warehouse nem elég nagy a nagy mennyiségű lekérdezés kezeléséhez.

Első lépésként javasoljuk, hogy a Tableau teljesítményrögzítésével hárítsa el, hogy mi okozhatja a problémát.

Ha a gyenge teljesítményt rendezés vagy vizualizáció elrendezése okozza, a probléma az irányítópult által visszaadni kívánt jelek száma lehet. Az Azure Databricks gyorsan visszaadhat egymillió rekordot, de a Tableau nem tudja kiszámítani az elrendezést és rendezni az eredményeket. Ha ez probléma, összesítsd a lekérdezést, és részletezd az alsó szinteket. Nagyobb gépet is kipróbálhat, mivel a Tableau-t csak azon a gépen lévő fizikai erőforrások korlátozzák, amelyen fut.

A tableaui lehatolással kapcsolatos további információkért lásd : Részletezés a részletekben.

Általánosságban elmondható, hogy sok részletes jel megjelenítése gyakran gyenge elemzési minta, mivel nem nyújt betekintést. Az aggregáció magasabb szintjeiről való lehatolás több értelmet ad, és csökkenti a feldolgozandó és vizualizálandó rekordok számát.

Irányítópultok optimalizálása műveletek használatával

A Tableau _actions használatával kattintson egy jelre (például egy térképen lévő állapotra), és a rendszer egy másik irányítópultra küldi, amely a rákattintott állapot alapján szűr. Ez csökkenti annak szükségességét, hogy több szűrő legyen egy irányítópulton, és csökkenti a létrehozandó rekordok számát. (Úgy állít be egy műveletet, hogy ne hozzon létre rekordokat, amíg nem kap egy predikátumot a szűréshez.

További információ: Műveletek és 6 tipp az irányítópultok teljesítményesebbé tétele című témakörben.

Gyorsítótárazás

Az adatok gyorsítótárazása jó módszer a munkalapok vagy irányítópultok teljesítményének javítására.

Gyorsítótárazás a Tableau-ban

A Tableau négy gyorsítótárazási réteget tartalmaz, mielőtt visszatér az adatokhoz, függetlenül attól, hogy az adatok élő kapcsolatban vagy kivonatban vannak-e:

  • Csempék: Ha valaki pontosan ugyanazt az irányítópultot tölti be, és semmi sem változik, a Tableau megpróbálja újra felhasználni ugyanazokat a csempéket a diagramokhoz. Ez hasonló a Google Maps csempéihez.
  • Modell: Vannak matematikai számítások vizualizációk létrehozására abban az esetben, ha a csempék nem használhatók. A Tableau Server ugyanazokat a modelleket próbálja használni.
  • Absztrakt: A lekérdezések összesített eredményei is tárolódnak. Ez a harmadik "védelmi" szint. Ha egy lekérdezés sum(Sales), Count(orders), Sum(Cost) értéket ad vissza egy korábbi lekérdezésben, és egy jövőbeli lekérdezés csak Sum(Sales) értéket szeretne, akkor a Tableau megragadja az eredményt, és azt használja.
  • Natív gyorsítótár: Ha a lekérdezés pontosan ugyanaz, mint egy másik, a Tableau ugyanazokat az eredményeket használja. Ez a gyorsítótárazás utolsó szintje. Ha ez nem sikerül, a Tableau az adatokhoz kerül.

Gyorsítótárazási gyakoriság a Tableau-ban

A Tableau felügyeleti beállításokkal rendelkezik a többé-kevésbé gyakori gyorsítótárazáshoz. Ha a kiszolgáló ritkábban van frissítve, a Tableau legfeljebb 12 órán keresztül tárolja az adatokat a gyorsítótárban. Ha gyakrabban van beállítva frissítésre, a Tableau minden oldalfrissítésen visszatér az adatokhoz.

Azoknak az ügyfeleknek, akik ugyanazt az irányítópultot használják újra – például "hétfő reggeli folyamatjelentések" – ritkábban kell frissíteniük egy kiszolgálón, hogy az irányítópultok mindegyike ugyanazt a gyorsítótárat használja.

Gyorsítótár-melegítés a Tableau-ban

A Tableauban melegítheti a gyorsítótárat úgy, hogy beállít egy előfizetést az irányítópult elküldéséhez, mielőtt meg szeretné tekinteni az irányítópultot. Ennek az az oka, hogy az irányítópultot renderelni kell az előfizetési e-mail rendszerképének létrehozásához. Lásd : A tableau-kiszolgáló gyorsítótárának felmelegedése előfizetések használatával.

Tableau Desktop: A hiba The drivers... are not properly installed megjelenik

Probléma: Amikor a Tableau Desktopot a Databrickshez próbálja csatlakoztatni, a Tableau hibaüzenetet jelenít meg a kapcsolati párbeszédpanelen az illesztőprogram letöltési oldalára mutató hivatkozással, ahol megtalálja az illesztőprogram-hivatkozásokat és a telepítési utasításokat.

Ok: A Tableau Desktop telepítése nem támogatott illesztőprogramot futtat.

Megoldás: Töltse le a Databricks ODBC-illesztőprogram 2.6.15-ös vagy újabb verzióját.

Lásd még: "Az illesztőprogramok... nincs megfelelően telepítve" a Tableau webhelyén.

Elsődleges/ idegenkulcs-korlátozások

Az elsődleges kulcs (PK) és a külső kulcs (FK) korlátozásainak az Azure Databricksből a Tableauba való propagálásához ismernie kell mindkét platform korlátait és képességeit.

Az Azure Databricks korlátainak ismertetése

Az Azure Databricks a Databricks Runtime 15.2-től kezdve támogatja az elsődleges és a külső kulcs korlátozásait. Ezek a korlátozások tájékoztató jellegűek, és alapértelmezés szerint nem kényszeríthetők ki, ami azt jelenti, hogy nem akadályozzák meg az adatintegritás megsértését, hanem a lekérdezések optimalizálására és az adatkapcsolatok metaadatainak biztosítására használhatók. Lásd: Elsődleges kulcs- és idegenkulcs-kapcsolatok deklarálása.

A Tableau értelmezése korlátozások használatával hoz létre táblakapcsolatokat

A Tableau nem kényszeríti ki közvetlenül az elsődleges és az idegen kulcs korlátozásait, hanem kapcsolatokat használ az adatkapcsolatok modellezéséhez. A Tableau korlátainak kezeléséhez tisztában kell lennie azzal, hogy a Tableau adatmodellje két modellezési szintet kínál: egy logikai réteget és egy fizikai réteget. Lásd: Tableau Data Model. A tableaui kapcsolatokként felismert kétszintű adatmodellnek az Azure Databricks-megkötésekre gyakorolt következményeit az alábbiakban ismertetjük.

Az Azure Databricks csatlakoztatása a Tableauhoz

Amikor csatlakoztatja az Azure Databrickset a Tableauhoz, a Tableau a meglévő kulcskorlátozások és egyező mezők alapján próbál kapcsolatokat létrehozni a táblák fizikai rétegében. A Tableau automatikusan megpróbálja észlelni és létrehozni a kapcsolatokat a fizikai rétegben az Azure Databricksben definiált elsődleges és idegenkulcs-megkötések alapján. Ha nincs meghatározva kulcskorlátozás, a Tableau egyező oszlopneveket használ az illesztések automatikus létrehozásához. A logikai rétegben a rendszer csak egyoszlopos név egyezéseket használ a kapcsolat meghatározásához. A fizikai rétegben ez az oszlopnévegyezés az egyszerű (egyoszlopos) és az összetett (többoszlopos) kulcskapcsolatokat egyaránt észleli.

Ha a Tableau nem tudja meghatározni az egyező mezőket, manuálisan kell megadnia a fizikus réteg két táblája közötti illesztési kapcsolatot az oszlopok, a feltétel és a kényszer típusának megadásával. Ha a felhasználói felületen lévő logikai rétegről a fizikai rétegre szeretne átállni, kattintson duplán a logikai réteg táblázatára.

További erőforrások