الاتصال Tableau إلى Azure Databricks

توضح هذه المقالة كيفية توصيل Azure Databricks ب Tableau Desktop وتتضمن معلومات حول إصدارات Tableau الأخرى. يمكنك الاتصال من خلال Partner الاتصال أو يمكنك الاتصال يدويا.

عند استخدام Azure Databricks كمصدر بيانات مع Tableau، يمكنك توفير تحليلات تفاعلية قوية، وتقديم مساهمات علماء البيانات ومهندسي البيانات إلى محللي الأعمال من خلال التوسع إلى مجموعات البيانات الضخمة.

لمعرفة المزيد حول كيفية استخدام Tableau Desktop لإنشاء التقارير والمرئيات، يرجى قراءة البرنامج التعليمي: بدء استخدام Tableau Desktop.

المتطلبات

الاتصال إلى Tableau Desktop باستخدام Partner الاتصال

يمكنك استخدام Partner الاتصال لتوصيل مجموعة أو مستودع SQL ب Tableau Desktop ببضع نقرات فقط.

  1. تأكد من أن حساب Azure Databricks ومساحة العمل والمستخدم الذي سجل الدخول يفي بمتطلبات الاتصال الشريك.
  2. في الشريط الجانبي، انقر فوق زر الاتصال الشريكPartner الاتصال.
  3. انقر فوق تجانب Tableau .
  4. في مربع حوار الاتصال إلى الشريك، بالنسبة إلى الحساب، اختر اسم مورد حساب Azure Databricks الذي تريد توصيله.
  5. اختر تنزيل ملف الاتصال.
  6. افتح ملف الاتصال الذي تم تنزيله، والذي يبدأ تشغيل Tableau Desktop.
  7. في Tableau Desktop، أدخل بيانات اعتماد المصادقة، ثم انقر فوق تسجيل الدخول:
    • لاستخدام رمز مميز لمعرف Microsoft Entra، أدخل رمزا مميزا لاستخدم المستخدم والرمز المميز لمعرف Microsoft Entra لكلمة المرور.
    • لاستخدام رمز مميز للوصول الشخصي ل Azure Databricks، أدخل الرمز المميز لاستخدم المستخدم ورمز الوصول الشخصي الخاص بك لكلمة المرور.
    • لاستخدام بيانات اعتماد معرف Microsoft Entra، انقر فوق تحرير الاتصال ion، وانقر نقرا مزدوجا فوق قاعدة البيانات في علامة التبويب بيانات، ثم حدد معرف Microsoft Entra في قائمة المصادقة.
      • بالنسبة إلى Tableau Desktop 2021.1 والإصدارات الأحدث:

        1. إذا كنت لا تستخدم حساب ضيف B2B لمعرف Microsoft Entra (المعروف سابقا باسم Azure Active Directory) أو Azure Databricks على Azure Government، يمكنك ببساطة إدخال https://login.microsoftonline.com/common كنقطة نهاية OAuth.

        مصادقة التكوين

        1. إذا كنت تستخدم حساب ضيف Microsoft Entra ID B2B أو Azure Databricks على Azure Government، فاتصل بالمسؤول للحصول على مستودع معرف Microsoft Entra مخصص.

        إشعار

        إذا لم تكن مسؤولا، فسيعرض خطأ الحاجة إلى موافقة المسؤول. اطلب من مسؤول عام أو مسؤول تطبيق سحابي أو مسؤول تطبيق منحك أذونات للاتصال ب Tableau، ثم حاول تسجيل الدخول مرة أخرى.

        إذا تم تمكين سير عمل موافقة المسؤول في حساب Microsoft Entra ID الخاص بك، فسيطالبك Tableau Desktop بطلب الوصول إلى Tableau. بعد موافقة مسؤول عام أو مسؤول تطبيق سحابي أو مسؤول تطبيق على الطلب، حاول تسجيل الدخول مرة أخرى.

بعد الاتصال بنجاح ب Tableau Desktop، يمكنك التوقف هنا. تغطي المعلومات المتبقية في هذه المقالة معلومات إضافية حول Tableau، مثل الاتصال يدويا ب Tableau Desktop، وإعداد Tableau Server على Linux، وكيفية استخدام Tableau Online، وأفضل الممارسات واستكشاف الأخطاء وإصلاحها باستخدام Tableau.

الاتصال إلى Tableau Desktop يدويا

اتبع هذه الإرشادات للاتصال بمجموعة أو مستودع SQL باستخدام Tableau Desktop.

إشعار

للاتصال بشكل أسرع ب Tableau Desktop، استخدم Partner الاتصال.

  1. بدء تشغيل Tableau Desktop.

  2. انقر فوق ملف > جديد.

  3. على علامة التبويب بيانات، انقر فوق الاتصال إلى البيانات.

  4. في قائمة الموصلات، انقر فوق Databricks.

  5. أدخل اسم مضيف الخادم ومسار HTTP.

  6. بالنسبة للمصادقة، اختر أسلوب المصادقة، وأدخل بيانات اعتماد المصادقة، ثم انقر فوق تسجيل الدخول.

    • لاستخدام رمز مميز لمعرف Microsoft Entra، حدد الرمز المميز للوصول الشخصي وأدخل الرمز المميز لمعرف Microsoft Entra لكلمة المرور.

    • لاستخدام رمز مميز للوصول الشخصي ل Azure Databricks، حدد رمز الوصول الشخصي وأدخل رمز الوصول الشخصي الخاص بك لكلمة المرور.

    • لاستخدام بيانات اعتماد معرف Microsoft Entra، حدد معرف Microsoft Entra.

      بالنسبة إلى Tableau Desktop 2021.1 والإصدارات الأحدث:

      • إذا كنت لا تستخدم حساب ضيف B2B لمعرف Microsoft Entra (المعروف سابقا باسم Azure Active Directory) أو Azure Databricks على Azure Government، يمكنك ببساطة إدخال https://login.microsoftonline.com/common كنقطة نهاية OAuth.

        مصادقة التكوين

        • إذا كنت تستخدم حساب ضيف Microsoft Entra ID B2B أو Azure Databricks على Azure Government، فاتصل بالمسؤول للحصول على مستودع معرف Microsoft Entra مخصص.

      إشعار

      إذا لم تكن مسؤولا، فسيعرض خطأ الحاجة إلى موافقة المسؤول. اطلب من مسؤول عام أو مسؤول تطبيق سحابي أو مسؤول تطبيق منحك أذونات للاتصال ب Tableau، ثم حاول تسجيل الدخول مرة أخرى.

      إذا تم تمكين سير عمل موافقة المسؤول في حساب Microsoft Entra ID الخاص بك، فسيطالبك Tableau Desktop بطلب الوصول إلى Tableau. بعد موافقة مسؤول عام أو مسؤول تطبيق سحابي أو مسؤول تطبيق على الطلب، حاول تسجيل الدخول مرة أخرى.

    إذا تم تمكين كتالوج Unity لمساحة العمل الخاصة بك، فقم بتعيين الكتالوج الافتراضي بالإضافة إلى ذلك. في علامة التبويب خيارات متقدمة، لخصائص الاتصال ion، أضف Catalog=<catalog-name>. لتغيير الكتالوج الافتراضي، في علامة التبويب Initial SQL ، أدخل USE CATALOG <catalog-name>.

بعد الاتصال بنجاح ب Tableau Desktop، يمكنك التوقف هنا. تغطي المعلومات المتبقية في هذه المقالة معلومات إضافية حول Tableau، مثل إعداد Tableau Server على Linux، وكيفية استخدام Tableau Online، وأفضل الممارسات واستكشاف الأخطاء وإصلاحها باستخدام Tableau.

خادم Tableau على Linux

قم بالتحرير /etc/odbcinst.ini لتضمين ما يلي:

[Simba Spark ODBC Driver 64-bit]
Description=Simba Spark ODBC Driver (64-bit)
Driver=/opt/simba/spark/lib/64/libsparkodbc_sb64.so

إشعار

يوصي Tableau Server على Linux ببنية معالجة 64 بت.

نشر مصنف وتحديثه على Tableau Online

توضح هذه المقالة كيفية نشر مصنف من Tableau Desktop إلى Tableau Online وإبقائه محدثا عند تغيير مصدر البيانات. تحتاج إلى مصنف في Tableau Desktop وحساب Tableau Online .

  1. استخراج بيانات المصنف من Tableau Desktop: في Tableau Desktop، مع عرض المصنف الذي تريد نشره، انقر فوق استخراج البيانات><data-source-name>>.
  2. في مربع الحوار استخراج البيانات ، انقر فوق استخراج.
  3. استعرض وصولا إلى موقع على جهازك المحلي حيث تريد حفظ البيانات المستخرجة، ثم انقر فوق حفظ.
  4. نشر مصدر بيانات المصنف إلى Tableau Online: في Tableau Desktop، انقر فوق Server Publish Data Source<data-source-name>> .>
  5. إذا تم عرض مربع الحوار تسجيل الدخول إلى خادم Tableau، فانقر فوق الارتباط Tableau Online، واتبع الإرشادات التي تظهر على الشاشة لتسجيل الدخول إلى Tableau Online.
  6. في مربع الحوار نشر مصدر البيانات إلى Tableau Online ، إلى جانب تحديث غير ممكن، انقر فوق الارتباط تحرير .
  7. في مربع القائمة المنبثقة الذي يعرض، للمصادقة، قم بتغيير التحديث غير ممكن إلى السماح بالوصول إلى التحديث.
  8. انقر فوق أي مكان خارج هذه القائمة المنبثقة لإخفائها.
  9. حدد تحديث المصنف لاستخدام مصدر البيانات المنشور.
  10. انقر فوق نشر. يتم عرض مصدر البيانات في Tableau Online.
  11. في Tableau Online، في مربع الحوار اكتمال النشر، انقر فوق جدول، واتبع الإرشادات التي تظهر على الشاشة.
  12. نشر المصنف إلى Tableau Online: في Tableau Desktop، مع عرض المصنف الذي تريد نشره، انقر فوق Server > Publish Workbook.
  13. في مربع الحوار نشر مصنف إلى Tableau Online ، انقر فوق نشر. يتم عرض المصنف في Tableau Online.

يتحقق Tableau Online من التغييرات التي تم إدخالها على مصدر البيانات وفقا للجدول الزمني الذي عينته، ويحدث المصنف المنشور إذا تم الكشف عن التغييرات.

لمزيد من المعلومات، راجع ما يلي على موقع Tableau على الويب:

أفضل الممارسات واستكشاف الأخطاء وإصلاحها

الإجراءان الأساسيان لتحسين استعلامات Tableau هما:

  • تقليل عدد السجلات التي يتم الاستعلام عنها وتصورها في مخطط واحد أو لوحة معلومات واحدة.
  • تقليل عدد الاستعلامات التي يتم إرسالها بواسطة Tableau في مخطط أو لوحة معلومات واحدة.

يعتمد تحديد أي تجربة أولا على لوحة المعلومات الخاصة بك. إذا كان لديك عدد من المخططات المختلفة للمستخدمين الفرديين جميعا في نفس لوحة المعلومات، فمن المحتمل أن Tableau يرسل العديد من الاستعلامات إلى Azure Databricks. إذا كان لديك مخططان فقط ولكنهما يستغرقان وقتا طويلا للتحميل، فمن المحتمل أن يكون هناك عدد كبير جدا من السجلات التي يتم إرجاعها بواسطة Azure Databricks لتحميلها بشكل فعال.

يمكن أن يساعدك تسجيل أداء Tableau، المتوفر على كل من Tableau Desktop وTableau Server، على فهم مكان اختناقات الأداء من خلال تحديد العمليات التي تتسبب في زمن الانتقال عند تشغيل سير عمل أو لوحة معلومات معينة.

تمكين تسجيل الأداء لتصحيح أي مشكلة Tableau

على سبيل المثال، إذا كان تنفيذ الاستعلام هو المشكلة، فأنت تعلم أن له علاقة بعملية محرك البيانات أو مصدر البيانات الذي تقوم بالاستعلام عنه. إذا كان التخطيط المرئي يعمل ببطء، فأنت تعلم أنه VizQL.

إذا كان تسجيل الأداء يشير إلى أن زمن الانتقال في تنفيذ الاستعلام، فمن المحتمل أن يستغرق Azure Databricks وقتا طويلا لإرجاع النتائج أو بواسطة ODBC/الاتصال or أو تراكب معالجة البيانات في SQL ل VizQL. عند حدوث ذلك، يجب تحليل ما تقوم بالعودة ومحاولة تغيير النمط التحليلي للحصول على لوحة معلومات لكل مجموعة أو مقطع أو مقالة بدلا من محاولة وضع كل شيء في لوحة معلومات واحدة والاعتماد على عوامل التصفية السريعة.

إذا كان الأداء الضعيف ناتجا عن الفرز أو التخطيط المرئي، فقد تكون المشكلة في عدد العلامات التي تحاول لوحة المعلومات إرجاعها. يمكن ل Azure Databricks إرجاع مليون سجل بسرعة، ولكن قد لا يتمكن Tableau من حساب التخطيط وفرز النتائج. إذا كانت هذه مشكلة، فجمع الاستعلام وتعمق في المستويات الدنيا. يمكنك أيضا تجربة جهاز أكبر، نظرا لأن Tableau مقيد فقط بالموارد المادية على الجهاز الذي يعمل عليه.

للحصول على برنامج تعليمي متعمق حول مسجل الأداء، راجع إنشاء تسجيل أداء.

الأداء على Tableau Server مقابل Tableau Desktop

بشكل عام، لا يكون سير العمل الذي يتم تشغيله على Tableau Desktop أسرع على خادم Tableau. لن يتم تنفيذ لوحة المعلومات التي لا يتم تنفيذها على Tableau Desktop على Tableau Server. وهذا أمر مهم يجب أن نضعه في الاعتبار.

في الواقع، يعد تشغيل الأشياء على سطح المكتب أسلوبا أفضل لاستكشاف الأخطاء وإصلاحها، لأن Tableau Server لديه المزيد من العمليات التي يجب مراعاتها عند استكشاف الأخطاء وإصلاحها. وإذا كانت الأمور تعمل في Tableau Desktop ولكن ليس في Tableau Server، فيمكنك تضييق المشكلة بأمان وصولا إلى العمليات في Tableau Server غير الموجودة في Tableau Desktop.

التكوين

بشكل افتراضي، تتجاوز المعلمات من عنوان URL للاتصال تلك الموجودة في Simba ODBC DSN. هناك طريقتان يمكنك من خلالهما تخصيص تكوينات ODBC من Tableau:

  • .tds ملف لمصدر بيانات واحد:

    1. اتبع الإرشادات الواردة في حفظ مصادر البيانات لتصدير .tds الملف لمصدر البيانات.
    2. ابحث عن سطر odbc-connect-string-extras='' الخاصية في .tds الملف وقم بتعيين المعلمات. على سبيل المثال، لتمكين AutoReconnect و UseNativeQuery، يمكنك تغيير السطر إلى odbc-connect-string-extras='AutoReconnect=1,UseNativeQuery=1'.
    3. أعد تحميل .tds الملف عن طريق إعادة توصيل الاتصال.

    تم تحسين مورد الحوسبة لاستخدام ذاكرة كومة الذاكرة المؤقتة أقل لجمع نتائج كبيرة، بحيث يمكن أن يخدم صفوفا أكثر لكل كتلة إحضار من الإعداد الافتراضي ل Simba ODBC. إلحاق RowsFetchedPerBlock=100000' بقيمة الخاصية odbc-connect-string-extras .

  • .tdc ملف لكافة مصادر البيانات:

    1. إذا لم تقم أبدا بإنشاء .tdc ملف، يمكنك إضافة TableauTdcExample.tdc إلى المجلد Document/My Tableau Repository/Datasources.
    2. أضف الملف إلى جميع عمليات تثبيت Tableau Desktop الخاصة بالمطورين، بحيث يعمل عند مشاركة لوحات المعلومات.

تحسين المخططات (أوراق العمل)

هناك عدد من تحسينات المخطط التكتيكي التي يمكن أن تساعدك على تحسين أداء أوراق عمل Tableau.

بالنسبة إلى عوامل التصفية التي لا تتغير كثيرا ولا يقصد بها التفاعل معها، استخدم عوامل تصفية السياق، التي تسرع وقت التنفيذ. قاعدة أخرى جيدة من الإبهام هي استخدام if/else عبارات بدلا من case/when العبارات في استعلاماتك.

يمكن ل Tableau دفع عوامل التصفية لأسفل إلى مصادر البيانات، والتي يمكنها تسريع سرعات الاستعلام بشكل كبير. راجع التصفية عبر مصادر بيانات متعددة باستخدام معلمة وتصفية البيانات عبر مصادر بيانات متعددة للحصول على مزيد من المعلومات حول عوامل تصفية دفع مصدر البيانات لأسفل.

من الأفضل تجنب حسابات الجدول إذا كنت تستطيع ذلك لأنها تحتاج إلى مسح مجموعة البيانات الكاملة ضوئيا. لمزيد من المعلومات حول حسابات الجدول، راجع تحويل القيم باستخدام حسابات الجدول.

تحسين لوحات المعلومات

فيما يلي عدد من التلميحات وتمارين استكشاف الأخطاء وإصلاحها التي يمكنك تطبيقها لتحسين أداء لوحة معلومات Tableau.

أحد المصادر الشائعة للمشكلات المتعلقة بلوحات معلومات Tableau المتصلة ب Azure Databricks هو استخدام عوامل التصفية السريعة على لوحات المعلومات الفردية التي تخدم عددا من المستخدمين أو الوظائف أو الشرائح المختلفة. يمكنك إرفاق عوامل تصفية سريعة عمومية بجميع المخططات على لوحة المعلومات. إنها ميزة رائعة، ولكنها يمكن أن تسبب مشاكل بسرعة. يؤدي عامل تصفية سريع عمومي واحد على لوحة معلومات تحتوي على خمسة مخططات إلى إرسال 10 استعلامات على الأقل إلى Azure Databricks. يمكن أن يتصاعد هذا إلى أعداد أكبر مع إضافة المزيد من عوامل التصفية ويمكن أن يسبب مشاكل هائلة في الأداء، لأن Spark لم يتم إنشاؤه للتعامل مع العديد من الاستعلامات المتزامنة بدءا من نفس اللحظة بالضبط. يصبح هذا أكثر إشكالية عندما لا يكون نظام مجموعة Azure Databricks أو مستودع SQL الذي تستخدمه كبيرا بما يكفي للتعامل مع الحجم الكبير للاستعلامات.

كخطوة أولى، نوصي باستخدام تسجيل أداء Tableau لاستكشاف ما قد يسبب المشكلة وإصلاحها.

إذا كان الأداء الضعيف ناتجا عن الفرز أو التخطيط المرئي، فقد تكون المشكلة في عدد العلامات التي تحاول لوحة المعلومات إرجاعها. يمكن ل Azure Databricks إرجاع مليون سجل بسرعة، ولكن قد لا يتمكن Tableau من حساب التخطيط وفرز النتائج. إذا كانت هذه مشكلة، فجمع الاستعلام وتعمق في المستويات الدنيا. يمكنك أيضا تجربة جهاز أكبر، نظرا لأن Tableau مقيد فقط بالموارد المادية على الجهاز الذي يعمل عليه.

للحصول على معلومات حول التنقل لأسفل في Tableau، راجع التنقل لأسفل في التفاصيل.

بشكل عام، غالبا ما تكون رؤية العديد من العلامات الدقيقة نمطا تحليليا ضعيفا، لأنه لا يوفر رؤى. يعد التنقل لأسفل من مستويات أعلى من التجميع أكثر منطقية ويقلل من عدد السجلات التي تحتاج إلى المعالجة والتصور.

استخدام الإجراءات لتحسين لوحات المعلومات

للتنقل من مجموعة إلى مقطع إلى آخر من أجل الحصول على نفس التحليل والمعلومات مثل لوحة معلومات "المحيط المغلي"، يمكنك استخدام إجراءات Tableau. تسمح لك الإجراءات بالنقر فوق علامة (على سبيل المثال حالة على خريطة) وإرسالها إلى لوحة معلومات أخرى تقوم بالتصفية استنادا إلى الحالة التي تنقر فوقها. يقلل هذا من الحاجة إلى وجود العديد من عوامل التصفية على لوحة معلومات واحدة ويقلل من عدد السجلات التي تحتاج إلى إنشاء، لأنه يمكنك تعيين إجراء لعدم إنشاء سجلات حتى تحصل على دالة تقييم للتصفية عليها.

لمزيد من المعلومات، راجع الإجراءات و6 تلميحات لجعل لوحات المعلومات أكثر أداء.

التخزين المؤقت

يعد التخزين المؤقت للبيانات طريقة جيدة لتحسين أداء أوراق العمل أو لوحات المعلومات.

التخزين المؤقت في Tableau

يحتوي Tableau على أربع طبقات من التخزين المؤقت قبل أن يعود إلى البيانات، سواء كانت تلك البيانات في اتصال مباشر أو استخراج:

  • الإطارات المتجانبة: إذا قام شخص ما بتحميل نفس لوحة المعلومات بالضبط ولم يتغير أي شيء، فسيحاول Tableau إعادة استخدام الإطارات المتجانبة نفسها للمخططات. هذا مشابه للوحات الخرائط من Google.
  • النموذج: هناك حسابات رياضية تستخدم لإنشاء مرئيات في حالة عدم إمكانية استخدام الإطارات المتجانبة. يحاول خادم Tableau استخدام نفس النماذج.
  • ملخص: يتم تخزين النتائج التجميعية للاستعلامات أيضا. هذا هو مستوى "الدفاع" الثالث. إذا أرجع استعلام Sum(Sales), Count(orders), Sum(Cost), in a previous query and a future query wants just Sum(Sales), then Tableau grabs that result and uses it.
  • ذاكرة التخزين المؤقت الأصلية: إذا كان الاستعلام هو نفسه تماما الاستعلام الآخر، يستخدم Tableau نفس النتائج. هذا هو المستوى الأخير من التخزين المؤقت. إذا فشل ذلك، فسينتقل Tableau إلى البيانات.

تكرار التخزين المؤقت في Tableau

يحتوي Tableau على إعدادات إدارية للتخزين المؤقت في كثير من الأحيان. إذا تم تعيين الخادم إلى تحديث أقل في كثير من الأحيان، يحتفظ Tableau بالبيانات في ذاكرة التخزين المؤقت لمدة تصل إلى 12 ساعة. إذا تم تعيينه إلى Refresh More Often، فسيعود Tableau إلى البيانات الموجودة في كل تحديث للصفحة.

يجب أن يكون العملاء الذين لديهم نفس لوحة المعلومات التي يتم استخدامها مرة أخرى - على سبيل المثال، "تقارير البنية الأساسية لبرنامج ربط العمليات التجارية صباح الاثنين" - على خادم تم تعيينه إلى Refresh Less Often بحيث تستخدم جميع لوحات المعلومات نفس ذاكرة التخزين المؤقت.

احترار ذاكرة التخزين المؤقت في Tableau

في Tableau، يمكنك تجهيز ذاكرة التخزين المؤقت عن طريق تعيين اشتراك للوحة المعلومات ليتم إرسالها قبل أن تريد عرض لوحة المعلومات. وذلك لأن لوحة المعلومات تحتاج إلى تقديم من أجل إنشاء صورة للبريد الإلكتروني للاشتراك. راجع تسخين ذاكرة التخزين المؤقت لخادم Tableau باستخدام الاشتراكات.

Tableau Desktop: يظهر الخطأ The drivers... are not properly installed

المشكلة: عند محاولة توصيل Tableau Desktop ب Databricks، يعرض Tableau رسالة خطأ في مربع حوار الاتصال مع ارتباط إلى صفحة تنزيل برنامج التشغيل، حيث يمكنك العثور على ارتباطات برامج التشغيل وإرشادات التثبيت.

السبب: لا يقوم تثبيت Tableau Desktop بتشغيل برنامج تشغيل معتمد.

الحل: قم بتنزيل إصدار برنامج تشغيل Databricks ODBC 2.6.15 أو أعلى.

راجع أيضا: الخطأ "برامج التشغيل... غير مثبتة بشكل صحيح" على موقع Tableau على الويب.

الموارد الإضافية