قم بتوصيل Excel بـ Apache Hadoop في Azure HDInsight باستخدام برنامج تشغيل Microsoft Hive ODBC

من الميزات الرئيسية لحل البيانات الكبيرة من Microsoft تكامل مكونات المعلومات المهنية من Microsoft مع مجموعات Apache Hadoop الموزعة في HDInsight. مثال على ذلك القدرة على توصيل Excel بمستودع بيانات Apache Hive الخاص بمجموعة Hadoop. قم بالاتصال باستخدام برنامج تشغيل Microsoft Apache Hive Open Database Connectivity (ODBC).

يمكنك توصيل البيانات المرتبطة بمجموعة HDInsight من Excel باستخدام الوظيفة الإضافية Microsoft Power Query لبرنامج Excel. لمزيد من المعلومات، راجع توصيل Excel بـ HDInsight باستخدام Power Query.

المتطلبات الأساسية

قبل أن تبدأ هذه المقالة، يجب أن تتوفر لديك العناصر التالية:

  • مجموعة HDInsight Hadoop. لإنشاء واحدة، راجع ابدأ باستخدام Azure HDInsight.
  • محطة عمل مع Office 2010 Professional Plus أو أحدث، أو Excel 2010 أو أحدث.

تثبيت برنامج تشغيل Microsoft Apache Hive ODBC

قم بتنزيل وتثبيت Microsoft Apache Hive ODBC Driver. اختر الإصدار الذي يتطابق مع إصدار التطبيق الذي ستستخدم فيه برنامج تشغيل ODBC. لهذه المقالة، يتم استخدام برنامج التشغيل لبرنامج Office Excel.

إنشاء مصدر بيانات Apache Hive ODBC

توضح لك الخطوات التالية كيفية إنشاء Apache Hive ODBC Data Source.

  1. من Windows، انتقل إلى البدء> أدوات Windows الإدارية> مصادر بيانات ODBC (32-بت)/(64-بت). يفتح هذا الإجراء نافذة ODBC Data Source Administrator.

    مسؤول مصدر بيانات OBDC.

  2. من علامة التبويب User DSN، حدد Add لفتح Create New Data Source النافذة.

  3. حدد Microsoft Apache Hive ODBC Driver، ثم حدد إنهاء لفتح نافذة Microsoft Hive ODBC Driver DSN Setup.

  4. اكتب أو حدد القيم التالية:

    الخاصية ‏‏الوصف
    اسم مصدر البيانات حدد اسماً لمصدر البيانات
    المضيف (المضيفون) أدخل HDInsightClusterName.azurehdinsight.net. على سبيل المثال، myHDICluster.azurehdinsight.net ملاحظة: يتم دعم HDInsightClusterName-int.azurehdinsight.net طالما أن الجهاز الظاهري للعميل مقيد بنفس الشبكة الظاهرية.
    المنفذ استخدام 443. (تم تغيير هذا المنفذ من 563 إلى 443.)
    قاعدة البيانات استخدم افتراضي.
    آلِيَّة حدد Windows Azure HDInsight Service
    اسم المستخدم أدخل اسم مستخدم HDInsight لنظام مجموعة HTTP. اسم المستخدم الافتراضي هو admin.
    كلمة المرور أدخل كلمة مرور مستخدم نظام المجموعة HDInsight. حدد خانة الاختيار حفظ كلمة المرور (مشفرة).
  5. اختياري: حدد Advanced Options...

    المعلمة ‏‏الوصف‬
    استخدم الاستعلام الأصلي عند تحديده، برنامج تشغيل ODBC، لا تحاول تحويل TSQL إلى HiveQL. يجب عليك استخدامه فقط إذا كنت متأكداً بنسبة 100% من أنك ترسل عبارات HiveQL خالصة. عند الاتصال بـ Azure SQL Database أو SQL Server، يجب أن تتركها دون تحديد.
    الصفوف التي تم جلبها لكل مجموعة عند إحضار عدد كبير من السجلات، قد يلزم ضبط هذه المعلمة لضمان الأداء الأمثل.
    طول عمود السلسلة الافتراضي، وطول العمود الثنائي، ومقياس العمود العشري قد تؤثر أطوال نوع البيانات ودقتها على كيفية رجوع البيانات. تتسبب في إرجاع معلومات غير صحيحة بسبب فقدان الدقة، أو الاقتطاع.

    خيارات تكوين DSN المتقدمة.

  6. حدد اختبار لاختبار مصدر البيانات. عند تكوين مصدر البيانات تكويناً صحيحاً، تظهر نتيجة الاختبار نجاح!

  7. حدد موافق لإغلاق إطار الاختبار.

  8. حدد OK لإغلاق نافذة Microsoft Hive ODBC Driver DSN Setup.

  9. حدد موافق لإغلاق نافذة ODBC Data Source Administrator.

استيراد البيانات إلى Excel من HDInsight

تصف الخطوات التالية طريقة استيراد البيانات من جدول Apache Hive إلى مصنف Excel باستخدام مصدر بيانات ODBC الذي قمت بإنشائه في القسم السابق.

  1. افتح مصنفاً جديداً أو موجوداً في Excel.

  2. من علامة التبويب البيانات، انتقل إلى Get Data>من مصادر أخرى>من ODBC لبدء تشغيل من نافذة ODBC.

    افتح معالج اتصال بيانات Excel.

  3. من القائمة المنسدلة، حدد اسم مصدر البيانات الذي قمت بإنشائه في القسم الأخير ثم حدد موافق.

  4. لأول استخدام، سيتم فتح مربع حوار برنامج تشغيل ODBC. حدد Windows من القائمة اليسرى. ثم حدد Connect لفتح نافذة Navigator.

  5. من Navigator انتقل إلى HIVE>default>hivesampletable، ثم حدد Load. يستغرق استيراد البيانات من Excel بضع لحظات.

    متصفح HDInsight Excel Hive ODBC.

الخطوات التالية

في هذه المقالة، تعلمت كيفية استخدام برنامج تشغيل Microsoft Apache Hive ODBC لاسترداد البيانات من خدمة HDInsight إلى Excel. وبالمثل، يمكنك استرداد البيانات من خدمة HDInsight إلى قاعدة بيانات SQL. من الممكن أيضاً تحميل البيانات إلى خدمة HDInsight. لمعرفة المزيد، راجع: