توصيل Excel بـ Apache Hadoop باستخدام Power Query
من الميزات الرئيسية لحل البيانات الضخمة من Microsoft تكامل مكونات المعلومات المهنية من Microsoft مع أنظمة مجموعات Apache Hadoop في Azure HDInsight. من الأمثلة الأساسية القدرة على توصيل Excel بحساب تخزين Azure الذي يحتوي على البيانات المقترنة بنظام مجموعة Hadoop باستخدام Microsoft Power Query لوظيفة Excel الإضافية. ترشدك هذه المقالة إلى كيفية إعداد واستخدام Power Query للاستعلام عن البيانات المقترنة بنظام مجموعة Hadoop المُدار باستخدام HDInsight.
المتطلبات الأساسية
- نظام مجموعة Apache Hadoop على HDInsight. راجع بدء استخدام HDInsight على Linux.
- محطة عمل تعمل بنظام التشغيل Windows 10 أو 7 أو Windows Server 2008 R2 أو نظام تشغيل أحدث.
- تطبيقات Microsoft 365 للمؤسسة أو Office 2016 أو Office 2013 Professional Plus أو Excel 2013 Standalone أو Office 2010 Professional Plus.
تثبيت Microsoft Power Query
يمكن لـ Power Query استيراد البيانات التي تم إخراجها أو التي تم إنشاؤها بواسطة مهمة Hadoop تعمل على نظام مجموعة HDInsight.
في Excel 2016، تم دمج Power Query في شريط البيانات ضمن قسم «الحصول والتحويل». للحصول على إصدارات Excel الأقدم، قم بتنزيل Microsoft Power Query لـ Excel من مركز تنزيل Microsoft وتثبيته.
استيراد بيانات HDInsight إلى Excel
تسهل الوظيفة الإضافية Power Query لـ Excel استيراد البيانات من نظام مجموعة HDInsight إلى Excel، حيث يمكن استخدام أدوات المعلومات المهنية مثل PowerPivot وPower Map لفحص البيانات وتحليلها وتقديمها.
قم بتشغيل Excel.
قم بإنشاء مصنف فارغ جديد.
تنفيذ الخطوات التالية استنادًا إلى إصدار Excel:
برنامج Excel 2016
حدد >Data>Get Data>من Azure>من Azure HDInsight (HDFS).
Excel 2013/2010
حدد Power Query>من Azure>من Microsoft Azure HDInsight.
ملاحظة: إذا لم تشاهد القائمة Power Query، انتقل إلى الوظائف الإضافية>لخيارات>الملفات، وحدد وظائف COM الإضافية من القائمة المنسدلة إدارة في أسفل الصفحة. حدد الزر انتقال... وتحقق من أن المربع الخاص بوظيفة Power Query لـ Excel الإضافية قد تم تحديده.
ملاحظة: يتيح لك Power Query أيضًا استيراد البيانات من HDFS عن طريق تحديد من مصادر أخرى.
من مربع الحوار Azure HDInsight(HDFS)، في مربع النص اسم الحساب أو عنوان URL، أدخل اسم حساب تخزين Azure Blob المقترن بنظام المجموعة. ثم حدد موافق. يمكن أن يكون هذا الحساب هو حساب التخزين الافتراضي أو حساب تخزين مرتبط. التنسيق هو
https://StorageAccountName.blob.core.windows.net/
.بالنسبة إلى مفتاح الحساب، أدخل المفتاح لحساب تخزين Blob، ثم حدد اتصال. (تحتاج إلى إدخال معلومات الحساب في المرة الأولى فقط التي تدخل فيها إلى هذا المخزن.)
في جزء المتصفح على يمين محرر Query، انقر نقرًا مزدوجًا فوق اسم حاوية تخزين Blob المقترنة بنظام المجموعة. بشكل افتراضي، اسم الحاوية هو نفسه اسم نظام المجموعة.
حدد موقع HiveSampleData.txt في عمود الاسم (مسار المجلد هو ../hive/warehouse/hivesampletable/)، ثم حدد ثنائي على يسار HiveSampleData.txt. يأتي HiveSampleData.txt مع جميع أنظمة المجموعات. اختياريًا، يمكنك استخدام الملف الخاص بك.
إذا أردت، يمكنك إعادة تسمية أسماء الأعمدة. عندما تصبح مستعدًا، حدد إغلاق وتحميل. تم تحميل البيانات إلى المصنف الخاص بك:
الخطوات التالية
في هذه المقالة، تعلمت كيفية استخدام Power Query لاسترداد البيانات من HDInsight إلى Excel. وبالمثل، يمكنك استرداد البيانات من HDInsight إلى قاعدة بيانات azure SQL. من الممكن أيضًا تحميل البيانات إلى HDInsight. لمعرفة المزيد، راجع المقالات التالية:
- إظهار بيانات Apache Hive باستخدام معلومات Microsoft Power المهنية في Azure HDInsight.
- إظهار بيانات Interactive Query Hive باستخدام معلومات Power المهنية في Azure HDInsight.
- استخدام Apache Zeppelin لتشغيل استعلامات Apache Hive في Azure HDInsight .
- توصيل Excel بـ HDInsight باستخدام برنامج تشغيل Microsoft Hive ODBC.
- الاتصال بـ Azure HDInsight وتشغيل استعلامات Apache Hive باستخدام Data Lake Tools لـ Visual Studio.
- استخدام أداة Azure HDInsight لرمز Visual Studio.
- تحميل البيانات إلى HDInsight.