قم بتثبيت Hue واستخدامه على مجموعات HDInsight Hadoop

تعلم كيفية تثبيت Hue على مجموعات HDInsight واستخدام الاتصال إلى مسار طلبات Hue.

إشعار

Hue غير مدعوم في HDInsight 4.0 والإحدث.

ما هو Hue؟

Hue هو مجموعة من تطبيقات الويب المستخدمة للتفاعل مع نظام مجموعة Apache Hadoop يمكنك استخدام Hue لاستعراض التخزين المقترن بنظام مجموعة Hadoop (WASB، في حالة نظم مجموعات HDInsight)، تشغيل وظائف الخلية والبرامج النصية للصورة وهكذا. تتوفر المكونات التالية مع تثبيت Hue على نظام مجموعة HDINSIGHT Hadoop

  • محرر خلية Beeswax
  • Apache Pig
  • مدير Metastore
  • Apache Oozie
  • FileBrowser (الذي يتحدث إلى حاوية افتراضية WASB)
  • وظيفة المستعرض

تحذير

يتم دعم المكونات المتوفرة مع نظام مجموعة HDInsight بشكل كامل ويساعد دعم Microsoft على عزل وحل المشكلات المتعلقة بهذه المكونات.

تتلقى المكونات المخصصة دعمًا تجاريًا معقولاً لمساعدتك على استكشاف المشكلة وإصلاحها بشكل أكبر. قد يؤدي ذلك إلى حل المشكلة OR أو يطلب منك إشراك القنوات المتاحة لتقنيات المصدر المفتوح حيث توجد خبرة عميقة لتلك التكنولوجيا. على سبيل المثال، هناك العديد من المواقع المجتمعية التي يمكن استخدامها، مثل: صفحة أسئلة Microsoft Q&A لـ HDInsight ، https://stackoverflow.com. تحتوي مشاريع Apache أيضًا على مواقع المشروع على https://apache.org، على سبيل المثال: Hadoop

تثبيت Hue باستخدام إجراءات البرنامج النصي

استخدم المعلومات الموجودة في الجدول أدناه لإجراء البرنامج النصي الخاص بك. للاطلاع على مزيدٍ من المعلومات حول استخدام إجراءات النصوص البرمجية، انظر تخصيص أنظمة مجموعات HDInsight باستخدام إجراءات النصوص البرمجية.

إشعار

لتثبيت Hue على مجموعات HDInsight، يكون حجم headnode الموصى به على الأقل A4 (8 ذاكرة أساسية، ذاكرة 14 غيغابايت).

الخاصية القيمة
نوع البرنامج النصي - مخصص
الاسم قم بتثبيت Hue
عنوان URI النصي Bash https://hdiconfigactions.blob.core.windows.net/linuxhueconfigactionv02/install-hue-uber-v02.sh
نوع (أنواع) العقدة: الرأس

تشغيل استعلام الخلية

  1. من مدخل Hue، حدد محرري الاستعلام،ثم حدد الخلية لفتح محرر الخلية.

    HDInsight hue portal use hive editor.

  2. في علامة التبويب مساعدة، ضمن قاعدة البيانات، يجب أن تشاهد جدول نموذج الخلية. هذا جدول العينة التي يتم شحنها مع كافة مجموعات Hadoop على HDInsight. أدخل استعلام عينة في الجزء الأيسر، ثم راجع الناتج في علامة التبويب النتائج في الجزء أدناه، كما هو موضح في التقاط الشاشة.

    HDInsight hue portal hive query.

    يمكنك أيضًا استخدام علامة التبويب مخطط لرؤية تمثيل مرئي للنتيجة.

استخدام تخزين المجموعات

  1. من مدخل Hue، حدد متصفح الملفات في الزاوية العلوية اليمنى من شريط القوائم.

  2. بشكل افتراضي يفتح مستعرض الملفات في الدليل /user/myuser. حدد خطًا مائلاً للأمام مباشرة قبل دليل المستخدم في المسار للانتقال إلى جذر حاوية تخزين Azure المقترنة بنظام المجموعة

    HDInsight hue portal file browser.

  3. انقر بزر الماوس الأيمن على ملف أو مجلد لمشاهدة العمليات المتوفرة. استخدم زر تحميل في الزاوية اليمنى لتحميل الملفات إلى الدليل الحالي. استخدم الزر جديد لإنشاء ملفات أو دلائل جديدة.

إشعار

يمكن لمستعرض ملف Hue إظهار محتويات الحاوية الافتراضية المقترنة مع نظام مجموعة HDInsight فقط. لن يمكن الوصول إلى أية حسابات تخزين/حاويات إضافية قد تكون مقترنة بنظام المجموعة باستخدام مستعرض الملفات. ومع ذلك، فإن الحاويات الإضافية المقترنة بنظام مجموعة دومًا يمكن الوصول من خلالها لوظائف الخلية. على سبيل المثال، إذا قمت بإدخال الأمر dfs -ls wasbs://newcontainer@mystore.blob.core.windows.net في محرر الخلية، يمكنك مشاهدة محتويات حاويات إضافية أيضًا. في هذا الأمر، newcontainer غير الحاوية الافتراضية المقترنة بنظام مجموعة.

اعتبارات هامة

  1. البرنامج النصي المستخدم لتثبيت Hue بتثبيته فقط على الرأس الأساسي من نظام المجموعة.

  2. أثناء التثبيت، يتم إعادة تشغيل خدمات Hadoop متعددة (HDFS، YARN، MR2، Oozie) لتحديث التكوين. بعد انتهاء البرنامج النصي من تثبيت Hue، قد يستغرق الأمر بعض الوقت حتى تبدأ خدمات Hadoop الأخرى. قد يؤثر هذا على أداء Hue في البداية. بمجرد بدء تشغيل جميع الخدمات، سيكون Hue يعمل بكامل طاقته.

  3. Hue لا يفهم وظائف Apache Tez، وهو الافتراضي الحالي للخلية. إذا كنت تريد استخدام MapReduce كمحرك تنفيذ خلية فقم بتحديث البرنامج النصي لاستخدام الأمر التالي في البرنامج النصي الخاص بك:

    set hive.execution.engine=mr;

  4. مع مجموعات Linux، يمكن أن يكون لديك سيناريو حيث يتم تشغيل الخدمات الخاصة بك على الرأس الأساسي بينما يمكن تشغيل إدارة الموارد على الثانوي. قد يؤدي مثل هذا السيناريو إلى أخطاء (موضحة أدناه) عند استخدام Hue لعرض تفاصيل مهام RUNNING على نظام المجموعة. ومع ذلك، يمكنك عرض تفاصيل المهمة عند اكتمالها.

    Hue portal error sample message.

    هذا بسبب مشكلة غير معلومة. كحل بديل، قم بتعديل Ambari بحيث يتم تشغيل إدارة الموارد النشطة أيضًا على الرأس الأساسي.

  5. Hue يفهم WebHDFS بينما تستخدم مجموعات HDInsight تخزين Azure باستخدام wasbs:// . لذلك، يقوم البرنامج النصي المخصص المستخدم مع إجراء البرنامج النصي بتثبيت WebWasb، وهي خدمة متوافقة مع WebHDFS للتحدث إلى WASB. لذلك، على الرغم من أن بوابة Hue تُظهر HDFS في أماكن (مثل عند تحريك الماوس فوق متصفح الملفات)، يجب تفسيرها على أنها WASB.

الخطوات التالية

قم بتخصيص نظام مجموعات HDInsight مع إجراءات المحرر النصي