التشغيل السريع: تنفيذ استعلامات Apache Hive في Azure HDInsight باستخدام Apache Zeppelin

في هذا التشغيل السريع، ستتعلم كيفية استخدام Apache Zeppelin لتشغيل استعلامات Apache Hive في Azure HDInsight. تتضمن مجموعات HDInsight Interactive Query دفاتر ملاحظات Apache Zeppelin التي يمكنك استخدامها لتشغيل استعلامات Apache Hive التفاعلية.

في حال لم يكن لديك اشتراك Azure، فأنشئ حساباً مجانيّاً قبل البدء.

المتطلبات الأساسية

مجموعة استعلام HDInsight Interactive. راجع إنشاء نظام مجموعة لإنشاء نظام مجموعة HDInsight. تأكد من اختيار نوع مجموعة Interactive Query .

إنشاء ملاحظة Apache Zeppelin

  1. استبدل CLUSTERNAME باسم مجموعتك في عنوان URL التالي https://CLUSTERNAME.azurehdinsight.net/zeppelin. ثم أدخل عنوان URL في مستعرض الويب.

  2. أدخل اسم المستخدم وكلمة المرور لتسجيل الدخول إلى المجموعة. من صفحة «Zeppelin»، يمكنك إما إنشاء ملاحظة جديدة، أو فتح الملاحظات الموجودة. يحتوي HiveSample على بعض نماذج استعلامات Hive.

    HDInsight Interactive Query zeppelin.

  3. حدد إنشاء ملاحظة جديدة.

  4. من مربع الحوار إنشاء ملاحظة جديدة اكتب أو حدد القيم التالية:

    • اسم الملاحظة: أدخل اسمًا للملاحظة.
    • المترجم الافتراضي: حدد jdbc من القائمة المنسدلة.
  5. حدد إنشاء ملاحظة.

  6. أدخل استعلام Apache Hive التالي في قسم التعليمات البرمجية، ثم اضغط على Shift + Enter:

    %jdbc(hive)
    show tables
    

    يقوم HDInsight Interactive Query zeppelin بتشغيل الاستعلام.

    %jdbc(hive) تخبر العبارة في السطر الأول دفتر الملاحظات باستخدام مترجم Hive JDBC.

    يجب أن يرجع الاستعلام جدول Hive واحدا يسمى hivesampletable.

    فيما يلي استعلامات Hive أخرى يمكنك تشغيلها مقابل hivesampletable:

    %jdbc(hive)
    select * from hivesampletable limit 10
    
    %jdbc(hive)
    select ${group_name}, count(*) as total_count
    from hivesampletable
    group by ${group_name=market,market|deviceplatform|devicemake}
    limit ${total_count=10}
    

    مقارنة ب Hive التقليدية، تعود نتائج الاستعلام بشكل أسرع بكثير.

المزيد من الأمثلة

  1. أنشئ جدولاً. تنفيذ التعليمات البرمجية في دفتر ملاحظات Zeppelin:

    %jdbc(hive)
    CREATE EXTERNAL TABLE log4jLogs (
        t1 string,
        t2 string,
        t3 string,
        t4 string,
        t5 string,
        t6 string,
        t7 string)
    ROW FORMAT DELIMITED
    FIELDS TERMINATED BY ' '
    STORED AS TEXTFILE;
    
  2. حمّل البيانات في الجدول الجديد. تنفيذ التعليمات البرمجية في دفتر ملاحظات Zeppelin:

    %jdbc(hive)
    LOAD DATA
    INPATH 'wasbs:///example/data/sample.log'
    INTO TABLE log4jLogs;
    
  3. أدرج سجلاً واحدًا. تنفيذ التعليمات البرمجية في دفتر ملاحظات Zeppelin:

    %jdbc(hive)
    INSERT INTO TABLE log4jLogs2
    VALUES ('A', 'B', 'C', 'D', 'E', 'F', 'G');
    

راجع دليل لغة Hive لمزيد من بناء الجملة.

تنظيف الموارد

بعد إكمال التشغيل السريع، قد تحتاج إلى حذف المجموعة. من خلال HDInsight، يتم تخزين البيانات الخاصة بك في Azure Storage؛ لذا يمكنك حذف المجموعة بأمان عندما لا تكون قيد الاستخدام. كما يتم تحصيل رسوم منك مقابل مجموعة HDInsight، حتى عندما لا تكون قيد الاستخدام. نظراً لأن رسوم نظام المجموعة تزيد عدة مرات عن رسوم التخزين، فمن المنطقي اقتصادياً حذف أنظمة المجموعات عندما لا تكون قيد الاستخدام.

لحذف نظام المجموعة، يرجى الرجوع إلى حذف نظام مجموعة HDInsight باستخدام متصفحكَ أو PowerShell أو Azure CLI .

الخطوات التالية

في دليل التشغيل السريع هذا، تعرفت على كيفية استخدام Apache Zeppelin لتشغيل استعلامات Apache Hive في Azure HDInsight. لمعرفة المزيد حول استعلامات Hive، ستوضح لك المقالة التالية كيفية تنفيذ الاستعلامات باستخدام Visual Studio.