بدء الاستخدام: الاستعلام عن البيانات وتصورها من دفتر ملاحظات

ترشدك مقالة البدء هذه إلى استخدام دفتر ملاحظات Azure Databricks للاستعلام عن عينة البيانات المخزنة في كتالوج Unity باستخدام SQL وPython وSc scala وR ثم تصور نتائج الاستعلام في دفتر الملاحظات.

المتطلبات

لإكمال المهام في هذه المقالة، يجب أن تفي بالمتطلبات التالية:

  • يجب تمكين كتالوج Unity لمساحة العمل الخاصة بك. للحصول على معلومات حول بدء استخدام كتالوج Unity، راجع إعداد كتالوج Unity وإدارته.
  • يجب أن يكون لديك إذن لاستخدام مورد حساب موجود أو إنشاء مورد حساب جديد. راجع بدء الاستخدام: إعداد الحساب ومساحة العمل أو راجع مسؤول Databricks.

الخطوة 1: إنشاء دفتر ملاحظات جديد

لإنشاء دفتر ملاحظات في مساحة العمل:

  1. انقر فوق أيقونة جديدةجديد في الشريط الجانبي، ثم انقر فوق دفتر الملاحظات.
  2. في صفحة إنشاء دفتر ملاحظات:
    • حدد اسما فريدا لدفتر الملاحظات.
    • قم بتعيين اللغة الافتراضية لدفتر الملاحظات، ثم انقر فوق تأكيد إذا تمت مطالبتك بذلك.
    • استخدم القائمة المنسدلة الاتصال لتحديد مورد حساب. لإنشاء مورد حساب جديد، راجع استخدام الحساب.

لمعرفة المزيد حول إنشاء دفاتر الملاحظات وإدارتها، راجع إدارة دفاتر الملاحظات.

الخطوة 2: الاستعلام عن جدول

استعلم عن samples.nyctaxi.trips الجدول في كتالوج Unity باستخدام اللغة التي تختارها.

  1. انسخ التعليمات البرمجية التالية والصقها في خلية دفتر الملاحظات الفارغة الجديدة. تعرض هذه التعليمة البرمجية النتائج من الاستعلام عن samples.nyctaxi.trips الجدول في كتالوج Unity.

    SQL

    SELECT * FROM samples.nyctaxi.trips
    

    Python

    display(spark.read.table("samples.nyctaxi.trips"))
    

    Scala

    display(spark.read.table("samples.nyctaxi.trips"))
    

    R

    library(SparkR)
    display(sql("SELECT * FROM samples.nyctaxi.trips"))
    
  2. اضغط Shift+Enter لتشغيل الخلية ثم انتقل إلى الخلية التالية.

    تظهر نتائج الاستعلام في دفتر الملاحظات.

الخطوة 3: عرض البيانات

عرض متوسط مبلغ الأجرة حسب مسافة الرحلة، مجمعا حسب الرمز البريدي للاستلام.

  1. إلى جانب علامة التبويب جدول، انقر فوق + مرئيات ثم انقر فوقها.

    يعرض محرر المرئيات.

  2. في القائمة المنسدلة نوع المرئيات، تحقق من تحديد الشريط .

  3. حدد fare_amount للعمود X.

  4. حدد trip_distance للعمود Y.

  5. حدد Average كنوع التجميع.

  6. حدد pickup_zip ك العمود تجميع حسب .

    مخطط الشريط

  7. انقر فوق حفظ.

الخطوات التالية