بدء الاستخدام: الاستعلام عن البيانات وتصورها من دفتر ملاحظات
ترشدك مقالة البدء هذه إلى استخدام دفتر ملاحظات Azure Databricks للاستعلام عن عينة البيانات المخزنة في كتالوج Unity باستخدام SQL وPython وSc scala وR ثم تصور نتائج الاستعلام في دفتر الملاحظات.
المتطلبات
لإكمال المهام في هذه المقالة، يجب أن تفي بالمتطلبات التالية:
- يجب تمكين كتالوج Unity لمساحة العمل الخاصة بك. للحصول على معلومات حول بدء استخدام كتالوج Unity، راجع إعداد كتالوج Unity وإدارته.
- يجب أن يكون لديك إذن لاستخدام مورد حساب موجود أو إنشاء مورد حساب جديد. راجع بدء الاستخدام: إعداد الحساب ومساحة العمل أو راجع مسؤول Databricks.
الخطوة 1: إنشاء دفتر ملاحظات جديد
لإنشاء دفتر ملاحظات في مساحة العمل، انقر فوق جديد في الشريط الجانبي، ثم انقر فوق دفتر الملاحظات. يتم فتح دفتر ملاحظات فارغ في مساحة العمل.
لمعرفة المزيد حول إنشاء دفاتر الملاحظات وإدارتها، راجع إدارة دفاتر الملاحظات.
الخطوة 2: الاستعلام عن جدول
استعلم عن samples.nyctaxi.trips
الجدول في كتالوج Unity باستخدام اللغة التي تختارها.
انسخ التعليمات البرمجية التالية والصقها في خلية دفتر الملاحظات الفارغة الجديدة. تعرض هذه التعليمة البرمجية النتائج من الاستعلام عن
samples.nyctaxi.trips
الجدول في كتالوج Unity.SQL
SELECT * FROM samples.nyctaxi.trips
Python
display(spark.read.table("samples.nyctaxi.trips"))
Scala
display(spark.read.table("samples.nyctaxi.trips"))
R
library(SparkR) display(sql("SELECT * FROM samples.nyctaxi.trips"))
اضغط
Shift+Enter
لتشغيل الخلية ثم انتقل إلى الخلية التالية.تظهر نتائج الاستعلام في دفتر الملاحظات.
الخطوة 3: عرض البيانات
عرض متوسط مبلغ الأجرة حسب مسافة الرحلة، مجمعا حسب الرمز البريدي للاستلام.
إلى جانب علامة التبويب جدول، انقر فوق + مرئيات ثم انقر فوقها.
يعرض محرر المرئيات.
في القائمة المنسدلة نوع المرئيات، تحقق من تحديد الشريط .
حدد
fare_amount
للعمود X.حدد
trip_distance
للعمود Y.حدد
Average
كنوع التجميع.حدد
pickup_zip
ك العمود تجميع حسب .انقر فوق حفظ.
الخطوات التالية
- للتعرف على إضافة بيانات من ملف CSV إلى كتالوج Unity وتصور البيانات، راجع بدء الاستخدام: استيراد بيانات CSV وتصورها من دفتر ملاحظات.
- لمعرفة كيفية تحميل البيانات في Databricks باستخدام Apache Spark، راجع البرنامج التعليمي: تحميل البيانات وتحويلها باستخدام Apache Spark DataFrames.
- لمعرفة المزيد حول استيعاب البيانات في Databricks، راجع استيعاب البيانات في مستودع Databricks.
- لمعرفة المزيد حول الاستعلام عن البيانات باستخدام Databricks، راجع الاستعلام عن البيانات.
- لمعرفة المزيد حول المرئيات، راجع المرئيات في دفاتر ملاحظات Databricks.