bamboolib

هام

هذه الميزة في المعاينة العامة.

إشعار

يتم دعم bamboolib في Databricks Runtime 11.3 LTS وما فوق.

bamboolib هو مكون واجهة مستخدم يسمح بتحليل البيانات بدون تعليمات برمجية والتحويلات من داخل دفتر ملاحظات Azure Databricks. يساعد bamboolib المستخدمين على العمل بسهولة أكبر مع بياناتهم ويسرع مهام تشابك البيانات الشائعة والاستكشاف والتصور. بينما يكمل المستخدمون هذه الأنواع من المهام ببياناتهم، يقوم bamboolib تلقائيا بإنشاء تعليمة Python البرمجية في الخلفية. يمكن للمستخدمين مشاركة هذه التعليمات البرمجية مع الآخرين، الذين يمكنهم تشغيل هذه التعليمات البرمجية في دفاتر الملاحظات الخاصة بهم لإعادة إنتاج هذه المهام الأصلية بسرعة. يمكنهم أيضا استخدام bamboolib لتوسيع تلك المهام الأصلية مع مهام بيانات إضافية، كل ذلك دون الحاجة إلى معرفة كيفية التعليمات البرمجية. يمكن لأولئك ذوي الخبرة في الترميز توسيع هذه التعليمات البرمجية لإنشاء نتائج أكثر تعقيدا.

وراء الكواليس، يستخدم bamboolib ipywidgets، وهو إطار عمل واجهة مستخدم HTML تفاعلي لنواة IPython. يعمل ipywidgets داخل نواة IPython.

المحتويات

المتطلبات

تشغيل سريع

  1. إنشاء دفتر ملاحظات Python.

  2. إرفاق دفتر الملاحظات بمجموعة تفي بالمتطلبات.

  3. في الخلية الأولى لدفتر الملاحظات، أدخل التعليمات البرمجية التالية، ثم قم بتشغيل الخلية. يمكن تخطي هذه الخطوة إذا تم تثبيت bamboolib بالفعل في مساحة العمل أو المجموعة.

    %pip install bamboolib
    
  4. في الخلية الثانية لدفتر الملاحظات، أدخل التعليمات البرمجية التالية، ثم قم بتشغيل الخلية.

    import bamboolib as bam
    
  5. في الخلية الثالثة لدفتر الملاحظات، أدخل التعليمات البرمجية التالية، ثم قم بتشغيل الخلية.

    bam
    

    إشعار

    بدلا من ذلك، يمكنك طباعة pandas DataFrame موجود لعرض bamboolib للاستخدام مع DataFrame المحدد هذا.

  6. تابع المهام الرئيسية.

تجول

يمكنك استخدام bamboolib بنفسه أو مع pandas DataFrame موجود.

استخدام bamboolib في حد ذاته

في هذه المعاينة، يمكنك استخدام bamboolib لعرض محتويات مثال مجموعة بيانات المبيعات في دفتر الملاحظات. ثم يمكنك تجربة بعض التعليمات البرمجية لدفتر الملاحظات ذات الصلة التي ينشئها bamboolib تلقائيا لك. يمكنك الانتهاء عن طريق الاستعلام عن نسخة من محتويات مجموعة بيانات المبيعات وفرزها.

  1. إنشاء دفتر ملاحظات Python.

  2. إرفاق دفتر الملاحظات بمجموعة تفي بالمتطلبات.

  3. في الخلية الأولى لدفتر الملاحظات، أدخل التعليمات البرمجية التالية، ثم قم بتشغيل الخلية. يمكن تخطي هذه الخطوة إذا تم تثبيت bamboolib بالفعل في مساحة العمل أو المجموعة.

    %pip install bamboolib
    
  4. في الخلية الثانية لدفتر الملاحظات، أدخل التعليمات البرمجية التالية، ثم قم بتشغيل الخلية.

    import bamboolib as bam
    
  5. في الخلية الثالثة لدفتر الملاحظات، أدخل التعليمات البرمجية التالية، ثم قم بتشغيل الخلية.

    bam
    
  6. انقر فوق تحميل بيانات وهمية.

  7. في جزء تحميل البيانات الوهمية، لتحميل مجموعة بيانات وهمية لاختبار bamboolib، حدد Sales dataset.

  8. انقر فوق تنفيذ.

  9. عرض جميع الصفوف حيث item_type هو Baby Food:

    1. في قائمة إجراءات البحث، حدد تصفية الصفوف.
    2. في جزء تصفية الصفوف ، في القائمة اختيار (أعلى المكان)، حدد تحديد صفوف.
    3. في القائمة أدناه ، حدد item_type.
    4. في القائمة اختيار بجوار item_type، حدد يحتوي على قيمة (قيم).
    5. في المربع Choose value(s) بجوار يحتوي على قيمة (قيم)، حدد Baby Food.
    6. انقر فوق تنفيذ.
  10. انسخ التعليمة البرمجية Python التي تم إنشاؤها تلقائيا لهذا الاستعلام:

    1. Cick Copy Code أسفل معاينة البيانات.
  11. لصق التعليمات البرمجية وتعديلها:

    1. في الخلية الرابعة لدفتر الملاحظات، الصق التعليمات البرمجية التي نسختها. يجب أن يبدو مثل هذا:

      import pandas as pd
      df = pd.read_csv(bam.sales_csv)
      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
    2. أضف إلى هذه التعليمة البرمجية بحيث تعرض فقط الصفوف التي يكون فيها order_prio C، ثم قم بتشغيل الخلية:

      import pandas as pd
      df = pd.read_csv(bam.sales_csv)
      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
      # Add the following code.
      # Step: Keep rows where order_prio is one of: C
      df = df.loc[df['order_prio'].isin(['C'])]
      df
      

    تلميح

    بدلا من كتابة هذه التعليمات البرمجية، يمكنك أيضا القيام بنفس الشيء باستخدام bamboolib فقط في الخلية الثالثة لعرض الصفوف التي يكون فيها order_prio هو C فقط. هذه الخطوة هي مثال على توسيع التعليمات البرمجية التي تم إنشاؤها تلقائيا في bamboolib مسبقا.

  12. فرز الصفوف حسب المنطقة بترتيب تصاعدي:

    1. في عنصر واجهة المستخدم داخل الخلية الرابعة، في قائمة إجراءات البحث، حدد فرز الصفوف.
    2. في جزء فرز العمود (الأعمدة)، في قائمة اختيار عمود، حدد المنطقة.
    3. في القائمة بجوار المنطقة، حدد تصاعدي (A-Z).
    4. انقر فوق تنفيذ.

    إشعار

    وهذا يعادل كتابة التعليمات البرمجية التالية بنفسك:

    df = df.sort_values(by=['region'], ascending=[True])
    df
    

    كان بإمكانك أيضا استخدام bamboolib في الخلية الثالثة لفرز الصفوف حسب المنطقة بترتيب تصاعدي. توضح هذه الخطوة كيف يمكنك استخدام bamboolib لتوسيع التعليمات البرمجية التي تكتبها. أثناء استخدام bamboolib، فإنه ينشئ تلقائيا التعليمات البرمجية الإضافية لك في الخلفية، بحيث يمكنك توسيع التعليمات البرمجية الموسعة بالفعل!

  13. تابع المهام الرئيسية.

استخدام bamboolib مع DataFrame موجود

في هذه المعاينة، يمكنك استخدام bamboolib لعرض محتويات pandas DataFrame في دفتر ملاحظاتك. يحتوي DataFrame هذا على نسخة من مثال مجموعة بيانات المبيعات. ثم يمكنك تجربة بعض التعليمات البرمجية لدفتر الملاحظات ذات الصلة التي ينشئها bamboolib تلقائيا لك. يمكنك الانتهاء عن طريق الاستعلام عن بعض محتويات DataFrame وفرزها.

  1. إنشاء دفتر ملاحظات Python.

  2. إرفاق دفتر الملاحظات بمجموعة تفي بالمتطلبات.

  3. في الخلية الأولى لدفتر الملاحظات، أدخل التعليمات البرمجية التالية، ثم قم بتشغيل الخلية. يمكن تخطي هذه الخطوة إذا تم تثبيت bamboolib بالفعل في مساحة العمل أو المجموعة.

    %pip install bamboolib
    
  4. في الخلية الثانية لدفتر الملاحظات، أدخل التعليمات البرمجية التالية، ثم قم بتشغيل الخلية.

    import bamboolib as bam
    
  5. في الخلية الثالثة لدفتر الملاحظات، أدخل التعليمات البرمجية التالية، ثم قم بتشغيل الخلية.

    import pandas as pd
    
    df = pd.read_csv(bam.sales_csv)
    df
    

    لاحظ أن bamboolib يدعم فقط Pandas DataFrames. لتحويل PySpark DataFrame إلى Pandas DataFrame، اتصل ب toPandas على PySpark DataFrame. لتحويل واجهة برمجة تطبيقات Pandas على Spark DataFrame إلى pandas DataFrame، اتصل to_pandas على واجهة برمجة تطبيقات Pandas على Spark DataFrame.

  6. انقر فوق إظهار واجهة مستخدم bamboolib.

  7. عرض جميع الصفوف حيث item_type هو Baby Food:

    1. في قائمة إجراءات البحث، حدد تصفية الصفوف.
    2. في جزء تصفية الصفوف ، في القائمة اختيار (أعلى المكان)، حدد تحديد صفوف.
    3. في القائمة أدناه ، حدد item_type.
    4. في القائمة اختيار بجوار item_type، حدد يحتوي على قيمة (قيم).
    5. في المربع Choose value(s) بجوار يحتوي على قيمة (قيم)، حدد Baby Food.
    6. انقر فوق تنفيذ.
  8. انسخ تعليمة Python البرمجية التي تم إنشاؤها تلقائيا لهذا الاستعلام. للقيام بذلك، انقر فوق نسخ التعليمات البرمجية أسفل معاينة البيانات.

  9. لصق التعليمات البرمجية وتعديلها:

    1. في الخلية الرابعة لدفتر الملاحظات، الصق التعليمات البرمجية التي نسختها. يجب أن يبدو مثل هذا:

      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
    2. أضف إلى هذه التعليمة البرمجية بحيث تعرض فقط الصفوف التي يكون فيها order_prio C، ثم قم بتشغيل الخلية:

      # Step: Keep rows where item_type is one of: Baby Food
      df = df.loc[df['item_type'].isin(['Baby Food'])]
      
      # Add the following code.
      # Step: Keep rows where order_prio is one of: C
      df = df.loc[df['order_prio'].isin(['C'])]
      df
      

    تلميح

    بدلا من كتابة هذه التعليمات البرمجية، يمكنك أيضا القيام بنفس الشيء باستخدام bamboolib فقط في الخلية الثالثة لعرض الصفوف التي يكون فيها order_prio هو C فقط. هذه الخطوة هي مثال على توسيع التعليمات البرمجية التي تم إنشاؤها تلقائيا في bamboolib مسبقا.

  10. فرز الصفوف حسب المنطقة بترتيب تصاعدي:

    أ. في عنصر واجهة المستخدم داخل الخلية الرابعة، انقر فوق فرز الصفوف.

    1. في جزء فرز العمود (الأعمدة)، في قائمة اختيار عمود، حدد المنطقة.
    2. في القائمة بجوار المنطقة، حدد تصاعدي (A-Z).
    3. انقر فوق تنفيذ.

    إشعار

    وهذا يعادل كتابة التعليمات البرمجية التالية بنفسك:

    df = df.sort_values(by=['region'], ascending=[True])
    df
    

    كان بإمكانك أيضا استخدام bamboolib في الخلية الثالثة لفرز الصفوف حسب المنطقة بترتيب تصاعدي. توضح هذه الخطوة كيف يمكنك استخدام bamboolib لتوسيع التعليمات البرمجية التي تكتبها. أثناء استخدام bamboolib، فإنه ينشئ تلقائيا التعليمات البرمجية الإضافية لك في الخلفية، بحيث يمكنك توسيع التعليمات البرمجية الموسعة بالفعل!

  11. تابع المهام الرئيسية.

المهام الرئيسية

في هذا القسم:

إضافة عنصر واجهة المستخدم إلى خلية

السيناريو: تريد عرض عنصر واجهة مستخدم bamboolib في خلية.

  1. تأكد من أن دفتر الملاحظات يلبي متطلبات bamboolib.

  2. إذا لم يكن bamboolib مثبتا بالفعل في مساحة العمل أو المجموعة ، فقم بتشغيل التعليمات البرمجية التالية في خلية في دفتر الملاحظات، ويفضل أن يكون في الخلية الأولى:

    %pip install bamboolib
    
  3. قم بتشغيل التعليمات البرمجية التالية في دفتر الملاحظات، ويفضل أن يكون ذلك في الخلية الأولى أو الثانية لدفتر الملاحظات:

    import bamboolib as bam
    
  4. الخيار 1: في الخلية حيث تريد ظهور عنصر واجهة المستخدم، أضف التعليمات البرمجية التالية، ثم قم بتشغيل الخلية:

    bam
    

    يظهر عنصر واجهة المستخدم في الخلية أسفل التعليمات البرمجية.

    أو:

    الخيار 2: في خلية تحتوي على مرجع إلى pandas DataFrame، اطبع DataFrame. على سبيل المثال، نظرا لتعريف DataFrame التالي، قم بتشغيل الخلية:

    import pandas as pd
    from datetime import datetime, date
    
    df = pd.DataFrame({
      'a': [ 1, 2, 3 ],
      'b': [ 2., 3., 4. ],
      'c': [ 'string1', 'string2', 'string3' ],
      'd': [ date(2000, 1, 1), date(2000, 2, 1), date(2000, 3, 1) ],
      'e': [ datetime(2000, 1, 1, 12, 0), datetime(2000, 1, 2, 12, 0), datetime(2000, 1, 3, 12, 0) ]
    })
    
    df
    

    يظهر عنصر واجهة المستخدم في الخلية أسفل التعليمات البرمجية.

    لاحظ أن bamboolib يدعم فقط Pandas DataFrames. لتحويل PySpark DataFrame إلى Pandas DataFrame، اتصل ب toPandas على PySpark DataFrame. لتحويل واجهة برمجة تطبيقات Pandas على Spark DataFrame إلى pandas DataFrame، اتصل to_pandas على واجهة برمجة تطبيقات Pandas على Spark DataFrame.

مسح عنصر واجهة المستخدم

السيناريو: تريد مسح محتويات عنصر واجهة المستخدم ثم قراءة بيانات جديدة في عنصر واجهة المستخدم الموجود.

الخيار 1: تشغيل التعليمات البرمجية التالية داخل الخلية التي تحتوي على عنصر واجهة المستخدم الهدف:

bam

يقوم عنصر واجهة المستخدم بمسح ثم إعادة عرض Databricks: قراءة ملف CSV من DBFS وDatabricks : تحميل جدول قاعدة البيانات وتحميل أزرار البيانات الوهمية.

إشعار

إذا ظهر الخطأ name 'bam' is not defined ، فقم بتشغيل التعليمات البرمجية التالية في دفتر الملاحظات (يفضل أن يكون في الخلية الأولى لدفتر الملاحظات)، ثم حاول مرة أخرى:

import bamboolib as bam

الخيار 2: في خلية تحتوي على مرجع إلى pandas DataFrame، اطبع DataFrame مرة أخرى عن طريق تشغيل الخلية مرة أخرى. يقوم عنصر واجهة المستخدم بمسح البيانات الجديدة ثم عرضها.

مهام تحميل البيانات

في هذا القسم:

قراءة مثال لمحتويات مجموعة البيانات في عنصر واجهة المستخدم

السيناريو: تريد قراءة بعض بيانات المثال في عنصر واجهة المستخدم، على سبيل المثال بعض بيانات المبيعات التظاهر، بحيث يمكنك اختبار وظيفة عنصر واجهة المستخدم.

  1. انقر فوق تحميل بيانات وهمية.

    إشعار

    إذا لم يكن تحميل البيانات الوهمية مرئيا، فقم بإلغاء تحديد عنصر واجهة المستخدم باستخدام الخيار 1 وحاول مرة أخرى.

  2. في جزء تحميل البيانات الوهمية، لتحميل مجموعة بيانات وهمية لاختبار bamboolib، حدد اسم مجموعة البيانات التي تريد تحميلها.

  3. بالنسبة إلى Dataframe name، أدخل اسما للمعرف البرمجي لمحتويات الجدول ك DataFrame، أو اترك df كمعرف برمجي افتراضي.

  4. انقر فوق تنفيذ.

    يعرض عنصر واجهة المستخدم محتويات مجموعة البيانات.

تلميح

يمكنك تبديل عنصر واجهة المستخدم الحالي لعرض محتويات مجموعة بيانات مثال مختلفة:

  1. في عنصر واجهة المستخدم الحالي، انقر فوق علامة التبويب تحميل البيانات الوهمية.
  2. اتبع الخطوات السابقة لقراءة محتويات مجموعة بيانات المثال الآخر في عنصر واجهة المستخدم.

قراءة محتويات ملف CSV في عنصر واجهة المستخدم

السيناريو: تريد قراءة محتويات ملف CSV داخل مساحة عمل Azure Databricks في عنصر واجهة المستخدم.

  1. انقر فوق Databricks: قراءة ملف CSV من DBFS.

    إشعار

    إذا لم يكن Databricks: قراءة ملف CSV من DBFS مرئيا، فقم بإلغاء تحديد عنصر واجهة المستخدم باستخدام الخيار 1 وحاول مرة أخرى.

  2. في جزء Read CSV from DBFS ، استعرض وصولا إلى الموقع الذي يحتوي على ملف CSV الهدف.

  3. حدد ملف CSV الهدف.

  4. بالنسبة إلى Dataframe name، أدخل اسما للمعرف البرمجي لمحتويات ملف CSV ك DataFrame، أو اترك df كمعرف برمجي افتراضي.

  5. بالنسبة لفاصل قيمة CSV، أدخل الحرف الذي يفصل القيم في ملف CSV، أو اترك الحرف ، (الفاصلة) كفاصل القيمة الافتراضي.

  6. بالنسبة للفاصل العشري، أدخل الحرف الذي يفصل بين الأرقام العشرية في ملف CSV، أو اترك الحرف . (نقطة) كفاصل القيمة الافتراضي.

  7. بالنسبة إلى حد الصفوف: اقرأ الصفوف N الأولى - اتركها فارغة بدون حد، أو أدخل الحد الأقصى لعدد الصفوف للقراءة في عنصر واجهة المستخدم، أو اترك 100000 كعدد افتراضي للصفوف، أو اترك هذا المربع فارغا لتحديد أي حد للصفوف.

  8. انقر فوق فتح ملف CSV.

    يعرض عنصر واجهة المستخدم محتويات ملف CSV، استنادا إلى الإعدادات التي حددتها.

تلميح

يمكنك تبديل عنصر واجهة المستخدم الحالي لعرض محتويات ملف CSV مختلف:

  1. في عنصر واجهة المستخدم الحالي، انقر فوق علامة التبويب قراءة CSV من DBFS .
  2. اتبع الخطوات السابقة لقراءة محتويات ملف CSV الآخر في عنصر واجهة المستخدم.

قراءة محتويات جدول قاعدة البيانات في عنصر واجهة المستخدم

السيناريو: تريد قراءة محتويات جدول قاعدة بيانات داخل مساحة عمل Azure Databricks في عنصر واجهة المستخدم.

  1. انقر فوق Databricks: تحميل جدول قاعدة البيانات.

    إشعار

    إذا كان Databricks: تحميل جدول قاعدة البيانات غير مرئي، فقم بإلغاء تحديد عنصر واجهة المستخدم باستخدام الخيار 1 وحاول مرة أخرى.

  2. في جزء Databricks: تحميل جدول قاعدة البيانات، لقاعدة البيانات - اتركه فارغا لقاعدة البيانات الافتراضية، أدخل اسم قاعدة البيانات التي يوجد بها الجدول الهدف، أو اترك هذا المربع فارغا لتحديد قاعدة البيانات الافتراضية.

  3. بالنسبة للجدول، أدخل اسم الجدول الهدف.

  4. بالنسبة إلى حد الصفوف: اقرأ الصفوف N الأولى - اتركها فارغة بدون حد، أو أدخل الحد الأقصى لعدد الصفوف للقراءة في عنصر واجهة المستخدم، أو اترك 100000 كعدد افتراضي للصفوف، أو اترك هذا المربع فارغا لتحديد أي حد للصفوف.

  5. بالنسبة إلى Dataframe name، أدخل اسما للمعرف البرمجي لمحتويات الجدول ك DataFrame، أو اترك df كمعرف برمجي افتراضي.

  6. انقر فوق تنفيذ.

    يعرض عنصر واجهة المستخدم محتويات الجدول، استنادا إلى الإعدادات التي حددتها.

تلميح

يمكنك تبديل عنصر واجهة المستخدم الحالي لعرض محتويات جدول مختلف:

  1. في عنصر واجهة المستخدم الحالي، انقر فوق علامة التبويب Databricks: Load database table .
  2. اتبع الخطوات السابقة لقراءة محتويات الجدول الآخر في عنصر واجهة المستخدم.

مهام إجراء البيانات

يقدم bamboolib أكثر من 50 إجراء بيانات. فيما يلي بعض مهام إجراء بيانات البدء الأكثر شيوعا.

في هذا القسم:

تحديد الأعمدة

السيناريو: تريد إظهار أعمدة جدول معينة فقط حسب الاسم أو حسب نوع البيانات أو التي تطابق بعض التعبير العادي. على سبيل المثال، في مجموعة بيانات Sales الوهمية، تريد إظهار العمودين و sales_channel فقطitem_type، أو تريد إظهار الأعمدة التي تحتوي على السلسلة _date في أسماء الأعمدة الخاصة بها فقط.

  1. على علامة التبويب بيانات ، في القائمة المنسدلة إجراءات البحث، قم بأحد الإجراءات التالية:
    • اكتب select، ثم حدد Select or drop columns.
    • حدد تحديد أعمدة أو إسقاطها.
  2. في جزء تحديد الأعمدة أو إسقاطها ، في القائمة المنسدلة اختيار ، حدد تحديد.
  3. حدد أسماء الأعمدة الهدف أو معيار التضمين.
  4. بالنسبة إلى Dataframe name، أدخل اسما للمعرف البرمجي لمحتويات الجدول ك DataFrame، أو اترك df كمعرف برمجي افتراضي.
  5. انقر فوق تنفيذ.

إسقاط الأعمدة

السيناريو: تريد إخفاء أعمدة جدول معينة حسب الاسم أو حسب نوع البيانات أو التي تطابق بعض التعبير العادي. على سبيل المثال، في مجموعة بيانات Sales الوهمية، تريد إخفاء order_prioorder_dateالأعمدة و و ship_date أو تريد إخفاء كافة الأعمدة التي تحتوي على قيم التاريخ والوقت فقط.

  1. على علامة التبويب بيانات ، في القائمة المنسدلة إجراءات البحث، قم بأحد الإجراءات التالية:
    • اكتب drop، ثم حدد Select or drop columns.
    • حدد تحديد أعمدة أو إسقاطها.
  2. في جزء Select or drop columns ، في القائمة المنسدلة Choose ، حدد Drop.
  3. حدد أسماء الأعمدة الهدف أو معيار التضمين.
  4. بالنسبة إلى Dataframe name، أدخل اسما للمعرف البرمجي لمحتويات الجدول ك DataFrame، أو اترك df كمعرف برمجي افتراضي.
  5. انقر فوق تنفيذ.

تصفية الصفوف

السيناريو: تريد إظهار صفوف جدول معينة أو إخفاؤها استنادا إلى معايير مثل قيم أعمدة معينة مطابقة أو مفقودة. على سبيل المثال، في مجموعة بيانات Sales الوهمية، تريد إظهار الصفوف التي item_type تم تعيين قيمة العمود إليها فقط.Baby Food

  1. على علامة التبويب بيانات ، في القائمة المنسدلة إجراءات البحث، قم بأحد الإجراءات التالية:
    • اكتب عامل التصفية، ثم حدد تصفية الصفوف.
    • حدد تصفية الصفوف.
  2. في جزء تصفية الصفوف ، في القائمة المنسدلة اختيار أعلاه حيث، حدد تحديد صفوف أو إسقاط الصفوف.
  3. حدد معيار عامل التصفية الأول.
  4. لإضافة معيار عامل تصفية آخر، انقر فوق إضافة شرط، وحدد معيار عامل التصفية التالي. كرر ما تريد.
  5. بالنسبة إلى Dataframe name، أدخل اسما للمعرف البرمجي لمحتويات الجدول ك DataFrame، أو اترك df كمعرف برمجي افتراضي.
  6. انقر فوق تنفيذ.

فرز الصفوف

السيناريو: تريد فرز صفوف الجدول استنادا إلى القيم الموجودة داخل عمود واحد أو أكثر. على سبيل المثال، في مجموعة بيانات Sales الوهمية، تريد إظهار الصفوف حسب region قيم العمود بترتيب أبجدي من A إلى Z.

  1. على علامة التبويب بيانات ، في القائمة المنسدلة إجراءات البحث، قم بأحد الإجراءات التالية:
    • اكتب فرز، ثم حدد فرز الصفوف.
    • حدد فرز الصفوف.
  2. في جزء فرز العمود (الأعمدة)، اختر العمود الأول الذي تريد الفرز حسبه وترتيب الفرز.
  3. لإضافة معيار فرز آخر، انقر فوق إضافة عمود، وحدد معيار الفرز التالي. كرر ما تريد.
  4. بالنسبة إلى Dataframe name، أدخل اسما للمعرف البرمجي لمحتويات الجدول ك DataFrame، أو اترك df كمعرف برمجي افتراضي.
  5. انقر فوق تنفيذ.

تجميع مهام الصفوف والأعمدة

في هذا القسم:
تجميع الصفوف والأعمدة بواسطة دالة تجميعية واحدة

السيناريو: تريد إظهار نتائج الصفوف والأعمدة عن طريق التجميعات المحسوبة، وتريد تعيين أسماء مخصصة لهذه المجموعات. على سبيل المثال، في مجموعة بيانات Sales الوهمية، تريد تجميع الصفوف حسب country قيم العمود، وعرض أرقام الصفوف التي تحتوي على نفس country القيمة، وإعطاء قائمة الأعداد المحسوبة الاسم country_count.

  1. على علامة التبويب بيانات ، في القائمة المنسدلة إجراءات البحث، قم بأحد الإجراءات التالية:
    • اكتب مجموعة، ثم حدد تجميع حسب وتجميع (مع إعادة تسمية).
    • حدد تجميع حسب وتجميع (مع إعادة تسمية).
  2. في جزء تجميع حسب مع إعادة تسمية العمود، حدد الأعمدة المراد تجميعها حسب، والحساب الأول، وحدد اسما للعمود المحسوب اختياريا.
  3. لإضافة عملية حسابية أخرى، انقر فوق إضافة حساب، وحدد الحساب التالي واسم العمود. كرر ما تريد.
  4. حدد مكان تخزين النتيجة.
  5. بالنسبة إلى Dataframe name، أدخل اسما للمعرف البرمجي لمحتويات الجدول ك DataFrame، أو اترك df كمعرف برمجي افتراضي.
  6. انقر فوق تنفيذ.
تجميع الصفوف والأعمدة حسب دالات تجميعية متعددة

السيناريو: تريد إظهار نتائج الصفوف والأعمدة عن طريق التجميعات المحسوبة. على سبيل المثال، في مجموعة بيانات Sales الوهمية، تريد تجميع الصفوف حسب regioncountryقيم الأعمدة و وsales_channel، مع إظهار أرقام الصفوف التي تحتوي على نفس country region والقيمة حسب sales_channel، بالإضافة total_revenue إلى مجموعة فريدة من regionو countryوsales_channel.

  1. على علامة التبويب بيانات ، في القائمة المنسدلة إجراءات البحث، قم بأحد الإجراءات التالية:
    • اكتب group، ثم حدد Group by وgroup (default).
    • حدد تجميع حسب وتجميع (افتراضي).
  2. في جزء تجميع حسب مع إعادة تسمية العمود، حدد الأعمدة المراد تجميعها حسب والحساب الأول.
  3. لإضافة عملية حسابية أخرى، انقر فوق إضافة حساب، وحدد العملية الحسابية التالية. كرر ما تريد.
  4. حدد مكان تخزين النتيجة.
  5. بالنسبة إلى Dataframe name، أدخل اسما للمعرف البرمجي لمحتويات الجدول ك DataFrame، أو اترك df كمعرف برمجي افتراضي.
  6. انقر فوق تنفيذ.

إزالة صفوف ذات قيم مفقودة

السيناريو: تريد إزالة أي صف يحتوي على قيمة مفقودة للأعمدة المحددة. على سبيل المثال، في مجموعة بيانات Sales الوهمية، تريد إزالة أي صفوف لها قيمة مفقودةitem_type.

  1. على علامة التبويب بيانات ، في القائمة المنسدلة إجراءات البحث، قم بأحد الإجراءات التالية:
    • اكتب drop أو remove، ثم حدد Drop missing values.
    • حدد إسقاط القيم المفقودة.
  2. في جزء إسقاط القيم المفقودة، حدد الأعمدة لإزالة أي صف يحتوي على قيمة مفقودة لهذا العمود.
  3. بالنسبة إلى Dataframe name، أدخل اسما للمعرف البرمجي لمحتويات الجدول ك DataFrame، أو اترك df كمعرف برمجي افتراضي.
  4. انقر فوق تنفيذ.

إزالة الصفوف المكررة

السيناريو: تريد إزالة أي صف له قيمة مكررة للأعمدة المحددة. على سبيل المثال، في مجموعة بيانات Sales الوهمية، تريد إزالة أي صفوف مكررة تماما لبعضها البعض.

  1. على علامة التبويب بيانات ، في القائمة المنسدلة إجراءات البحث، قم بأحد الإجراءات التالية:
    • اكتب drop أو remove، ثم حدد Drop/Remove duplicates.
    • حدد إسقاط/إزالة التكرارات.
  2. في جزء إزالة التكرارات، حدد الأعمدة لإزالة أي صف يحتوي على قيمة مكررة لتلك الأعمدة، ثم حدد ما إذا كنت تريد الاحتفاظ بالصف الأول أو الأخير الذي يحتوي على القيمة المكررة.
  3. بالنسبة إلى Dataframe name، أدخل اسما للمعرف البرمجي لمحتويات الجدول ك DataFrame، أو اترك df كمعرف برمجي افتراضي.
  4. انقر فوق تنفيذ.

البحث عن القيم المفقودة واستبدالها

السيناريو: تريد استبدال القيمة المفقودة بقيمة استبدال لأي صف بالأعمدة المحددة. على سبيل المثال، في مجموعة بيانات Sales الوهمية، تريد استبدال أي صف بقيمة مفقودة item_type في العمود بالقيمة Unknown Item Type.

  1. على علامة التبويب بيانات ، في القائمة المنسدلة إجراءات البحث، قم بأحد الإجراءات التالية:
    • اكتب بحث أو استبدال، ثم حدد البحث عن القيم المفقودة واستبدالها.
    • حدد البحث عن القيم المفقودة واستبدالها.
  2. في جزء استبدال القيم المفقودة، حدد الأعمدة لاستبدال القيم المفقودة، ثم حدد قيمة الاستبدال.
  3. انقر فوق تنفيذ.

إنشاء صيغة عمود

السيناريو: تريد إنشاء عمود يستخدم صيغة فريدة. على سبيل المثال، في مجموعة بيانات Sales الوهمية، تريد إنشاء عمود باسم profit_per_unit يعرض نتيجة تقسيم total_profit قيمة العمود على units_sold قيمة العمود لكل صف.

  1. على علامة التبويب بيانات ، في القائمة المنسدلة إجراءات البحث، قم بأحد الإجراءات التالية:
    • اكتب صيغة، ثم حدد صيغة عمود جديد.
    • حدد صيغة عمود جديد.
  2. في جزء استبدال القيم المفقودة، حدد الأعمدة لاستبدال القيم المفقودة، ثم حدد قيمة الاستبدال.
  3. انقر فوق تنفيذ.

مهام محفوظات إجراءات البيانات

في هذا القسم:

عرض قائمة الإجراءات المتخذة في عنصر واجهة المستخدم

السيناريو: تريد رؤية قائمة بجميع التغييرات التي تم إجراؤها في عنصر واجهة المستخدم، بدءا من أحدث تغيير.

انقر فوق محفوظات. تظهر قائمة الإجراءات في جزء محفوظات التحويلات.

التراجع عن أحدث إجراء تم اتخاذه في عنصر واجهة المستخدم

السيناريو: تريد إرجاع أحدث تغيير تم إجراؤه في عنصر واجهة المستخدم.

قم بأحد الإجراءات التالية:

  • انقر فوق أيقونة السهم بعكس اتجاه عقارب الساعة.
  • انقر فوق محفوظات، وفي جزء محفوظات التحويلات، انقر فوق تراجع عن الخطوة الأخيرة.

إعادة أحدث إجراء تم اتخاذه في عنصر واجهة المستخدم

السيناريو: تريد إرجاع أحدث عودة تم إجراؤها في عنصر واجهة المستخدم.

قم بأحد الإجراءات التالية:

  • انقر فوق أيقونة السهم باتجاه عقارب الساعة.
  • انقر فوق محفوظات، وفي جزء محفوظات التحويلات، انقر فوق استرداد الخطوة الأخيرة.

تغيير أحدث إجراء تم اتخاذه في عنصر واجهة المستخدم

السيناريو: تريد تغيير أحدث تغيير تم اتخاذه في عنصر واجهة المستخدم.

  1. قم بأحد الإجراءات التالية:
    • انقر فوق أيقونة القلم الرصاص.
    • انقر فوق محفوظات، وفي جزء محفوظات التحويلات، انقر فوق تحرير الخطوة الأخيرة.
  2. قم بإجراء التغيير المطلوب، ثم انقر فوق تنفيذ.

الحصول على التعليمات البرمجية لإعادة إنشاء الحالة الحالية لعنص واجهة المستخدم برمجيا ك DataFrame

السيناريو: تريد الحصول على تعليمة Python البرمجية التي تعيد إنشاء حالة عنصر واجهة المستخدم الحالي برمجيا، ممثلة ك pandas DataFrame. تريد تشغيل هذه التعليمة البرمجية في خلية مختلفة في هذا المصنف أو في مصنف مختلف تماما.

  1. انقر فوق الحصول على التعليمات البرمجية.

  2. في جزء تصدير التعليمات البرمجية ، انقر فوق نسخ التعليمات البرمجية. يتم نسخ التعليمات البرمجية إلى حافظة النظام.

  3. الصق التعليمات البرمجية في خلية مختلفة في هذا المصنف أو في مصنف آخر.

  4. اكتب تعليمة برمجية إضافية للعمل مع pandas DataFrame هذا برمجيا، ثم قم بتشغيل الخلية. على سبيل المثال، لعرض محتويات DataFrame، على افتراض أن DataFrame الخاص بك يتم تمثيله برمجيا بواسطة df:

    # Your pasted code here, followed by...
    df
    

القيود

راجع القيود المعروفة دفاتر ملاحظات Databricks لمزيد من المعلومات.

الموارد الإضافية