الكوالا

هام

تم إيقاف هذه الوثائق وقد لا يتم تحديثها. لم تعد المنتجات أو الخدمات أو التقنيات المذكورة في هذا المحتوى مدعومة. راجع واجهة برمجة تطبيقات Pandas على Spark.

إشعار

كولاس مهمل. إذا حاولت استخدام Koalas على المجموعات التي تقوم بتشغيل Databricks Runtime 10.0 (غير مدعوم) وما فوق، يتم عرض رسالة إعلامية، توصي باستخدام Pandas API على Spark بدلا من ذلك.

يوفر Koalas بديلا عن الباندا. تستخدم بانداز عادة من قبل علماء البيانات، وهي حزمة Python توفر هياكل بيانات سهلة الاستخدام وأدوات تحليل البيانات للغة برمجة Python. ومع ذلك، لا يتم توسيع نطاق الباندا إلى البيانات الضخمة. تملأ Koalas هذه الفجوة من خلال توفير واجهات برمجة التطبيقات المكافئة ل Pandas التي تعمل على Apache Spark. Koalas مفيد ليس فقط لمستخدمي Pandas ولكن أيضا مستخدمي PySpark، لأن Koalas يدعم العديد من المهام التي يصعب القيام بها مع PySpark، على سبيل المثال رسم البيانات مباشرة من PySpark DataFrame.

المتطلبات

  • يتم تضمين Koalas على أنظمة المجموعات التي تعمل على Databricks Runtime 7.3 إلى 9.1. بالنسبة للمجموعات التي تقوم بتشغيل Databricks Runtime 10.0 والإصدارات الأحدث، استخدم Pandas API على Spark بدلا من ذلك.
  • لاستخدام Koalas على مجموعة تعمل على Databricks Runtime 7.0 أو أقل، قم بتثبيت Koalas كمكتبة Azure Databricks PyPI.
  • لاستخدام Koalas في IDE أو خادم دفتر الملاحظات أو التطبيقات المخصصة الأخرى التي تتصل بمجموعة Azure Databricks، قم بتثبيت Databricks الاتصال واتبع إرشادات تثبيت Koalas.

دفتر الملاحظات

يوضح دفتر الملاحظات التالي كيفية الترحيل من pandas إلى Koalas.

دفتر ملاحظات Pandas إلى Koalas

الحصول على دفتر الملاحظات

الموارد