الوظائف

ينطبق على: وضع علامة Databricks Runtime

يوفر Spark SQL ميزتين وظيفيتين لتلبية مجموعة واسعة من الاحتياجات: الوظائف المضمنة والوظائف المعرفة من قبل المستخدم (UDFs).

للتعرف على دقة الدالة واستدعاء الدالة، راجع: استدعاء الدالة.

الدوال المدمجة

تعرض هذه المقالة استخدامات ووصف فئات الدالات المضمنة المستخدمة بشكل متكرر للتجميع والصفائف والخرائط والتواريخ والطوابع الزمنية وبيانات JSON.

وظائف SQL وPython المعرفة من قبل المستخدم

الدالتان SQL وPython المعرفتان من قبل المستخدم (UDFs) هما دالتان يمكنك تعريفهما بنفسك يمكنهما إرجاع القيم العددية أو مجموعات النتائج.

راجع CREATE FUNCTION (SQL، Python) لمزيد من المعلومات.

الوظائف الخارجية المعرفة من قبل المستخدم

تسمح لك UDFs بتعريف الوظائف الخاصة بك عندما لا تكون الوظائف المضمنة في النظام كافية لتنفيذ المهمة المطلوبة. لاستخدام UDFs، يمكنك أولا تعريف الدالة، ثم تسجيل الدالة مع Spark، وأخيرا استدعاء الدالة المسجلة. يمكن أن يعمل UDF على صف واحد أو يعمل على صفوف متعددة في وقت واحد. يدعم Spark SQL أيضا تكامل تطبيقات Hive الحالية ل UDFs والوظائف التجميعية المعرفة من قبل المستخدم (UDAF) ووظائف الجدول المعرفة من قبل المستخدم (UDTF).