هندسة بيانات Databricks
تعد ميزات هندسة البيانات في Databricks بيئة قوية للتعاون بين علماء البيانات ومهندسي البيانات ومحللي البيانات. تعد مهام هندسة البيانات أيضا العمود الفقري لحلول التعلم الآلي من Databricks.
إشعار
إذا كنت محللا للبيانات يعمل بشكل أساسي مع استعلامات SQL وأدوات BI، فقد تفضل Databricks SQL.
الاسم | استخدم هذا عندما تريد... |
---|---|
Delta Live Tables | تعرف على كيفية إنشاء مسارات البيانات لاستيعابها وتحويلها باستخدام Databricks Delta Live Tables. |
دفق منظم | تعرف على أحمال العمل المتدفقة والتزايدية وفي الوقت الحقيقي التي يتم تشغيلها بواسطة Structured Streaming على Databricks. |
Apache Spark | تعرف على كيفية عمل Apache Spark على Databricks ومنصة Databricks. |
دفاتر الملاحظات | تعرف على دفتر ملاحظات Databricks وكيفية استخدام دفاتر الملاحظات وإدارتها لمعالجة بياناتك وتحليلها وتصورها. |
مهام سير العمل | تعرف على كيفية تنسيق معالجة البيانات والتعلم الآلي وسير عمل تحليل البيانات على النظام الأساسي Databricks. |
المكتبات | تعرف على كيفية توفير التعليمات البرمجية المخصصة أو التابعة لجهة خارجية في Databricks باستخدام المكتبات. تعرف على الأوضاع المختلفة لتثبيت المكتبات على Databricks. |
مجلدات Git | تعرف على كيفية استخدام Git للتحكم في الإصدار في دفاتر الملاحظات والملفات الأخرى للتطوير في Databricks. |
DBFS | تعرف على نظام ملفات Databricks (DBFS)، وهو نظام ملفات موزع مثبت في مساحة عمل Databricks ومتاح على مجموعات Databricks |
الملفات | تعرف على خيارات العمل مع الملفات على Databricks. |
الهجره | تعرف على كيفية ترحيل تطبيقات البيانات مثل وظائف ETL ومستودعات بيانات المؤسسة والتعلم الآلي وعلوم البيانات والتحليلات إلى Databricks. |
التحسين والأداء | تعرف على التحسينات وتوصيات الأداء على Databricks. |
الملاحظات
https://aka.ms/ContentUserFeedback.
قريبًا: خلال عام 2024، سنتخلص تدريجيًا من GitHub Issues بوصفها آلية إرسال ملاحظات للمحتوى ونستبدلها بنظام ملاحظات جديد. لمزيد من المعلومات، راجعإرسال الملاحظات وعرضها المتعلقة بـ