تصميم وتنفيذ نمذجة البيانات باستخدام Azure Databricks
متوسط
مهندس بيانات
Azure Databricks
تشكل النمذجة الفعالة للبيانات أساس منصة بيانات فعالة وقابلة للصيانة. تستكشف هذه الوحدة كيفية تصميم منطق الدخول، واختيار الأدوات وصيغ الجداول المناسبة، وتنفيذ مخططات التقسيم، وإدارة الأبعاد المتغيرة ببطء، واختيار التفصيل المناسب للبيانات، وتحسين أداء الجداول من خلال استراتيجيات التجميع في Azure Databricks مع كتالوج Unity.
الأهداف التعليمية
في نهاية هذه الوحدة، ستتمكن من:
- صمم منطق استيعاب البيانات وقم بتكوين اتصالات مصدر البيانات
- اختر أداة استيعاب البيانات المناسبة لحالتك
- اختر بين Delta Lake وApache Iceberg وتنسيقات الجداول الأخرى
- تصميم وتنفيذ مخططات تقسيم البيانات الفعالة
- اختر ونفذ أنواع الأبعاد المتغيرة ببطء
- تصميم وتنفيذ جداول زمنية لتتبع التغييرات والتدقيق
- اختر دقة البيانات المناسبة لجداول الحقائق والأبعاد
- تصميم وتنفيذ استراتيجيات التجميع لتحسين الاستعلامات
- تقييم متى تستخدم الجداول المدارة مقابل الجداول الخارجية
المتطلبات الأساسية
يجب استكمال المتطلبات المسبقة التالية:
- فهم أساسي لمساحات عمل Azure Databricks وكتالوج Unity
- الإلمام بمفاهيم SQL ومستودعات البيانات
- معرفة أساسيات بحيرة دلتا