الملخص

مكتمل

في هذه الوحدة، تعلمت كيف توفر دفاتر Fabric بيئة تفاعلية لتشغيل تحويلات Spark SQL وPySpark، مع إمكانية الاتصال ببيوت البحيرات والمستودعات وقواعد بيانات KQL والمصادر الخارجية.

استكشفت كيف تعمل دفاتر الملاحظات، وما هي مخازن البيانات التي تصل إليها، وأنماط التطوير الشائعة مثل التطوير التفاعلي، والدفاتر المميزة، وتكامل خطوط الأنابيب. ثم طبقت تقنيات تشكيل النواة، بما في ذلك تصفية الصفوف، التعامل مع الصفر، إضافة الأعمدة المحسوبة، وتحويل أنواع البيانات. جمعت بيانات من جداول متعددة باستخدام التركيبات، وحسابت مقاييس ملخصة مع التجميعات، وطبقت دوال النوافذ للتصنيفات والمجموع المستمر. وأخيرا، كتبت نتائجك المحولة إلى جداول دلتا مع أوضاع كتابة مناسبة واعتبارات الحجم.

تمنحك هذه المهارات الأدوات لبناء خطوط تحويل متكررة تحول البيانات الخام إلى مخرجات موثوقة ومنظمة. أنماط Spark SQL وPySpark التي تدربت عليها تعمل عبر أي مخزن بيانات يمكن ل Spark الوصول إليه. جداول دلتا النظيفة التي تنتجها تشكل أساسا للتقارير، والنماذج الدلالية، والتجارب المدعومة بالذكاء الاصطناعي مثل وكلاء بيانات Fabric IQ الذين يستعلون بياناتك باستخدام اللغة الطبيعية.

معرفة المزيد