بيانات النماذج في المستودع
بدون نمذجة البيانات، يجب على كل consumer أن يكتشف أي الجداول ترتبط ببعضها البعض، ويكتب منطق التجميع الخاص به، ويخمن معاني الأعمدة. نمذجة البيانات تحل هذه المشكلة من خلال تضمين الهيكل، ومنطق الأعمال، والتوثيق مباشرة في المخزن. في مستودع Microsoft Fabric، تقوم بإعداد البيانات من أجل clarity، وتحديد العلاقات بين الجداول، وتوحيد access من خلال العروض والمقاييس، ونشر نماذج دلالية للتقارير. تؤثر هذه الخيارات النمذجة على كل تجربة لاحقة، بما في ذلك استعلامات T-SQL، وتقارير Power BI، وتحليلات اللغة الطبيعية المدعومة بالذكاء الاصطناعي.
تحضير البيانات للاستهلاك
قبل أن تحدد العلاقات أو تضيف حسابات، عليك أن تنظف ما يراه المستهلكون. غالبا ما تحتوي جداول المستودعات الخام على جداول المرحلة، وأعمدة المفاتيح البديلة، والأعلام الداخلية التي تهدف إلى معالجة ETL وليس للتحليل. هذه الكائنات تصدر ضوضاء عند تصفح المستهلكين للبيانات. إعداد المستودع للاستهلاك يعني إظهار ما هو مهم فقط وجعله مفهوما.
في عرض النموذج، يمكنك اتخاذ عدة خطوات لتحسين تجربة consumer:
- إخفاء الكائنات الداخلية مثل جداول المرحلة، وأعمدة المفاتيح البديلة، و artifacts ETL التي تزدحم قائمة الحقول.
-
أعد تسمية الأعمدة لاستخدام أسماء صديقة للأعمال حيث تكون أسماء أعمدة المستودعات تقنية أو مختصرة. على سبيل المثال، إعادة التسمية
CustRgnإلىCustomer Region. - أضف أوصافا إلى الجداول والأعمدة حتى يفهم المستهلكون ما تمثله البيانات دون الرجوع إلى وثائق خارجية.
هذه الخطوات تتجاوز مجرد الترتيب. يعتمد وكلاء بيانات Copilot في Power BI وFabric IQ على أسماء الجداول، وأسماء الأعمدة، والوصف لتفسير أسئلة اللغة الطبيعية وتوليد SQL أو DAX دقيق. العمود المسمى Customer Region بوصف مثل "المنطقة الجغرافية للعنوان الأساسي للعميل" ينتج نتائج لغة طبيعية أفضل من CustRgn العمود بدون وصف.
مع وجود جداول نظيفة وذات أسماء جيدة، ستكون جاهزا لتحديد كيفية ربط هذه الجداول ببعضها البعض.
فهم العلاقات بين الجداول
العلاقة هي اتصال منطقي بين جدولين يمكن من التصفية، والتجميع، والتجميع عبر هذين الجدولين. في مخطط النجمة، تربط العلاقات جداول الحقائق بجداول الأبعاد عبر أعمدة مفاتيح مشتركة.
على سبيل المثال، يوجد CustomerKey عمود في كلا الموقعين FactSales ويؤسس DimCustomer الرابط الذي يتيح تحليل المبيعات حسب خصائص العملاء مثل المنطقة أو القطاع أو نوع الحساب.
لكل علاقة خاصيتين مهمتين.
- تصف الكاردينالية كيف تتوافق الصفوف في الجدولين. في مخطط النجوم، تكون علاقات الحقائق إلى البعد عادة متعددة إلى واحد، مما يعني أن العديد من صفوف الحقائق تربط بصف بعد واحد.
- اتجاه المرشحات المتقاطعة يحدد اتجاه انتشار المرشحات بين الجداول. الاتجاه الواحد، حيث يقوم البعد بترشيح جدول الحقائق، هو الإعداد القياسي لمعظم تصاميم مخطط النجوم لأنه يحافظ على سلوك الترشيح متوقعا وأداءه.
بدون علاقات محددة، يحتاج كل consumer يرغب في دمج البيانات عبر الجداول إلى كتابة منطق JOIN صريح. العلاقات تلغي هذا التكرار عن طريق ترميز الاتصال مرة واحدة. عندما تنشئ نموذجا دلاليا من المستودع، فإن هذه العلاقات تؤثر على كيفية تفسير وكلاء بيانات Power BI وCopilot وFabric IQ للبيانات. على سبيل المثال، يستخدم وكلاء البيانات العلاقات لإنشاء انضمامات دقيقة عند ترجمة أسئلة اللغة الطبيعية إلى SQL.
إشعار
تستخدم معظم مستودعات البيانات النمذجة الأبعادية. يمكن إنشاء علاقات لتشكيل مخطط النجوم، وهو نموذج مثالي للتحليلات. لمزيد من المعلومات، راجع نماذج الأبعاد Design في وحدة Microsoft Fabric.
توحيد access البيانات من خلال العروض والمقاييس
الآن بعد أن أصبحت جداولكم نظيفة ومتصلة، الخطوة التالية هي تزويد المستهلكين بطرق موثوقة ومتسقة للاستعلام والحساب بناء على تلك البيانات. بدون توحيد قياسي، يكتب كل فريق منطق الانضمام الخاص به، ويطبق مرشحاته الخاصة، ويحدد صيغه الخاصة، مما يؤدي إلى نتائج متضاربة.
توفر العروض هذا الاتساق لمستخدمي T-SQL. العرض يجمع منطق الانضمام والفلاتر واختيار الأعمدة في استعلام قابل لإعادة الاستخدام يستشيره المستهلكون مثل الجدول. على سبيل المثال، العرض الذي يربط جداول الحقائق والأبعاد، ويقوم بتصفية الطلبات المكتملة، ويظهر فقط الأعمدة التي يحتاجها المحللون يمنح كل consumer في T-SQL نقطة انطلاق موثوقة. تعمل العروض أيضا كمصادر بيانات مستقرة للتقارير. بدلا من بناء التقارير مباشرة مقابل جداول أساسية قد تتغير، يمكنك توجيه التقارير إلى العروض التي تقدم شكلا متسقا.
توفر المقاييس نفس الاتساق لحسابات DAX. المقياس هو تعبير DAX قابل لإعادة الاستخدام يحدد حسابا مثل المجموع أو المتوسط أو النسبة أو العدد. تقوم بإنشاء المقاييس مباشرة في عرض نموذج المستودع عن طريق اختيار جدول وإضافة مقياس جديد. على سبيل المثال، مقياس Total Sales يجمع عمود SalesAmount يضمن أن كل consumer يستخدم نفس الحساب.
لأن تعريف المقياس يعيش مع البيانات، يصبح المصدر الوحيد للحقيقة لهذا المقياس. عندما تغير الشركة طريقة حساب الإيرادات، تقوم بتحديث المقياس في مكان واحد بدلا من تتبع كل تقرير يحتوي على صيغته الخاصة.
معا، تغطي الرؤيات والمقاييس جانبي الاستهلاك: حيث توحد الآراء كيفية وصول مستهلكي T-SQL إلى access واستعلام البيانات، بينما تقوم المقاييس بتوحيد كيفية ظهور حسابات الأعمال في التقارير ولوحات المعلومات.
تلميح
يتم تغطية صيغ DAX وتصميم القياس المتقدم بعمق في الوحدات اللاحقة. للعروض والإجراءات المخزنة، راجع الوحدة السابقة حول الاستعلام وتحويل البيانات.
إنشاء نموذج دلالي لتقارير Power BI
مع وجود جداول محضرة، وعلاقات محددة، وآراء ومقاييس موحدة، يكون المستودع جاهزا للتقارير اللاحقة. الفرق التي تستفسر المستودع مباشرة باستخدام T-SQL أو تتصل عبر أدوات طرف ثالث يمكنها العمل مع نموذج المستودع as-is. ومع ذلك، عندما ترغب في بناء تقارير ولوحات تحكم تفاعلية في Power BI، فإن إنشاء نموذج دلالي هو الخطوة التالية.
النماذج الدلالية التي تم إنشاؤها من مستودع الأقمشة تستخدم وضع البحيرة المباشرة. على عكس وضع الاستيراد التقليدي، الذي ينسخ البيانات إلى ذاكرة Power BI، يقرأ Direct Lake البيانات مباشرة من ملفات OneLake Parquet. وهذا يعني أن التقارير تعكس أحدث بيانات المستودعات دون الحاجة إلى تحديثات مجدولة. كما يعني ذلك أنك تتجنب عبء storage ومعالجة الاحتفاظ بنسخة منفصلة من البيانات.
تلميح
يتم تغطية تصميم النماذج الدلالية وأنماط قابلية التوسع بشكل أعمق في تصميم نماذج دلالية قابلة للتوسع. تركز هذه الوحدة على نمذجة البيانات داخل المستودع نفسه.