مخطط تصميم النجوم للنماذج الدلالية

مكتمل

أنت من اخترت كيف تتدفق البيانات إلى نموذجك الدلالي. الآن صمم مخطط النجوم الذي ينظمه لاستعلامات واضحة وذات أداء عالي. يربط مخطط النجوم جداول الحقائق بجداول الأبعاد من خلال العلاقات، مما يخلق مسارات التصفية التي تعتمد عليها التقارير واستهلاك الذكاء الاصطناعي. إذا كنت على دراية ببناء مخطط النجوم في Power BI Desktop، فإن هذه الوحدة تركز على قرارات تصميم العلاقات التي تهم مع تطور النماذج وحجمها.

مخطط النجوم في نموذج دلالي

في مخطط النجوم، تخزن جداول الحقائق أحداث أعمال قابلة للقياس (مثل معاملات البيع، خطوط الطلب، وزيارات الويب)، وتوفر جداول الأبعاد السياق الوصفي (مثل تفاصيل المنتج، معلومات العميل، وسمات التاريخ). تقوم جداول الأبعاد بتصفية جداول الحقائق عبر العلاقات، مما يسمح للمستخدمين بتقسيم المقاييس حسب أي سمة وصفية.

مخطط يوضح جدول حقائق في الوسط وجداول متعددة أبعاد متصلة بعلاقات منظمة على شكل نجمي.

في نموذج دلالي Fabric، يوفر هذا النمط انتشار مرشح نظيف لكل من التقارير واستهلاك الذكاء الاصطناعي. عندما يولد Copilot أو وكيل بيانات استعلاما لغة طبيعية، فإن مخطط النجوم المنظم جيدا يمنح الذكاء الاصطناعي مسارات واضحة للوصول إلى البيانات الصحيحة. العلاقات الغامضة أو الدائرية تربك مستهلكي التقارير وأدوات الذكاء الاصطناعي على حد سواء.

كيف يؤثر وضع التخزين على العلاقات

العلاقات في النموذج الدلالي تتصرف بشكل مختلف حسب وضع التخزين. فهم هذه الفروقات ضروري لتصميم مخطط النجوم الذي يعمل بشكل جيد عبر سيناريوهات مختلفة.

علاقات البحيرة المباشرة

في وضع البحيرة المباشرة، يقرأ المحرك العلاقات مباشرة من بيانات جداول دلتا. العلاقات تحقق أفضل أداء عندما:

  • أعمدة مفاتيح الأبعاد لها عدد كبير منخفض مقارنة بصفوف جداول الحقائق.
  • يتم الحفاظ على السلامة المرجعية في بيانات المصدر. عندما تحافظ السلامة المرجعية، يستخدم المحرك انضمامات INNER بدلا من LEFT OUTER JOINS، مما يحسن أداء الاستعلام.
  • الأعمدة المستخدمة في العلاقات مفهرسة في جداول دلتا الأساسية.

ملاحظة

إذا تضمنت الاستعلام علاقة تتسبب في تجاوز النموذج لحدود الذاكرة أو استخدام عمليات غير مدعومة، يعود بحيرة دايركت إلى DirectQuery، ويتغير سلوك العلاقة ليتوافق مع دلالات DirectQuery.

العلاقات متعددة المصادر

نماذج Fabric الدلالية يمكنها ربط الجداول من مخازن بيانات مختلفة. يمكن أن يكون لجدول الحقائق من بيت بحيرة علاقة بجدول أبعاد من مستودع، أو بجدول يتم الوصول إليه عبر نقطة نهاية تحليلات SQL. تستخدم هذه الاتصالات متعددة المصادر قدرات نموذج مركب.

عندما تأتي الجداول من مصادر مختلفة، يحدد وضع التخزين لكل جدول كيفية عمل العلاقة في وقت الاستعلام. يقوم المحرك بحل كل جانب بشكل مستقل وينضم إلى النتائج.

أنواع العلاقات

علاقَات واحد إلى متعدد

العلاقة من واحد إلى عدة هي أكثر أنواع العلاقة شيوعا في مخطط النجوم. قيمة فريدة في جدول أبعاد تتعلق بعدة صفوف في جدول الحقائق. على سبيل المثال، صف واحد من المنتجات في بعد المنتج يطابق آلاف صفوف الطلبات في جدول حقائق المبيعات.

قم بتكوين علاقات واحد إلى متعدد مع اتجاه المرشح الذي يتدفق من البعد (الجانب "الواحد") إلى جدول الحقائق (الجانب "المتعدد"). هذا هو نمط مرشح مخطط النجوم القياسي.

علاقَات متعدد إلى متعدد

العلاقات متعددة إلى متعددة مطلوبة عندما لا يحتوي أي من الجدولين على قيم فريدة لعمود العلاقة. استخدم جدول جسر لحل هذه العلاقات. طاولة جسر تقع بين طاولتين وتحتوي على تركيبات فريدة من المفاتيح من كل جانب.

على سبيل المثال، إذا كان يمكن للعميل أن يكون لديه عدة حسابات ويمكن أن يكون الحساب لعدة عملاء، فإن جدول جسر Customer-Account يحل العلاقة. جدول الجسر له علاقات واحدة إلى متعددة مع كل من جداول العميل وجدولي الحساب.

اتجاه التصفية

في معظم تطبيقات مخطط النجوم، استخدم الترشيح أحادي الاتجاه من البعد إلى الحقيقة. يوفر ذلك انتشار مرشح متوقع ويتجنب الغموض في نتائج الاستعلام.

يكون الترشيح ثنائي الاتجاه ضروريا أحيانا للعلاقات متعددة إلى متعددة أو عندما تحتاج جداول الأبعاد إلى تصفية بواسطة قيم في جدول الحقائق. استخدم المرشحات ثنائية الاتجاه بشكل محدود لأنها قد تقلل من أداء الاستعلام وخلق سلوك مرشح غير متوقع في التقارير.

السلامة المرجعية

إعداد Assumption rereferenceal integrity يخبر المحرك باستخدام انضمامات INNER بدلا من LEFT OUTER JOIN عند الاستعلام عبر العلاقة. في أوضاع البحيرة المباشرة وDirectQuery، يمكن لهذا الإعداد تحسين الأداء بشكل كبير لأنه يقلل عدد الصفوف التي يعالجها المحرك.

فعل هذا الإعداد عندما تكون واثقا من أن كل قيمة مفتاح أجنبي في جدول الحقائق لها قيمة مطابقة في جدول الأبعاد. إذا تم انتهاك السلامة المرجعية، تختفي الصفوف التي تحتوي على مفاتيح غير مطابقة بصمت من نتائج الاستعلام.

العلاقات غير النشطة وعلاقة الاستخدام

يمكن أن توجد علاقة نشطة واحدة فقط بين جدولين في نفس الوقت. عندما تحتاج إلى عدة مسارات علاقة (مثل تاريخ الطلب وتاريخ الشحن كلاهما مرتبط بنفس بعد التاريخ)، اجعل علاقة واحدة نشطة والأخرى غير نشطة.

استخدم الدالة USERELATIONSHIP في DAX لتفعيل علاقة غير نشطة ضمن عملية حساب:

Shipped Amount =
CALCULATE(
    SUM(Sales[Amount]),
    USERELATIONSHIP(Sales[ShipDate], 'Date'[Date])
)

يحافظ هذا النمط على نظافة النموذج مع دعم وجهات نظر تحليلية متعددة على نفس البيانات.

معالجة مخطط رقاقات الثلج في النماذج الدلالية

غالبا ما تصل بيانات المصدر إلى مخطط رقاقات ثلج موحد، حيث يتم تقسيم جداول الأبعاد إلى جداول متعددة ذات صلة. على سبيل المثال، قد يتم فصل بعد المنتج إلى جداول منتج، فئة فرعية، وفئات، وكل منها مرتبط عبر مفاتيح أجنبية.

في النموذج الدلالي، لديك خياران: تسطيح ندفة الثلج إلى مخطط نجمي، أو الحفاظ على البنية الطبيعية.

تسطيح إلى مخطط النجوم

التسوية تعني دمج جداول الأبعاد الممطرة في جدول أبعاد غير طبيعي واحد. سيشمل جدول المنتج أعمدة الفئات الفرعية والفئة مباشرة، مما يلغي الجداول والعلاقات الإضافية.

التسوية عندما:

  • جدول الأبعاد المركبة لا يزال صغيرا مقارنة بجدول الحقائق (وهو الحال تقريبا دائما بالنسبة للأبعاد).
  • تريد مسارات تصفية أبسط من البعد إلى الحقيقة. كل مرشح ينتقل عبر علاقة واحدة بدلا من سلسلة.
  • استهلاك الذكاء الاصطناعي أولوية. الجداول الأقل والعلاقات الأبسط تمنح Copilot ووكلاء البيانات طرقا أوضح للوصول إلى البيانات الصحيحة.

تسوية جداول الأبعاد أثناء إعداد البيانات في بيوت البحيرات أو تدفقات البيانات، قبل أن تصل البيانات إلى النموذج الدلالي. استخدم دمج Power Query، أو انضمامات SQL، أو تحويلات دفاتر ملاحظات لدمج الجداول الموحدة في بعد واحد.

الحفاظ على هيكل ندفة الثلج

في بعض الحالات، من المنطقي الحفاظ على البنية التطبيعة:

  • تسلسل الأبعاد له عدة مستويات، وعند تسطيح الأبعاد كان سيخلق عشرات الأعمدة المكررة.
  • جداول الحقائق المتعددة تشترك في جداول فرعية الأبعاد (مثل جدول الفئات المشترك المستخدم من قبل كل من حقائق المبيعات والمخزون)، ويؤدي التمريض إلى خلق نسخ غير متسقة.
  • يجب تطبيق أمان مستوى الصف على مستوى معين في التسلسل الهرمي.

عندما تحافظ على هيكل رقاقات الثلج، قم بتنسيق العلاقات بعناية. يجب أن تستخدم كل علاقة في السلسلة ترشيح أحادي الاتجاه من الجدول الخارجي نحو جدول الحقائق حتى تنتشر المرشحات بشكل صحيح. يجب أن يتدفق مرشح على الفئة عبر الفئة الفرعية، ثم عبر المنتج، وإلى جدول الحقائق.

ملاحظة

في معظم سيناريوهات النماذج الدلالية، فإن تسطيح الأبعاد إلى مخطط نجمي هو الخيار الأفضل. الجداول الأقل تعني علاقات أقل، وDAX أبسط، واستعلامات أسرع، واستهلاك أفضل للذكاء الاصطناعي. حافظ على هيكل رقاقات الثلج فقط عندما يكون هناك سبب قوي للبقاء عليه.

متى تستخدم النماذج المركبة للسيناريوهات عبر المصادر

استخدم النماذج المركبة عندما يمتد مخطط النجوم عبر عدة مخازن بيانات في Fabric أو يتضمن مصادر خارجية. تتضمن السيناريوهات الشائعة ما يلي:

  • طاولات الحقائق في بيت بحيرة مع جداول أبعاد محفوظة في مستودع.
  • بيانات البث في الوقت الحقيقي من بيت الحدث مع بيانات تاريخية في بيت بحيرة.
  • بيانات مرجعية من مصدر خارجي (استيراد) مدمجة مع جداول حقائق أصلية في Fabric (بحيرة مباشرة).

في هذه السيناريوهات، قم بتكوين وضع التخزين لكل جدول بشكل مستقل وتحقق من أن العلاقات بين المصادر تؤدي أداء مقبولا عند حجم البيانات المتوقع لديك.