المعالجة التحليلية عبر الإنترنت (OLAP)

Azure Analysis Services

المعالجة التحليلية عبر الإنترنت (OLAP) هي تقنية تنظم قواعد بيانات الأعمال الكبيرة وتدعم التحليل المعقد. يمكن استخدامها لإجراء استعلامات تحليلية معقدة دون التأثير سلباً على أنظمة المعاملات.

تسمى قواعد البيانات التي يستخدمها النشاط التجاري لتخزين جميع معاملاته وسجلاته قواعد بيانات معالجة المعاملات عبر الإنترنت (OLTP). عادة ما تحتوي قواعد البيانات هذه على سجلات يتم إدخالها كل على حدة. غالباً ما تحتوي على قدر كبير من المعلومات التي تكون قيمة للمؤسسة. ومع ذلك، لم يتم تصميم قواعد البيانات المستخدمة لـ OLTP للتحليل. لذلك، فإن استرداد الإجابات من قواعد البيانات هذه مكلف من حيث الوقت والجهد. تم تصميم أنظمة OLAP للمساعدة في استخراج معلومات المعلومات المهنية هذه من البيانات بطريقة عالية الأداء. وذلك لأن قواعد بيانات OLAP محسنة لأحمال العمل الثقيلة للقراءة والكتابة المنخفضة.

رسم تخطيطي يوضح بنية OLAP المنطقية في Azure.

النمذجة الدلالية

نموذج البيانات الدلالي هو نموذج مفاهيمي يصف معنى عناصر البيانات التي يحتوي عليها. غالباً ما يكون للمؤسسات مصطلحات خاصة بها للأشياء، وأحيانا مع المرادفات، أو حتى معاني مختلفة لنفس المصطلح. على سبيل المثال، قد تتعقب قاعدة بيانات المخزون قطعة من المعدات ذات معرف أصل ورقم تسلسلي، ولكن قد تشير قاعدة بيانات المبيعات إلى الرقم التسلسلي كمعرف الأصل. لا توجد طريقة بسيطة لربط هذه القيم دون نموذج يصف العلاقة.

توفر النمذجة الدلالية مستوى من التجريد عبر مخطط قاعدة البيانات، بحيث لا يحتاج المستخدمون إلى معرفة بنيات البيانات الأساسية. وهذا يسهل على المستخدمين النهائيين الاستعلام عن البيانات دون إجراء التجميعات والصلات عبر المخطط الأساسي. أيضاً، عادة ما تتم إعادة تسمية الأعمدة بأسماء أكثر سهولة في الاستخدام، بحيث يكون سياق البيانات ومعناها أكثر وضوحاً.

يتم استخدام النمذجة الدلالية بشكل عام لسيناريوهات القراءة الثقيلة، مثل التحليلات والمعلومات المهنية (OLAP)، بدلاً من معالجة بيانات المعاملات الثقيلة للكتابة (OLTP). ويرجع ذلك في الغالب إلى طبيعة الطبقة الدلالية النموذجية:

  • يتم تعيين سلوكيات التجميع بحيث تعرضها أدوات التقارير بشكل صحيح.
  • يتم تعريف منطق العمل والحسابات.
  • يتم تضمين العمليات الحسابية الموجهة للوقت.
  • غالباً ما يتم دمج البيانات من مصادر متعددة.

تقليدياً، يتم وضع الطبقة الدلالية فوق مستودع بيانات لهذه الأسباب.

رسم تخطيطي مثال لطبقة دلالية بين مستودع بيانات وأداة إعداد التقارير

هناك نوعان أساسيان من النماذج الدلالية:

  • جدولي. يستخدم بنيات النمذجة الارتباطية (النموذج والجداول والأعمدة). داخلياً، يتم توريث بيانات التعريف من بنيات نمذجة OLAP (المكعبات والأبعاد والمقاييس). تستخدم التعليمات البرمجية والبرامج النصية بيانات تعريف OLAP.
  • متعدد الأبعاد. يستخدم بنيات نمذجة OLAP التقليدية (المكعبات والأبعاد والمقاييس).

خدمة Azure ذات الصلة:

مثال على حالة الاستخدام

لدى المؤسسة بيانات مخزنة في قاعدة بيانات كبيرة. يريد جعل هذه البيانات متاحة لمستخدمي الأعمال والعملاء لإنشاء تقاريرهم الخاصة وإجراء بعض التحليلات. يتمثل أحد الخيارات فقط في منح هؤلاء المستخدمين حق الوصول المباشر إلى قاعدة البيانات. ومع ذلك، هناك العديد من العيوب للقيام بذلك، بما في ذلك إدارة الأمان والتحكم في الوصول. أيضاً، قد يكون من الصعب على المستخدم فهم تصميم قاعدة البيانات، بما في ذلك أسماء الجداول والأعمدة. سيحتاج المستخدمون إلى معرفة الجداول التي يجب الاستعلام عنها، وكيفية ربط هذه الجداول، ومنطق العمل الآخر الذي يجب تطبيقه للحصول على النتائج الصحيحة. سيحتاج المستخدمون أيضاً إلى معرفة لغة استعلام مثل SQL حتى للبدء. عادة ما يؤدي هذا إلى قيام عدة مستخدمين بالإبلاغ عن نفس المقاييس ولكن بنتائج مختلفة.

هناك خيار آخر وهو تغليف جميع المعلومات التي يحتاجها المستخدمون في نموذج دلالي. يمكن الاستعلام عن النموذج الدلالي بسهولة أكبر من قبل المستخدمين باستخدام أداة إعداد التقارير التي يختارونها. يتم سحب البيانات التي يوفرها النموذج الدلالي من مستودع بيانات، مما يضمن أن جميع المستخدمين يرون نسخة واحدة من الحقيقة. يوفر النموذج الدلالي أيضاً أسماء الجداول والأعمدة المألوفة والعلاقات بين الجداول والأوصاف والحسابات والأمان على مستوى الصف.

السمات النموذجية للنمذجة الدلالية

تميل النمذجة الدلالية والمعالجة التحليلية إلى الحصول على السمات التالية:

المتطلبات الوصف
مخطط مخطط عند الكتابة، مفروضة بقوة
يستخدم العمليات لا
استراتيجية التأمين بلا
قابل للتحديث لا (يتطلب عادة إعادة حساب المكعب)
قابل للإلحاق لا (يتطلب عادة إعادة حساب المكعب)
حمل العمل قراءات ثقيلة، للقراءة فقط
الفهرسة الفهرسة متعددة الأبعاد
حجم مرجع الإسناد صغير إلى متوسط الحجم
النموذج متعدد الأبعاد
شكل البيانات: مخطط المكعب أو النجمة/البلورة الثلجية
مرونة الاستعلام مرن للغاية
المقياس: كبير (10-100 غيغابايت)

متى يتم استخدام هذا الحل

ضع في اعتبارك OLAP في السيناريوهات التالية:

  • تحتاج إلى تنفيذ استعلامات تحليلية ومخصصة معقدة بسرعة، دون التأثير سلباً على أنظمة OLTP لديك.
  • تريد تزويد مستخدمي الأعمال بطريقة بسيطة لإنشاء تقارير من بياناتك
  • تريد توفير عدد من التجميعات التي ستسمح للمستخدمين بالحصول على نتائج سريعة ومتسقة.

OLAP مفيد بشكل خاص لتطبيق العمليات الحسابية التجميعية على كميات كبيرة من البيانات. تم تحسين أنظمة OLAP لسيناريوهات القراءة الثقيلة، مثل التحليلات والمعلومات المهنية. يسمح OLAP للمستخدمين بتقسيم البيانات متعددة الأبعاد إلى شرائح يمكن عرضها في بعدين (مثل جدول محوري) أو تصفية البيانات حسب قيم معينة. تسمى هذه العملية أحياناً "تقسيم البيانات وتكسيرها"، ويمكن القيام بها بغض النظر عما إذا كانت البيانات مقسمة عبر عدة مصادر بيانات. يساعد هذا المستخدمين على العثور على الاتجاهات والأنماط الموضعية واستكشاف البيانات دون الحاجة إلى معرفة تفاصيل تحليل البيانات التقليدية.

يمكن أن تساعد النماذج الدلالية مستخدمي الأعمال على تجريد تعقيدات العلاقات وتسهيل تحليل البيانات بسرعة.

التحديات

لجميع الفوائد التي توفرها أنظمة OLAP، فإنها تنتج بعض التحديات:

  • في حين يتم تحديث البيانات في أنظمة OLTP باستمرار من خلال المعاملات المتدفقة من مصادر مختلفة، يتم عادة تحديث مخازن بيانات OLAP على فترات أبطأ بكثير، اعتمادا على احتياجات العمل. وهذا يعني أن أنظمة OLAP أكثر ملاءمة لقرارات الأعمال الاستراتيجية، بدلاً من الاستجابات الفورية للتغييرات. أيضاً، يجب التخطيط لمستوى ما من تنقية البيانات وتنسيقها للحفاظ على مخازن بيانات OLAP محدثة.
  • على عكس الجداول الارتباطية والمألوفة والتقليدية الموجودة في أنظمة OLTP، تميل نماذج بيانات OLAP إلى أن تكون متعددة الأبعاد. وهذا يجعل من الصعب أو المستحيل التعيين مباشرة إلى علاقة الكيان أو النماذج الموجهة للعناصر، حيث يتم تعيين كل سمة إلى عمود واحد. بدلاً من ذلك، عادة ما تستخدم أنظمة OLAP مخطط نجمة أو بلورة ثلجية بدلاً من التآلف التقليدي.

OLAP في Azure

في Azure، يتم نسخ البيانات الموجودة في أنظمة OLTP، مثل قاعدة بيانات Azure SQL إلى نظام OLAP، مثل Azure Analysis Services. تتصل أدوات استكشاف البيانات والتصور، مثل Power BI وExcel وخيارات الجهات الخارجية بخوادم Analysis Services، وتوفر للمستخدمين رؤى تفاعلية للغاية وغنية مرئيًا بالبيانات النموذجية. عادةً ما يتم تنسيق تدفق البيانات من بيانات OLTP إلى OLAP باستخدام SQL Server Integration Services، والتي يمكن تنفيذها باستخدام Azure Data Factory.

في Azure، ستلبي جميع مخازن البيانات التالية المتطلبات الأساسية لـ OLAP:

يوفر SQL Server Analysis Services (SSAS) وظائف OLAP والتنقيب عن البيانات لتطبيقات المعلومات المهنية. يمكنك إما تثبيت SSAS على الخوادم المحلية، أو المضيف داخل جهاز ظاهري في Azure. Azure Analysis Services هي خدمة مدارة بالكامل توفر نفس الميزات الرئيسية، مثل SSAS. تدعم Azure Analysis Services الاتصال بمصادر بيانات مختلفة في السحابة وفي أماكن العمل في مؤسستك.

تتوفر مؤشرات تخزين الأعمدة المجمعة في SQL Server 2014 والإصدارات الأحدث، بالإضافة إلى قواعد بيانات Azure SQL، وهي مثالية لأحمال عمل OLAP. ومع ذلك، بدءا من SQL Server 2016 (بما في ذلك قاعدة بيانات Azure SQL)، يمكنك الاستفادة من المعالجة المختلطة للمعاملات/التحليلية (HTAP) من خلال استخدام فهارس تخزين الأعمدة غير متفاوتة المسافات القابلة للتحديث. يمكنك HTAP من إجراء معالجة OLTP وOLAP على نفس النظام الأساسي، ما يزيل الحاجة إلى تخزين نسخ متعددة من بياناتك، ويلغي الحاجة إلى أنظمة OLTP وOLAP مميزة. لمزيد من المعلومات، راجع بدء العمل باستخدام مخزن الأعمدة للتحليلات التشغيلية في الوقت الحقيقي.

معايير تحديد المفتاح

لتضييق الخيارات، ابدأ بالإجابة على هذه الأسئلة:

  • هل تريد خدمة مدارة بدلاً من إدارة الخوادم الخاصة بك؟

  • هل تحتاج إلى مصادقة آمنة باستخدام معرف Microsoft Entra؟

  • هل تريد إجراء تحليلات في الوقت الحقيقي؟ إذا كان الأمر كذلك، فضيق خياراتك على تلك التي تدعم التحليلات في الوقت الحقيقي.

    التحليلات في الوقت الحقيقي تنطبق في هذا السياق على مصدر بيانات واحد، مثل تطبيق تخطيط موارد المؤسسة (ERP)، الذي سيشغل حمل عمل تشغيليًا وتحليليًا على حد سواء. إذا كنت بحاجة إلى دمج البيانات من مصادر متعددة، أو تتطلب أداء تحليلات فائقاً باستخدام بيانات مجمعة مسبقاً مثل المكعبات، فقد لا تزال تحتاج إلى مستودع بيانات منفصل.

  • هل تحتاج إلى استخدام البيانات المجمعة مسبقاً، على سبيل المثال لتوفير نماذج دلالية تجعل التحليلات أكثر سهولة في استخدام الأعمال؟ إذا كانت الإجابة بنعم، فاختر خياراً يدعم المكعبات متعددة الأبعاد أو النماذج الدلالية الجدولية.

    يمكن أن يساعد توفير التجميعات المستخدمين على حساب تجميعات البيانات باستمرار. يمكن أن توفر البيانات المجمعة مسبقاً أيضاً تعزيزاً كبيراً للأداء عند التعامل مع عدة أعمدة عبر العديد من الصفوف. يمكن تجميع البيانات مسبقاً في مكعبات متعددة الأبعاد أو نماذج دلالية جدولية.

  • هل تحتاج إلى دمج البيانات من عدة مصادر، خارج مخزن بيانات OLTP الخاص بك؟ إذا كان الأمر كذلك، ففكر في الخيارات التي تدمج مصادر بيانات متعددة بسهولة.

مصفوفة الإمكانات

تلخص الجداول التالية الاختلافات الرئيسية في القدرات.

الإمكانات العامة

الإمكانية Azure Analysis Services SQL Server Analysis Services SQL Server مع مؤشرات تخزين الأعمدة قاعدة بيانات Azure SQL مع مؤشرات تخزين الأعمدة
خدمة مدارة ‏‏نعم‬ لا لا ‏‏نعم‬
يدعم المكعبات متعددة الأبعاد لا نعم لا لا
يدعم النماذج الدلالية الجدولية ‏‏نعم‬ نعم لا لا
دمج مصادر بيانات متعددة بسهولة ‏‏نعم‬ ‏‏نعم‬ رقم 1 رقم 1
يدعم التحليلات في الوقت الحقيقي لا لا نعم ‏‏نعم‬
يتطلب عملية لنسخ البيانات من المصادر ‏‏نعم‬ نعم لا لا
تكامل Microsoft Entra ‏‏نعم‬ لا لا 2 ‏‏نعم‬

[1] على الرغم من أنه لا يمكن استخدام SQL Server وقاعدة بيانات Azure SQL للاستعلام من مصادر بيانات خارجية متعددة ودمجها، فلا يزال بإمكانك إنشاء مسار يقوم بذلك نيابة عنك باستخدام SSIS أو Azure Data Factory. تحتوي SQL Server المستضافة في جهاز Azure الظاهري على خيارات إضافية، مثل الخوادم المرتبطة وPolyBase. لمزيد من المعلومات، راجع تنسيق المسارات وتدفق التحكم وحركة البيانات.

[2] الاتصال ب SQL Server الذي يعمل على جهاز Azure الظاهري غير مدعوم باستخدام حساب Microsoft Entra. استخدم حساب المجال في Active Directory بدلا من ذلك.

إمكانات قابلية التوسع

الإمكانية Azure Analysis Services SQL Server Analysis Services SQL Server مع مؤشرات تخزين الأعمدة قاعدة بيانات Azure SQL مع مؤشرات تخزين الأعمدة
خوادم إقليمية زائدة عن الحاجة لقابلية وصول عالية ‏‏نعم‬ لا نعم ‏‏نعم‬
يدعم توسيع نطاق الاستعلام ‏‏نعم‬ لا نعم ‏‏نعم‬
قابلية التوسع الديناميكي (التوسيع) ‏‏نعم‬ لا نعم ‏‏نعم‬

المساهمون

تحتفظ Microsoft بهذه المقالة. وهي مكتوبة في الأصل من قبل المساهمين التاليين.

الكاتب الرئيسي:

الخطوات التالية