توصيات لتحسين أداء البيانات

ينطبق على توصية قائمة التحقق من كفاءة أداء Azure Well-Architected Framework هذه:

PE:08 تحسين أداء البيانات. تحسين مخازن البيانات والأقسام والفهارس لاستخدامها المقصود والفعلي في حمل العمل.

يصف هذا الدليل توصيات تحسين أداء البيانات. يتعلق تحسين أداء البيانات بتحسين الكفاءة التي يعالج بها حمل العمل البيانات ويخزنها. تعتمد كل عملية حمل عمل أو عملية أو حساب عادة على استرداد البيانات ومعالجتها وتخزينها بسرعة ودقيقة. عند تحسين أداء البيانات، يعمل حمل العمل بسلاسة. يؤدي أداء البيانات المخترقة إلى إنشاء تأثير دومينو لكفاءة الأداء الضعيفة. يؤدي الفشل في تحسين أداء البيانات إلى تأخيرات في الاستجابة، وزيادة زمن الانتقال، وتقليل قابلية التوسع. إنه يعرض كفاءة حمل العمل بأكمله للخطر.

التعريفات

المصطلح التعريف
نظرية CAP إطار عمل يستخدم للنظر في التناسق والتوافر والتسامح مع القسم للمساعدة في شرح المقايضات في تناسق البيانات.
إعادة إنشاء فهرس قاعدة البيانات نشاط صيانة يسقط فهرسا ويعيد إنشائه.
إعادة تنظيم فهرس قاعدة البيانات نشاط صيانة يحسن فهرس قاعدة البيانات الحالي.
مخزن البيانات مورد يخزن بيانات مثل قاعدة بيانات أو مخزن عناصر أو مشاركة ملف.
الاتساق النهائي "Eventual" نموذج مزامنة البيانات الذي يسمح بعدم التناسق المؤقت في النسخ المتماثلة للبيانات قبل مزامنتها في النهاية.
الفهرس بنية قاعدة بيانات توفر وصولا سريعا إلى العناصر.
المعالجة التحليلية عبر الإنترنت (OLAP) تقنية تنظم قواعد بيانات الأعمال الكبيرة وتدعم التحليل المعقد وتنفذ استعلامات تحليلية معقدة دون التأثير سلبا على أنظمة المعاملات.
معالجة العمليات عبر الإنترنت (OLTP) تقنية تسجل تفاعلات الأعمال عند حدوثها في العمليات اليومية للمؤسسة.
التزامن الأمثل نهج لتحديث قواعد البيانات التي تستخدم اللقطات لإجراء التحديثات بدلا من آليات التأمين التقليدية، وتحسين الأداء وقابلية التوسع.
نظرية PACELC إطار عمل يستخدم للنظر في التسامح مع القسم والتوافر والاتساق وا لزمن الانتقال للمساعدة في شرح المفاضلات في تناسق البيانات.
التقسيم عملية تقسيم البيانات فعليا إلى مخازن بيانات منفصلة.
ضبط الاستعلام عملية تعمل على تحسين سرعة استعلام قاعدة البيانات.
قراءة النسخة المتماثلة نسخة مباشرة من قاعدة بيانات أساسية تمكنك من إلغاء تحميل نسبة استخدام الشبكة للقراءة من قاعدة بيانات الكتابة.

استراتيجيات التصميم الرئيسية

لتحسين استخدام البيانات، تأكد من تحسين مخازن البيانات والأقسام والفهارس لاستخدامها المقصود واستخدامها الفعلي في حمل العمل. يمكن أن يؤدي استخدام البيانات المحسن إلى تحسين أداء الاستعلام وتقليل استهلاك الموارد وتحسين كفاءة النظام بشكل عام. النظر في الاستراتيجيات التالية:

  • بيانات ملف التعريف. افهم بياناتك وتأكد من أن نموذج البيانات الخاص بك مناسب تماما لحمل العمل الخاص بك. ضع في اعتبارك عوامل مثل تسوية البيانات واستراتيجيات الفهرسة وتقنيات التقسيم. لاسترداد البيانات بكفاءة، تأكد من تحديد أنواع البيانات المناسبة، وتحديد العلاقات بين الكيانات، وتحديد استراتيجية الفهرسة المثلى.

  • ضبط تكوين تخزين البيانات. قم بتكوين البنية الأساسية لتخزين البيانات لتتماشى مع متطلبات حمل العمل. حدد تقنية تخزين مناسبة، على سبيل المثال قواعد البيانات الارتباطية وقواعد بيانات NoSQL ومستودعات البيانات. تحسين إعدادات التخزين، مثل حجم المخزن المؤقت وآليات التخزين المؤقت والضغط.

  • تحسين أداء الاستعلام. تحليل وتحسين الاستعلامات التي تعمل في حمل العمل. استخدم تقنيات مثل تحسين الاستعلام والفهرسة والتخزين المؤقت. لتحديد الاختناقات، استخدم خطط الاستعلام وأدوات مراقبة الأداء، ثم قم بإجراء التحسينات اللازمة.

  • مراقبة النظام وضبطه بانتظام. مراقبة أداء حمل العمل باستمرار والتكرار على تكوين تخزين البيانات وتحسينات الاستعلام. استنادا إلى أفضل ممارسات ضبط الأداء، قم بتحليل مقاييس النظام، وتحديد مجالات التحسين، وتنفيذ التغييرات.

بيانات ملف التعريف

يتضمن جمع معلومات البيانات فحص البيانات من مصدر وجمع معلومات عنها. الهدف هو فهم جودة بيانات حمل العمل وبنيتها وخصائصها. تسمح هذه العملية بتحديد مشكلات مثل القيم المفقودة والتكرار والتنسيقات غير المتسقة وغيرها من الحالات الشاذة. للحصول على جمع معلومات فعال للبيانات، ضع في اعتبارك الاستراتيجيات التالية:

  • فهم بنية البيانات. افحص بنية بياناتك، بما في ذلك الجداول والأعمدة والعلاقات. حدد أنواع البيانات والأطوال والقيود التي يتم تطبيقها على كل عمود. يساعدك تقييم بنية البيانات على فهم كيفية تنظيم البيانات وكيفية ارتباطها بعناصر البيانات الأخرى.

  • تحليل حجم البيانات. قم بتقييم حجم بياناتك لفهم الحجم الإجمالي وأنماط النمو. حدد عدد السجلات أو المستندات وحجم الجداول أو المجموعات الفردية. تساعدك هذه المعلومات في تقدير متطلبات التخزين وتحديد مشكلات قابلية التوسع.

  • تحديد علاقات البيانات. استكشف العلاقات بين عناصر البيانات، مثل علاقات المفاتيح الأساسية والخارجية. فهم كيفية توصيل البيانات، حتى تتمكن من تحديد كيفية تأثير التغييرات في جدول أو مستند واحد على البيانات ذات الصلة.

  • تقييم جودة البيانات. قم بتقييم جودة بياناتك من خلال فحص عوامل مثل الاكتمال والدقة والاتساق والتفرد. تحديد الحالات الشاذة للبيانات أو القيم المفقودة أو السجلات المكررة التي قد تؤثر على تكامل البيانات وأداء الاستعلام. تساعدك هذه الخطوة على تحديد مجالات تنقية البيانات وتحسينها.

  • التقاط توزيع البيانات. تحليل توزيع القيم داخل كل عمود لتحديد أنماط البيانات. تحديد القيم المتكررة والنادرة والقيم الخارجية وانحرافات البيانات. لتحسين أداء الاستعلام، اختر استراتيجيات الفهرسة المناسبة وتقنيات تحسين الاستعلام استنادا إلى التوزيع.

مراقبة أداء البيانات

مراقبة أداء البيانات هي ممارسة تتبع كفاءة مخازن البيانات والأقسام والفهارس باستمرار في الوقت الفعلي. وهو يتضمن جمع وتحليل مقاييس الأداء الخاصة بعمليات البيانات، باستخدام أدوات مصممة خصيصا لحلول المراقبة على مستوى النظام أو الخاصة بقاعدة البيانات أو حلول المراقبة التابعة لجهة خارجية. تتيح لك مراقبة أداء البيانات الفعالة تحديد الاختناقات المحتملة والتخفيف من حدتها بشكل استباقي، ما يضمن كفاءة العمليات والمهام المتعلقة بالبيانات. لمراقبة أداء البيانات، ضع في اعتبارك الاستراتيجيات التالية:

  • جمع مقاييس خاصة بالبيانات. اجمع المقاييس الرئيسية التي تتعلق مباشرة بأداء البيانات. تتضمن هذه المقاييس أوقات استجابة الاستعلام، ومعدل نقل البيانات، ومدخلات/إخراج القرص المتعلقة بالوصول إلى البيانات، وأوقات تحميل أقسام بيانات معينة.

  • إعداد تنبيهات البيانات. إعداد التنبيهات خصيصا لمقاييس البيانات. استخدم الحدود المحددة مسبقا أو الحالات الشاذة في هذه المقاييس لتشغيل التنبيهات. تمكنك التنبيهات من تلقي إعلامات عندما تتجاوز مقاييس الأداء النطاقات المقبولة أو تظهر سلوكا غير طبيعي. على سبيل المثال، إذا استغرق استعلام قاعدة البيانات وقتا أطول من المتوقع أو إذا انخفض معدل نقل البيانات بشكل كبير، فإنه سيؤدي إلى تشغيل تنبيه. يمكنك إعداد هذه التنبيهات باستخدام أدوات المراقبة المتخصصة أو البرامج النصية المخصصة.

  • تشخيص مشكلات أداء البيانات. راجع مقاييس البيانات المجمعة بانتظام لتحديد الاختناقات المحتملة في الأداء أو التدهور في عمليات البيانات. يمكن أن تكون أدوات المرئيات أو لوحات المعلومات لا تقدر بثمن في هذه العملية، مما يساعد على تسليط الضوء على الاتجاهات والازدحامات والعناصر المتطرفة في أداء البيانات. بمجرد تحديدها، قم بالتعمق في الأسباب الجذرية لهذه المشكلات ووضع استراتيجيات لخطوات المعالجة المناسبة.

بيانات التقسيم

يتضمن التقسيم تقسيم مجموعات البيانات الكبيرة أو أحمال العمل ذات الحجم الكبير إلى مجموعات فرعية أصغر وقابلة للإدارة. يعزز التقسيم كفاءة أداء البيانات من خلال توزيع حمل العمل وتحسين المعالجة المتوازية. كما يضمن الوصول إلى البيانات بشكل أكثر فعالية استنادا إلى احتياجات محددة وأنماط استعلام. يمكنك تقسيم البيانات عموديا أو أفقيا (تسمى أيضا التقسيم).

الاستراتيجية التعريف مثال حالات الاستخدام
التقسيم العمودي قسم جدولا إلى جداول أصغر عن طريق تحديد أعمدة أو حقول معينة لكل قسم. يمثل كل قسم مجموعة فرعية من البيانات الكاملة. إذا كان لديك جدول يحتوي على أعمدة A وB وC وD، فيمكنك إنشاء جدول واحد بعمودين A وB والآخر بعمودين C وD. - يحتوي الجدول على العديد من الأعمدة، ولكن الاستعلامات لا تصل إلى جميع الأعمدة معا.
- بعض الأعمدة أكبر من غيرها ويمكن أن يؤدي فصلها إلى تعزيز أداء الإدخال/الإخراج.
- تحتوي أجزاء البيانات المختلفة على أنماط وصول متنوعة.
التقسيم الأفقي تقسيم البيانات استنادا إلى الصفوف أو نطاقات القيم (المعروفة أيضا باسم التقسيم). يحتوي كل قسم على مجموعة فرعية من الصفوف ذات الخصائص المماثلة. إذا كان لديك جدول يحتوي على صفوف من 1 إلى 1000، فقد تنشئ قسما بصفوف من 1 إلى 500 وقسم آخر بالصفوف من 501 إلى 1000. - مجموعة البيانات كبيرة جدا لموقع واحد أو خادم واحد.
- يتم الوصول إلى البيانات استنادا إلى نطاقات أو عوامل تصفية محددة.
- تحتاج إلى توزيع حمل العمل عبر العقد الفعلية أو الخوادم لتحسين الأداء.

لتقسيم بياناتك، ضع في اعتبارك الخطوات التالية:

  • تحليل البيانات والاستعلامات. تحليل أنماط البيانات والاستعلام لتحديد استراتيجيات التقسيم أو التقسيم المناسبة. فهم طبيعة البيانات وأنماط الوصول ومتطلبات التوزيع.

  • تحديد مفتاح. اختر مفتاح تقسيم أو تقسيم لتوزيع البيانات عبر الأقسام أو الأجزاء. حدد المفتاح بعناية استنادا إلى خصائص البيانات ومتطلبات الاستعلام.

  • تحديد المنطق. حدد منطق التقسيم أو التقسيم استنادا إلى المفتاح المختار. ضع في اعتبارك تقسيم البيانات إلى نطاقات، أو تطبيق خوارزميات التجزئة، أو استخدام تقنيات التقسيم الأخرى.

  • تكوين البنية الأساسية. تكوين نظام قاعدة البيانات لدعم التقسيم أو التقسيم. ضع في اعتبارك إنشاء البنية الأساسية الضرورية، وتحديد الأقسام أو الأجزاء، وتكوين توزيع البيانات.

لمزيد من المعلومات، راجع إرشادات تقسيم البيانات.

تحسين استعلامات قاعدة البيانات

يعمل تحسين استعلامات قاعدة البيانات على تحسين الاستعلامات باستخدام تقنيات مثل تلميحات الفهرس والتخزين المؤقت. تزيد هذه التعديلات من كفاءة وسرعة استرداد البيانات. ونتيجة لذلك، تحتوي قاعدة البيانات على حمل عمل أخف، وتعمل الموارد بشكل أكثر فعالية، ويتمتع المستخدمون بتفاعلات أكثر سلاسة. لتحسين استعلامات قاعدة البيانات، ضع في اعتبارك الاستراتيجيات التالية:

  • إعادة كتابة الاستعلامات. مراجعة الاستعلامات المعقدة وتحليلها لتحديد فرص إعادة كتابتها. ضع في اعتبارك إعادة هيكلة منطق الاستعلام، أو القضاء على العمليات المكررة، أو تبسيط بناء جملة الاستعلام.

  • تجنب مشكلة الاستعلام N+1. تقليل عدد الجولات إلى قاعدة البيانات باستخدام الصلات وجلب الدفعات لاسترداد البيانات ذات الصلة بكفاءة.

  • إعادة ترتيب الصلات. قم بتقييم خطة الاستعلام وفكر في إعادة ترتيب الصلة لتقليل عدد الصفوف في كل عملية ربط. يمكن أن يؤثر الترتيب الذي تنضم به إلى الجداول على أداء الاستعلام.

  • استخدم تلميحات الفهرس. استخدم تلميحات الفهرس حتى يتمكن محرك قاعدة البيانات من تحديد استخدام الفهارس عند تشغيل استعلام. توجه تلميحات الفهرس المحسن لتحديد الفهارس الأكثر ملاءمة.

  • استعلامات ذاكرة التخزين المؤقت. تخزين نتائج الاستعلامات التي يتم تشغيلها بشكل متكرر في الذاكرة. يلغي التخزين المؤقت للاستعلام الحاجة إلى تشغيل نفس الاستعلام بشكل متكرر، ويقلل من حمل معالجة الاستعلام.

  • تحسين التأمين. تجنب تلميحات التأمين غير الضرورية أو التقييدية في الاستعلامات. يمكن لاستراتيجيات التأمين الفعالة تحسين أداء الاستعلام والتزامن. تطبيق آليات التأمين المحسنة التي يوفرها نظام قاعدة البيانات. تحليل مستويات العزل وضبطها لموازنة تناسق البيانات وأداء الاستعلام.

  • المراقبة والضبط. مراقبة مقاييس أداء الاستعلام، مثل وقت التشغيل واستخدام الموارد ومعدل نقل الاستعلام. استخدم أدوات جمع معلومات قاعدة البيانات ووظائف المراقبة لتحديد الاستعلامات ضعيفة الأداء. تقييم خطط الاستعلام وضبطها استنادا إلى بيانات الأداء المجمعة. تحليل خطط الاستعلام وإحصائيات الانتظار لتحديد الاختناقات. استخدم هذه المعلومات لتحسين أداء الاستعلام.

تحسين أداء الفهرس

تعزز الفهارس سرعة استرداد البيانات من خلال السماح لقواعد البيانات بالعثور بسرعة على البيانات باستخدام أعمدة أو حقول معينة. عند تحسين هذه الفهارس، تصبح عمليات الفرز والانضمام أكثر كفاءة، مما يؤدي إلى استعلامات أسرع. تقوم الفهارس المحسنة بشكل جيد بتقليص عمليات إدخال/إخراج القرص المطلوبة للاستعلامات. تؤدي إزالة الفهارس غير الضرورية أو المكررة أيضا إلى تحرير مساحة تخزين قيمة. لتحسين أداء الفهرس، ضع في اعتبارك الاستراتيجيات التالية:

  • تحليل أنماط الاستعلام. فهم أنماط الاستعلام التي تعمل على قاعدة البيانات الخاصة بك. حدد الاستعلامات التي يتم تشغيلها بشكل متكرر وقد تؤدي إلى تدهور الأداء. تحليل أنماط الاستعلام لتحديد الفهارس المفيدة لتحسين الأداء.

  • تقييم الفهارس الموجودة. راجع الفهارس الموجودة في قاعدة البيانات الخاصة بك. تقييم استخدامها وتأثيرات الأداء وملاءمتها لأنماط الاستعلام. حدد الفهارس المكررة أو غير المستخدمة التي يمكنك إزالتها لتحسين أداء الكتابة وتقليل حمل التخزين.

  • تحديد الأعمدة للفهرسة. حدد الأعمدة التي يتم استخدامها بشكل متكرر في المكانوالانضماموالنظام حسب عبارات استعلاماتك. هذه الأعمدة هي مرشحات محتملة للفهرسة لأنها يمكن أن تمكن استرداد البيانات بسرعة.

  • اختر نوع فهرس مناسب. حدد نوع فهرس مناسب استنادا إلى نظام قاعدة البيانات الخاص بك. تتضمن الخيارات الشائعة فهارس b-tree للاستعلامات المتعلقة بالمساواة والنطاق، وفهرس التجزئة للاستعلامات المتطابقة الدقيقة، وفهرس النص الكامل لعمليات البحث عن النص. اختر نوع فهرس يطابق متطلبات الاستعلام على أفضل نحو.

  • ضع في اعتبارك ترتيب عمود الفهرس. عند إنشاء فهارس مركبة أو فهارس ذات أعمدة متعددة، ضع في اعتبارك ترتيب الأعمدة. ضع الأعمدة الأكثر استخداما في الاستعلامات في بداية الفهرس. يساعد ترتيب الأعمدة على التأكد من أن حمل العمل الخاص بك يستخدم الفهارس بشكل فعال لمجموعة واسعة من الاستعلامات.

  • موازنة حجم الفهرس. تجنب إنشاء فهارس على الأعمدة ذات العلاقة الأساسية المنخفضة، أو الأعمدة التي تحتوي على عدد منخفض من القيم المميزة. يمكن أن تكون هذه الفهارس غير فعالة وتزيد من حجم قاعدة البيانات الخاصة بك. بدلا من ذلك، قم بفهرسة الأعمدة ذات الانتقائية العالية.

  • الحفاظ على استخدام الفهرس. مراقبة استخدام الفهارس وأدائها باستمرار. ابحث عن فرص لإنشاء فهارس جديدة أو تعديل الفهارس الموجودة استنادا إلى التغييرات في أنماط الاستعلام أو متطلبات الأداء. إزالة الفهارس التي لم تعد مفيدة أو تحديثها. الفهارس لها حمل صيانة. مع تغير البيانات، يمكن أن تجزأ الفهارس الأداء وتؤثر عليه. تنفيذ مهام صيانة الفهرس بانتظام، مثل إعادة إنشاء الفهارس أو إعادة تنظيمها، لضمان الأداء الأمثل.

  • الاختبار والتحقق من الصحة. قبل مراجعة الفهارس في بيئة إنتاج، قم بإجراء اختبار شامل والتحقق من الصحة. قياس تأثير أداء مراجعات الفهرس باستخدام أحمال العمل التمثيلية. تحقق من التحسينات مقابل المعايير المحددة مسبقا.

المفاضلة: قد يكون للفهارس B-tree حمل تخزين عال، وقد تكون الاستعلامات المتطابقة الدقيقة بطيئة. فهارس التجزئة غير مناسبة للاستعلامات عن النطاق أو عوامل المقارنة. قد تحتوي فهارس النص الكامل على متطلبات تخزين عالية، وقد تكون استعلامات البيانات غير النصية بطيئة.

ضع في اعتبارك ضغط البيانات

ضغط البيانات هو عملية تقليل حجم البيانات لتحسين مساحة التخزين وتحسين كفاءة أداء حمل العمل. تتطلب البيانات المضغوطة مساحة تخزين أقل وعرض نطاق ترددي أقل للإرسال، ما يؤدي إلى نقل سريع للبيانات. يمكنك ضغط البيانات لتقليل بصمة التخزين وتحسين أوقات الوصول إلى البيانات. عند ضغط البيانات، فإنه يقلل من عمليات الإدخال/إخراج ومتطلبات النطاق الترددي للشبكة.

الضغط بدون فقدان وضغط الخسارة هما خوارزميات ضغط البيانات. تعمل خوارزميات الضغط بدون فقدان على تقليل حجم البيانات دون فقدان أي معلومات. تحقق خوارزميات الضغط الفاقد نسب ضغط عالية عن طريق إزالة معلومات أقل أهمية أو زائدة عن الحاجة.

المفاضلة: لضغط البيانات وفك ضغطها، تحتاج إلى موارد حسابية، مثل وحدة المعالجة المركزية والذاكرة. كلما زادت البيانات التي تقوم بضغطها، زادت الموارد التي تحتاجها.

أرشفة البيانات ومسحها

الأرشفة والإزالة هي استراتيجيات تبسط تخزين البيانات. تقوم الأرشفة بنقل البيانات القديمة والأقل تكرارا إلى تخزين أكثر فعالية من حيث التكلفة. إزالة البيانات يزيل البيانات المكررة بشكل دائم. وهي تساهم في كفاءة الأداء من خلال تقليل حجم البيانات، وزيادة سرعة الوصول إلى البيانات، وتقليل أوقات النسخ الاحتياطي والاسترداد:

  • تقليل حجم البيانات: تعني البيانات الأقل أوقات معالجة أسرع، ما يضمن استجابات سريعة لطلبات المستخدم.

  • زيادة سرعة الوصول إلى البيانات: تسمح مجموعة البيانات المقتطعة بالاستعلامات السريعة واسترداد البيانات، وتحسين استجابة النظام.

  • تقليل أوقات النسخ الاحتياطي والاسترداد: تعجل مجموعات البيانات الأصغر عمليات النسخ الاحتياطي والاستعادة، ما يقلل من وقت التعطل ويضمن أداء متسقا.

تعد الأرشفة والإزالة مفيدة في الحفاظ على ذروة كفاءة الأداء في الأنظمة المستندة إلى البيانات.

تحسين تحميل التخزين

تحسين تحميل التخزين يعني تبسيط الطلبات إلى نظام التخزين. يساعد على التخلص من الطلبات غير الضرورية. كما أنه يعزز استرداد البيانات ويمنع غمر التخزين. يضمن تحسين تحميل التخزين أن يظل نظام التخزين مستجيبا للطلبات المشروعة ويحافظ على ذروة الأداء. تنفيذ استراتيجيات لتقليل عبء المعالجة على مخزن البيانات. لتحسين تحميل مخزن البيانات، ضع في اعتبارك الاستراتيجيات التالية:

استخدام التخزين المؤقت

يخزن التخزين المؤقت البيانات التي يتم الوصول إليها بشكل شائع في منطقة تخزين الوصول السريع، ما يجعل استرداد البيانات أسرع من سحبها من المصدر الرئيسي. تعزز هذه التقنية أداء البيانات من خلال تقليل أوقات الوصول وتجنب جلب البيانات المتكررة. يعمل التخزين المؤقت على تحسين سرعات القراءة وأوقات استجابة المستخدم، خاصة بالنسبة للبيانات التي يتم الوصول إليها بشكل متكرر هذا الأسلوب هو الأكثر فعالية على البيانات الثابتة أو البيانات التي نادرا ما تتغير.

لضمان كفاءة التخزين المؤقت المثلى، ضع في اعتبارك عوامل مثل نهج انتهاء الصلاحية واستراتيجيات الإخلاء وإدارة حجم ذاكرة التخزين المؤقت. اضبط الإعدادات، مثل وقت البقاء (TTL)، للحصول على الأداء الأمثل. لاستخدام ذاكرة التخزين المؤقت لتحسين تحميل التخزين، ضع في اعتبارك الاستراتيجيات التالية:

  • التخزين المؤقت في الذاكرة: قم بإجراء التخزين المؤقت في الذاكرة لتخزين البيانات التي يتم الوصول إليها بشكل متكرر في الذاكرة للاسترداد السريع. يمكنك استخدام هذه التقنية لبيانات التطبيق المكلفة لحسابها أو استردادها من قاعدة بيانات. يعد التخزين المؤقت في الذاكرة مفيدا للبيانات التي تقرأها بشكل متكرر ولكن لا تتغير بشكل متكرر.

  • التخزين المؤقت لاستعلام قاعدة البيانات: استخدم هذه التقنية لتخزين نتائج استعلامات قاعدة البيانات مؤقتا لتجنب تشغيل نفس الاستعلام عدة مرات. يعد التخزين المؤقت لاستعلام قاعدة البيانات مفيدا لاستعلامات قاعدة البيانات المعقدة والمستهلكة للوقت. عند تخزين نتائج استعلام مؤقتا، يتم إرجاع الطلبات اللاحقة لنفس الاستعلام بسرعة.

  • التخزين المؤقت لشبكة تسليم المحتوى: استخدم هذه التقنية لتخزين محتوى الويب مؤقتا على خوادم الشبكة الموزعة لتقليل زمن الانتقال وتحسين تسليم المحتوى. يعد التخزين المؤقت لشبكة تسليم المحتوى فعالا للمحتوى الثابت، مثل الصور وملفات CSS وملفات JavaScript. تخزن شبكات تسليم المحتوى نسخا من المحتوى في مواقع متعددة في جميع أنحاء العالم، حتى يتمكن المستخدمون من الوصول إلى المحتوى من خادم قريب منهم جغرافيا.

استخدام النسخ المتماثلة للقراءة

تدعم العديد من قواعد البيانات النسخ المتماثلة للقراءة المتعددة. توزيع استعلامات القراءة عبر النسخ المتماثلة لتقليل الطلب على قاعدة بيانات الكتابة. يمكن أن تخدم كل نسخة متماثلة للقراءة مجموعة فرعية من نسبة استخدام الشبكة، والتي يمكن أن تحسن الأداء.

عندما يكون لديك حمل عمل مع نسخ متماثلة متعددة للبيانات تتوقع أن تظل متزامنة، فمن المفيد نمذجة هذا النظام الموزع باستخدام نظرية PACELC. تساعدك نظرية PACELC على فهم خيارات مقايضة زمن الانتقال مقابل التزامن في حالة النظام غير المقسمة. استخدم هذه المعلومات لمساعدتك في اختيار محرك قاعدة بيانات واستراتيجية مزامنة البيانات التي تعالج النظام بشكل أفضل في حالة مقسمة وغير مقسمة. لمزيد من المعلومات، راجع نمط الفصل بين مسؤولية الأوامر والاستعلام (CQRS).

تحسين تناسق البيانات

في حمل العمل الموزع، حيث توجد البيانات عبر عقد أو مواقع متعددة، يحدد مستوى التناسق الذي تحدده مدى سرعة انعكاس التغييرات في موقع واحد في مواقع أخرى. يؤدي اختيار التناسق الأكثر صرامة إلى استهلاك المزيد من موارد الحوسبة ويمكن أن يؤثر سلبا على كفاءة الأداء. من ناحية أخرى، فإن مستوى التناسق الأقل صرامة، مثل التناسق النهائي يقدم تناقضات مؤقتة بين العقد ولكن يمكن أن يعزز كفاءة الأداء.

يحقق التناسق النهائي توازنا بين دقة البيانات وأداء حمل العمل. تنتشر التغييرات تدريجيا بدلا من الفور، ما يعزز استجابة حمل العمل وسرعة معالجة البيانات. على الرغم من أنه يقدم تناقضات قصيرة الأجل، إلا أن حمل العمل يقدم في نهاية المطاف بيانات متسقة عبر جميع العقد. يمكن أن يؤدي اختيار التناسق النهائي إلى رفع مستوى أداء حمل العمل وزيادة تعزيز توفره وقابليته للتوسع.

تحسين تحديثات البيانات

يمكنك استخدام التزامن المتفائل للتعامل مع التحديثات المتزامنة لنفس البيانات. بدلا من تأمين البيانات ومنع التحديثات الأخرى، يسمح التزامن المتفائل لعدة مستخدمين أو عمليات بالعمل بشكل متزامن ويفترض أن التعارضات نادرة.

مع التزامن المتفائل، تتضمن كل عملية تحديث إصدارا أو طابعا زمنيا يمثل حالة البيانات في وقت التحديث. عند الكشف عن تحديث متعارض، يحل النظام التعارض عن طريق رفض التحديث أو دمج التغييرات.

يقلل التزامن المتفائل من المنافسة ويسمح بمتابعة التحديثات المتزامنة دون تأمين غير ضروري. فهو يقلل من وقت الانتظار للموارد ويوفر معدل نقل عاليا.

تحسين حركة البيانات ومعالجتها

يتضمن تحسين حركة البيانات ومعالجتها تحسين كفاءة وأداء العمليات المتعلقة باستخراج البيانات وتحويلها وتحميلها ومعالجتها. ضع في اعتبارك الجوانب الرئيسية التالية لتحسين حركة البيانات ومعالجتها:

  • تحسين الاستخراج والتحويل والتحميل (ETL): تحسين عمليات ETL لتقليل وقت المعالجة. يمكنك تبسيط عملية الاستخراج، وتنفيذ خوارزميات التحويل الفعالة، وتحسين عملية التحميل. عند جعل كل خطوة فعالة، يمكنك تحسين سير العمل العام.

  • المعالجة المتوازية: استخدم تقنيات المعالجة المتوازية لتحسين الأداء. عند توزيع مهام معالجة البيانات عبر مؤشرات ترابط أو عقد متعددة، يمكنك تقسيم حمل العمل ومعالجته بشكل متزامن، ما يؤدي إلى معالجة سريعة.

  • معالجة الدفعات: قم بتجميع مهام مماثلة معا لتقليل النفقات العامة الناتجة عن العمليات المتكررة. معالجة مهام متعددة في دفعة لتقليل وقت المعالجة الإجمالي.

تحسين تصميم التخزين

يتطلب تحسين تصميم التخزين صياغة بنية تخزين بيانات دقيقة وتحديد تقنيات التخزين المناسبة. يعزز تصميم التخزين المبسط الوصول إلى البيانات واستردادها ومعالجتها. من خلال تصميم التخزين الاستراتيجي، يحقق حمل العمل أوقات استجابة محسنة ووظائف عامة.

تصميم لتقارب البيانات

يشير تقارب البيانات إلى الوضع الاستراتيجي للبيانات الأقرب إلى المستخدمين أو الخدمات التي تصل إليها بشكل متكرر. من خلال تقليل المسافة الفعلية أو المنطقية بين البيانات ومستخدميها، يضمن تقارب البيانات وصولا أسرع إلى البيانات وتحسين الاستجابة. لتحسين التصميم للتقارب الوثيق، ضع في اعتبارك هذه الاستراتيجيات:

  • تقييم أنماط الوصول إلى البيانات: تقييم أنماط الوصول إلى حمل العمل والبيانات التي يتم الوصول إليها بشكل متكرر. يمكن أن يساعد هذا التحليل في تحديد مكان وضع البيانات لتحقيق أقصى فائدة.

  • اختر الحلول التي تدعم نقل البيانات: ضع في اعتبارك الحلول التي توفر نقل البيانات الديناميكي استنادا إلى أنماط الوصول المتغيرة، وضمان تحديد موضع البيانات الأمثل.

  • اختر الحلول التي تدعم مزامنة البيانات: إذا كانت تلبي احتياجات قاعدة مستخدمين موزعة، فاختر الحلول التي تسهل مزامنة البيانات عبر مناطق مختلفة، ما يضمن توفر النسخ المتماثلة للبيانات على مقربة من المستخدمين.

المفاضلة: إذا كانت البيانات الأساسية تتغير بشكل متكرر، فنفذ آلية إبطال ذاكرة التخزين المؤقت للتأكد من بقاء البيانات المخزنة مؤقتا محدثة.

استخدام المثابرة متعددة اللغات

المثابرة المتعددة هي ممارسة استخدام تقنيات تخزين بيانات متعددة لتخزين وإدارة أنواع مختلفة من البيانات داخل تطبيق أو نظام. تخدم أنواع مختلفة من قواعد البيانات أو حلول التخزين متطلبات بيانات مختلفة.

تستفيد الثبات متعدد اللغات من فوائد كل تقنية تخزين بيانات لضمان الأداء الأمثل وقابلية التوسع لكل نوع من البيانات. على سبيل المثال، قد تستخدم قاعدة بيانات ارتباطية لتخزين بيانات المعاملات المنظمة. وقد تستخدم قاعدة بيانات NoSQL لتخزين البيانات غير المنظمة أو شبه المنظمة.

تصميم مخطط لكل تقنية تخزين بيانات استنادا إلى متطلبات البيانات. بالنسبة لقواعد البيانات الارتباطية، يمكنك إنشاء جداول تمت تسويتها بعلاقات مناسبة. بالنسبة لقواعد بيانات NoSQL، يمكنك تعريف بنيات المستندات أو أزواج قيم المفاتيح. تطوير المكونات الضرورية للتفاعل مع كل تقنية تخزين بيانات، مثل واجهات برمجة التطبيقات أو طبقات الوصول إلى البيانات أو مسارات تكامل البيانات. تأكد من أن التطبيق يمكنه قراءة البيانات وكتابتها إلى مخازن البيانات المناسبة.

المفاضلة: يمكن لبنية البيانات التي تحتوي على تسوية منخفضة أن تحسن الأداء ولكنها تقدم تعقيدات.

أنظمة OLTP و OLAP منفصلة

لفصل أنظمة OLTP و OLAP ، قم بتصميم وتوزيع أنظمة مميزة لمهام معالجة المعاملات والمعالجة التحليلية. يسمح لك هذا الفصل بتحسين كل نظام لحمل العمل المحدد وخصائصه.

تستخدم أنظمة OLTP لمعالجة المعاملات في الوقت الحقيقي. وهي تتعامل بكفاءة وموثوقية مع المعاملات الفردية. تستخدم أنظمة OLTP عادة لتنفيذ المهام التشغيلية اليومية، مثل معالجة الطلبات عبر الإنترنت وإدارة المخزون وإدارة بيانات العملاء. تعطي أنظمة OLTP الأولوية للاستجابة والاتساق والتزامن.

تستخدم أنظمة OLAP للمعالجة التحليلية المعقدة وإعداد التقارير. يعالجون كميات كبيرة من البيانات ويجرون عمليات حسابية وتجميعات مكثفة. تستخدم أنظمة OLAP لمهام مثل المعلومات المهنية واستخراج البيانات ودعم القرار. تعطي أنظمة OLAP الأولوية لأداء الاستعلام وتجميع البيانات والتحليل متعدد الأبعاد.

عند فصل أنظمة OLTP و OLAP، يمكنك تخصيص الموارد المناسبة وتحسين كل نظام لحمل العمل المحدد الخاص به. يسمح لك الفصل بتطبيق تقنيات مختلفة لنمذجة البيانات على كل نظام. تستخدم أنظمة OLTP عادة مخططات تمت تسويتها لمعالجة المعاملات بكفاءة. قد تستخدم أنظمة OLAP مخططات غير متزامنة أو تقنيات تخزين البيانات لتحسين أداء الاستعلام.

تسهيل Azure

بيانات جمع المعلومات: يوفر Azure أدوات وخدمات يمكنك استخدامها لملف تعريف البيانات، مثل Azure كتالوج البياناتوAzure PurviewوAzure Synapse Analytics. تمكنك هذه الأدوات من استخراج البيانات وتحويلها وتحميلها من مصادر مختلفة، وإجراء فحوصات جودة البيانات، والحصول على رؤى حول البيانات.

مراقبة أداء البيانات: لمراقبة أداء البيانات، يمكنك استخدام Azure Monitor لجمع وتحليل مقاييس البنية الأساسية والسجلات وبيانات التطبيق. يمكنك دمج Monitor مع خدمات أخرى مثل Application Insights. يوفر Application Insights مراقبة أداء التطبيق ويدعم العديد من الأنظمة الأساسية.

يجمع Application Insights بيانات الاستخدام والأداء. يمكنك استخدام Log Analytics لربط تلك البيانات ببيانات التكوين والأداء عبر موارد Azure.

يمكنك استخدام ميزة نتائج التحليلات في Azure SQLوAzure Cosmos DB لمراقبة قاعدة البيانات الخاصة بك. تمكنك هذه الميزة من تشخيص مشكلات أداء قاعدة البيانات وضبطها.

تقسيم البيانات: يقدم Azure استراتيجيات تقسيم مختلفة لمخازن البيانات المختلفة. قد يكون لكل مخزن بيانات اعتبارات وخيارات تكوين مختلفة لتقسيم البيانات. لمزيد من المعلومات، راجع استراتيجيات تقسيم البيانات.

تحسين استعلامات قاعدة البيانات وأداء الفهرس: استخدم ميزة نتيجة تحليلات أداء الاستعلام لقاعدة بيانات Azure SQL لتحسين الاستعلامات والجداول وقواعد البيانات. يمكنك استخدام هذه الميزة لتحديد مشكلات أداء الاستعلام واستكشافها وإصلاحها.

بالنسبة لقواعد البيانات الارتباطية، يجب اتباع إرشادات تصميم الفهرسوإرشادات فهرس SQL Serverوإرشادات فهرس Azure Cosmos DB. استخدم قاعدة بيانات SQL لإجراء الضبط التلقائي للاستعلامات لتحسين أدائها.

في قواعد بيانات SQL، يجب إعادة تنظيم الفهارس أو إعادة إنشائها بانتظام. حدد الاستعلامات البطيئة وضبطها لتحسين الأداء. تحتوي العديد من محركات قاعدة البيانات على ميزات ضبط الاستعلام. لمزيد من المعلومات، راجع أفضل الممارسات لأداء الاستعلام.

يحتوي Azure Cosmos DB على نهج فهرسة افتراضي يقوم بفهرسة كل خاصية لكل عنصر وفرض فهارس النطاق لأي سلسلة أو رقم. يوفر لك هذا النهج أداء استعلام فعالا، وليس عليك إدارة الفهارس مقدما.

تحسين تحميل التخزين: تدعم العديد من خدمات قاعدة بيانات Azure النسخ المتماثلة للقراءة. يختلف توفر النسخ المتماثلة للقراءة وتكوينها اعتمادا على خدمة قاعدة بيانات Azure. راجع الوثائق الرسمية لكل خدمة لفهم التفاصيل والخيارات.

تحسين تصميم التخزين: يوفر Azure العديد من مخازن البيانات المختلفة لتناسب احتياجات حمل العمل. فهم أنواع مخزن البياناتوتحديد مخزن بيانات Azure للتطبيق الخاص بك.

قائمة مراجعة كفاءة الأداء

راجع المجموعة الكاملة من التوصيات.