معيار DTU

مقالة
01/28/2024

ينطبق على: قاعدة بيانات Azure SQL

تمثل وحدة عمليات قاعدة البيانات (DTU) مقياسًا مختلطًا لـ CPU والذاكرة والقراءة والكتابة. تتم معايرة الخصائص الفيزيائية (CPU والذاكرة والإدخال/الإخراج) المرتبطة بكل مقياس DTU باستخدام معيار يحاكي حمل عمل قاعدة البيانات في العالم الحقيقي. تلخص هذه المقالة معيار DTU وتشارك معلومات حول المخطط وأنواع العمليات المستخدمة ومزيج حمل العمل والمستخدمين والسرعة وقواعد تغيير السعة والمقاييس المرتبطة بالمعيار.

للحصول على معلومات عامة حول نموذج الشراء المستند إلى DTU، راجع نظرة عامة على نموذج الشراء المستند إلى DTU.

ملخص المعيار

يقيس معيار DTU أداء مزيج من عمليات قاعدة البيانات الأساسية التي تحدث بشكل متكرر في أحمال عمل معالجة العمليات عبر الإنترنت (OLTP). على الرغم من أن المعيار مصمم مع وضع الحوسبة السحابية في الاعتبار، فقد تم تصميم مخطط قاعدة البيانات ومحتوى البيانات والمعاملات لتكون ممثلة بشكل عام للعناصر الأساسية الأكثر استخداماً في أعباء عمل OLTP.

ربط النتائج المرجعية بأداء قاعدة بيانات العالم الحقيقي

ومن المهم أن نفهم أن جميع المعايير هي معايير تمثيلية ودلالية فقط. ولن تكون معدلات المعاملات التي تحققت مع تطبيق المعيار هي نفسها التي يمكن تحقيقها مع التطبيقات الأخرى. يتألف المعيار من مجموعة من أنواع المعاملات المختلفة التي تعمل مقابل مخطط يحتوي على مجموعة من الجداول وأنواع البيانات. بينما المعيار يمارس نفس العمليات الأساسية الشائعة في جميع أحمال عمل OLTP، فإنه لا يمثل أي فئة معينة من قاعدة البيانات أو التطبيق. والهدف من المعيار هو توفير دليل معقول للأداء النسبي لقاعدة بيانات يمكن توقعه عند التوسع صعودا أو أسفل بين أحجام الحوسبة.

في الواقع، قواعد البيانات ذات أحجام مختلفة وتعقيد، تواجه مزيجا مختلفا من أعباء العمل، وسوف تستجيب بطرق مختلفة. على سبيل المثال، قد تصل تطبيق IO-مكثفة عتبات IO عاجلا أو قد تصل إلى تطبيق CPU-مكثفة حدود CPU عاجلا. ليس هناك ما يضمن أن أي قاعدة بيانات معينة سوف تتدرج بنفس الطريقة التي يتم بها قياس المؤشر تحت العبء المتزايد.

تم وصف المعيار ومنهجيته بمزيد من التفصيل في هذه المقالة.

المخطط

تم تصميم المخطط ليكون متنوعاً بما فيه الكفاية وتعقيد لدعم مجموعة واسعة من العمليات. ويتعارض المعيار مع قاعدة بيانات تتألف من ستة جداول. تنقسم الجداول إلى ثلاث فئات: الحجم الثابت، والتحجيم، والزيادة. هناك جدولان بحجم ثابت؛ وثلاثة جداول تحجيم؛ وطاولة واحدة متزايدة. تحتوي الجداول ذات الحجم الثابت على عدد ثابت من الصفوف. تحتوي جداول القياس على عنصر أساسي يتناسب مع أداء قاعدة البيانات، لكنه لا يتغير أثناء قياس الأداء. يُقاس حجم الجدول المتزايد مثل جدول تحجيم على التحميل الأولي، ولكن بعد ذلك تتغير العلاقة الأساسية في مسار تشغيل المعيار حيث يتم إدراج الصفوف وحذفها.

يتضمن المخطط مزيجاً من أنواع البيانات، بما في ذلك العدد الصحيح والرقمي والحرف والتاريخ/الوقت. يتضمن المخطط مفاتيح أساسية وثانوية، ولكن ليس أي مفاتيح خارجية - أي أنه لا توجد قيود تكامل مرجعية بين الجداول.

يقوم برنامج إنشاء بيانات بإنشاء البيانات لقاعدة البيانات الأولية. يتم إنشاء عدد صحيح والبيانات الرقمية مع إستراتيجيات مختلفة. في بعض الحالات، يتم توزيع القيم بشكل عشوائي عبر نطاق. في حالات أخرى، يتم تبديل مجموعة من القيم بشكل عشوائي لضمان الحفاظ على توزيع معين. يتم إنشاء حقول النص من قائمة مرجحة من الكلمات لإنتاج بيانات واقعية المظهر.

يتم تحديد حجم قاعدة البيانات بناءً على "عامل القياس". يحدد عامل المقياس (مختصرا باسم SF) أهمية جداول التحجيم والنمو. كما هو موضح أدناه في المقطع المستخدمين وسرعة، وحجم قاعدة البيانات، وعدد المستخدمين، والأداء الأقصى كل مقياس بما يتناسب مع بعضها البعض.

المعاملات

يتكون عبء العمل من تسعة أنواع من الحركات، كما هو موضح في الجدول أدناه. تم تصميم كل معاملة لتسليط الضوء على مجموعة معينة من خصائص النظام في مشغل قاعدة البيانات وأجهزة النظام، مع تباين عال من المعاملات الأخرى. وهذا النهج يسهل تقييم أثر المكونات المختلفة على الأداء العام. على سبيل المثال، تنتج عملية "Read Heavy" عدداً كبيراً من عمليات القراءة من القرص.

نوع المعاملة	الوصف
قراءة لايت	حدد; في الذاكرة; للقراءة فقط
قراءة متوسطة	حدد; في معظمها في الذاكرة; للقراءة فقط
قراءة ثقيلة	حدد; في الغالب ليس في الذاكرة. للقراءة فقط
تحديث لايت	تحديث؛ في الذاكرة; قراءة-كتابة
تحديث ثقيل	تحديث؛ في الغالب ليس في الذاكرة. قراءة-كتابة
إدراج لايت	إدخال؛ في الذاكرة؛ قراءة-كتابة
إدراج ثقيل	إدخال؛ في الغالب ليس في الذاكرة؛ قراءة-كتابة
حذف	حذف؛ مزيج من الذاكرة وليس في الذاكرة؛ قراءة-كتابة
وحدة المعالجة المركزية الثقيلة	حدد; في الذاكرة; تحميل CPU ثقيل نسبيا; للقراءة فقط

اسم حِمل العمل

يتم تحديد المعاملات عشوائياً من توزيع مرجح مع المزيج الكلي التالي. المزيج الكلي لديه نسبة القراءة والكتابة من حوالي 2:1.

نوع المعاملة	٪ من المزيج
قراءة لايت	35
قراءة متوسطة	20
قراءة ثقيلة	5
تحديث لايت	20
تحديث ثقيل	3
إدراج لايت	3
إدراج ثقيل	2
حذف	2
وحدة المعالجة المركزية الثقيلة	10

المستخدمون والسرعة

يتم دفع حمل العمل القياسي من أداة تقوم بإرسال المعاملات عبر مجموعة من الاتصالات لمحاكاة سلوك عدد من المستخدمين المتزامنين. على الرغم من أن جميع الاتصالات والعمليات يتم إنشاؤها آلياً، فإننا نشير إلى هذه الاتصالات على أنها "مستخدمون" من أجل التبسيط. على الرغم من أن كل مستخدم يعمل بشكل مستقل عن جميع المستخدمين الآخرين، إلا إن جميع المستخدمين يقومون بنفس دورة الخطوات الموضحة أدناه:

إنشاء اتصال قاعدة بيانات.
كرر حتى الإشارة إلى الخروج:
- حدد حركة عشوائياً (من توزيع مرجح).
- قم بتنفيذ الحركة المحددة وقم بقياس وقت الاستجابة.
- انتظر تأخير سرعة.
إغلاق اتصال قاعدة البيانات.
خروج.

يتم تحديد تأخير سرعة (في الخطوة 2c) عشوائياً، ولكن مع توزيع له متوسط 1.0 ثانية. وهكذا يمكن لكل مستخدم، في المتوسط، توليد معاملة واحدة على الأكثر في الثانية الواحدة.

تعيين قواعد التحجيم

يتم تحديد عدد المستخدمين حسب حجم قاعدة البيانات (في وحدات عامل الحجم). هناك مستخدم واحد لكل خمس وحدات عامل الحجم. وبسبب تأخير سرعة، يمكن لمستخدم واحد إنشاء معاملة واحدة على الأكثر في الثانية، في المتوسط.

على سبيل المثال، عامل مقياس قاعدة بيانات 500 (SF = 500) سيكون 100 من المستخدمين ويمكن تحقيق معدل أقصى من 100 TPS. محرك أعلى معدل TPS يتطلب المزيد من المستخدمين وقاعدة بيانات أكبر.

مدة القياس

يتطلب تشغيل معيار صالح مدة قياس ثابتة لمدة ساعة واحدة على الأقل.

المقاييس

المقاييس الرئيسية في المعيار هي معدل النقل ووقت الاستجابة.

معدل النقل هي مقياس الأداء الأساسي في المعيار. يتم الإبلاغ عن معدل النقل في الحركات لكل وحدة من الوقت، مع احتساب جميع أنواع الحركات.
وقت الاستجابة هو مقياس لقابلية التنبؤ بالأداء. ويختلف قيد وقت الاستجابة باختلاف فئة الخدمة، حيث تكون لفئات الخدمة الأعلى متطلبات أكثر صرامة وقت الاستجابة، كما هو مبين أدناه.

فئة الخدمة	قياس معدل النقل	متطلبات وقت الاستجابة
مميزة	المعاملات في الثانية	القيمة المئوية الـ95 عند 0.5 ثانية
قياسي	المعاملات في الدقيقة	القيمة المئوية الـ 90 عند 1.0 ثانية
أساسي	المعاملات في الساعة	القيمة المئوية الـ 80 عند 2.0 ثانية

ملاحظة

مقاييس وقت الاستجابة خاصة بمعيار DTU. وتعتمد أوقات الاستجابة لأعباء العمل الأخرى على عبء العمل وستختلف.

الخطوات التالية

تعرف على المزيد حول نماذج الشراء والمفاهيم ذات الصلة في المقالات التالية:

مشاركة عبر