مشاركة عبر


قابلية التوسع في Azure DocumentDB

يوفر Azure DocumentDB القدرة على توسيع المجموعات عموديا وأفقيا. بينما تعتمد طبقة عنقود الحوسبة وقرص التخزين وظيفيا على بعضهما البعض، فإن قابلية التوسع وتكلفة الحوسبة والتخزين منفصلة.

تحجيم عمودي

يقدم التوسع الرأسي الفوائد التالية:

  • قد لا يكون لدى فرق التطبيقات دائما مسار واضح لتقسيم بياناتهم بشكل منطقي. علاوة على ذلك، يتم تعريف الشظايا المنطقية لكل مجموعة. في مجموعة بيانات تحتوي على عدة مجموعات غير مجزأة، قد يصبح نمذجة البيانات لتقسيم البيانات مرهقا بسرعة. مجرد توسيع نطاق العنقود يمكن أن يتجاوز الحاجة إلى الشظايا المنطقية مع تلبية احتياجات التخزين والحوسبة المتزايدة للتطبيق.
  • التوسع الرأسي لا يتطلب إعادة توازن البيانات. عدد الشظايا الفيزيائية يبقى كما هو، ويتم زيادة سعة العنقود فقط دون أي تأثير على التطبيق.
  • التوسع والتقليل يعني عمليات توقف بدون أي انقطاعات في الخدمة. لا حاجة لتغييرات في التطبيق ويمكن أن تستمر العمليات في الحالة المستقرة دون أي اضطراب.
  • يمكن أيضا تقليل موارد الحوسبة خلال فترات زمنية معروفة ذات نشاط منخفض. مرة أخرى، يتجنب التصغير الحاجة إلى إعادة توازن البيانات عبر عدد أقل من الشظايا المادية، وهو عملية بدون توقف بدون أي تعطيل للخدمة. هنا أيضا، لا حاجة لتغييرات في التطبيق بعد تصغير العنقود.
  • والأهم من ذلك، يمكن توسيع حجم الحوسبة والتخزين بشكل مستقل. إذا احتجت المزيد من النوى والذاكرة، يمكن ترك حجم القرص كما هو ويمكن تكبير مستوى العنقود. وبالمثل، إذا كانت هناك حاجة إلى المزيد من التخزين وIOPS، يمكن ترك طبقة العنقود كما هي ويمكن توسيع حجم التخزين بشكل مستقل. إذا لزم الأمر، يمكن توسيع كل من الحوسبة والتخزين بشكل مستقل لتحسين متطلبات كل مكون بشكل فردي، دون أن تؤثر متطلبات مرونة أي مكون على الآخر.

تحجيم أفقي

في النهاية، ينمو التطبيق إلى نقطة لا يكون فيها التكبير الرأسي كافيا. يمكن أن تنمو متطلبات عبء العمل إلى ما هو أبعد من سعة أكبر طبقة عنقودية، وفي النهاية تحتاج إلى المزيد من الشظايا. التكبير الأفقي في Azure DocumentDB يقدم الفوائد التالية:

  • مجموعات البيانات المقطعة منطقيا لا تتطلب تدخل المستخدم لموازنة البيانات عبر الشظايا الفيزيائية الأساسية. تقوم الخدمة تلقائيا بتعيين الشظايا المنطقية إلى شظايا فعلية. عند إضافة أو إزالة العقد، يتم إعادة توازن البيانات تلقائيا في قاعدة البيانات تحت الأغطية.
  • يتم توجيه الطلبات تلقائيا إلى الشظية الفيزيائية ذات الصلة التي تملك نطاق التجزئة للبيانات التي يتم الاستعلام عنها.
  • العناقيد الموزعة جغرافيا لها تكوين متعدد العقد متجانس. لذا فإن خرائط الشظايا المنطقية إلى الفيزيائية متسقة عبر المناطق الأساسية والمناطق المقلدة في العنقود.

الحوسبة وتكبير التخزين

تؤثر موارد الحوسبة والذاكرة على عمليات القراءة في Azure DocumentDB أكثر من IOPS القرص.

  • تقوم عمليات القراءة أولا بمراجعة الذاكرة المؤقتة في طبقة الحوسبة ثم العودة إلى القرص عندما لا يمكن استرجاع البيانات من الذاكرة المؤقتة. بالنسبة لأعباء العمل ذات معدل قراءة أعلى في الثانية، فإن تكبير مستوى العنقود للحصول على موارد أكبر من وحدة المعالجة المركزية والذاكرة يؤدي إلى معدل نقل أعلى.
  • بالإضافة إلى معدل نقل القراءة، تستفيد الأحمال التي تحتوي على حجم كبير من البيانات لكل عملية قراءة أيضا من توسيع موارد الحوسبة في العنقود. على سبيل المثال، تسهل طبقات العنقود ذات الذاكرة الأكبر حجم حمولة أكبر لكل مستند وعددا أكبر من المستندات الصغيرة لكل استجابة.

يؤثر IOPS على القرص على عمليات الكتابة في Azure DocumentDB أكثر من سعات المعالج والذاكرة لموارد الحوسبة.

  • عمليات الكتابة دائما تبقي البيانات على القرص (بالإضافة إلى البيانات الدائمة في الذاكرة لتحسين القراءات). توفر أقراص أكبر ذات IOPS أكثر سرعة كتابة أعلى، خاصة عند التشغيل على نطاق واسع.
  • تدعم الخدمة ما يصل إلى 32 تيرابايت قرص لكل شارد، مع زيادة IOPS لكل شظية لفائدة أعباء العمل الثقيلة للكتابة، خاصة عند التشغيل على نطاق واسع.

أعباء عمل ثقيلة التخزين والأقراص الكبيرة

لا توجد متطلبات تخزين دنيا لكل طبقة من العنقود

كما ذكر سابقا، يتم فصل موارد التخزين والحوسبة للفوترة والتوفير. بينما تعمل كوحدة متماسكة، يمكن تكبيرها بشكل مستقل. يمكن أن تحتوي طبقة عنقود M30 على أقراص بسعة 32 تيرابايت متوفرة. وبالمثل، يمكن لطبقة عنقود M200 توفير أقراص بسعة 32 جيجابايت لتحسين تكاليف التخزين والحوسبة.

انخفاض تكلفة التكلفة مع الأقراص الكبيرة (32 تيرابايت وما فوق)

عادة، تحد قواعد بيانات NoSQL من سعة التخزين لكل شظية فيزيائية إلى 4 تيرابايت. يوفر Azure DocumentDB ما يصل إلى 8 أضعاف هذه السعة مع أقراص بسعة 32 تيرابايت. بالنسبة لأحمال العمل الثقيلة في التخزين، تتطلب سعة تخزين 4 تيرابايت لكل شظية مادية أسطولا ضخما من الموارد الحاسوبية فقط للحفاظ على متطلبات التخزين في عبء العمل. الحوسبة أغلى من التخزين، وزيادة توفير الحوسبة بسبب حدود السعة في الخدمة يمكن أن تضخم التكاليف بسرعة.

دعونا نفكر في عبء عمل ثقيل للتخزين مع 200 تيرابايت من البيانات.

حجم التخزين لكل شظية الحد الأدنى من الشظايا اللازمة لتحمل 200 تيرابايت
4 تيرا بايت 50
32 تيرا بايت 7

يقل انخفاض متطلبات الحوسبة بشكل حاد مع الأقراص الأكبر. بينما قد تكون هناك حاجة لأكثر من الحد الأدنى من الشظايا الفيزيائية للحفاظ على متطلبات الإنتاجية لحمل العمل، حتى مضاعفة أو مضاعفة عدد الشظايا أكثر فعالية من حيث التكلفة مقارنة بعنقود 50 شظية مع أقراص أصغر.

تخطي تصنيف التخزين مع الأقراص الكبيرة

استجابة فورية لتكاليف الحساب في السيناريوهات ذات التخزين الثقيل هي "تصنيف" البيانات. تقتصر البيانات في قاعدة البيانات المعاملية على البيانات "الساخنة" الأكثر استخداما، بينما يتم فصل الحجم الأكبر من البيانات "الباردة" إلى المخزن البارد. وهذا يسبب تعقيد تشغيلي. الأداء أيضا غير متوقع ويعتمد على مستوى البيانات الذي يتم الوصول إليه. علاوة على ذلك، يعتمد توفر النظام بأكمله على مرونة كل من مخازن البيانات الساخنة والباردة مجتمعة. مع وجود أقراص كبيرة في الخدمة، لا حاجة للتخزين الطبقي لأن تكلفة أعباء العمل الثقيلة في التخزين تقل.

الخطوات التالية