ملخص
- يمكن أن تتميز البيانات بهيكلتها وديناميكيتها ووحدة التخزين. ويمكن عادة أن تكون ساكنة أو مصنفة، أو ثابتة أو ديناميكية.
- وقد تطورت تقنيات التخزين لمواكبة الاحتياجات المتزايدة باستمرار، للتمكن من تخزين كميات هائلة من البيانات.
- يمكن أن تظهر التطبيقات المختلفة متطلبات مختلفة من حيث القدرة والأداء، والتسامح مع الخطأ، والقدرة على الصمود، وغيرها. وقد صممت أنظمة التخزين خصيصًا لتلبية هذه المتطلبات بطريقة فعالة.
- قد تكون تجريدات التخزين في نموذج كتل على جهاز تخزين الكتل أو ملفات على نظام الملفات أو وحدات في قاعدة بيانات.
- هناك العديد من أنواع أنظمة الملفات، مثل أنظمة الملفات المحلية والمشتركة وشبكات الاتصال.
- إدارة البيانات على أنظمة الملفات المحلية من خلال أجهزة تخزين الكتل (الأقراص المادية أو الأرقام المنطقية للوحدات). يقومون بتعيين الملفات إلى مناطق من القرص تسمى كتل. تم تصميم أنظمة الملفات مع مراعاة الاهتمامات المتعلقة بالأداء والموثوقية.
- يمكن توسيع نظام ملفات واحد عبر عدة أقراص، باستخدام نظام إدارة وحدات التخزين المنطقية والمصفوفة متعددة الأقراص المستقلة.
- يتم دمج التخزين في بيئات المؤسسة عادة لتسهيل تجميع موارد التخزين ومشاركتها وتحسين إمكانية إدارتها. كما تتم مشاركة أنظمة التخزين الموحدة بين خوادم متعددة باستخدام شبكة مساحة تخزين.
- ويُقصد بنظام الملفات الموزعة اتحاد نظام ملفات الشبكة مع الملفات الموزعة بين خوادم الملفات المتعددة. يتم تخزين ملف كامل على أحد خوادم نظام الملفات، التي تعتبر جزءًا من نظام الملفات الموزعة.
- لدى أنظمة الملفات الموزعة العديد من اعتبارات التصميم، بما في ذلك التسامح مع الخطأ والنسخ المتماثل والتناسق ودلالات مشاركة الملفات.
- تطورت قواعد البيانات بدءًا من نموذج التنقل إلى نموذج قاعدة البيانات الارتباطية الحديثة وكذلك إلى نموذج NoSQL وNewSQL.
- وهناك اعتبارات تصميم متعددة لأنظمة قواعد البيانات.
- عندما تكون البيانات قابلة للهيكلة، فمن المعتاد تنظيمها باستخدام نموذج محدد جيدا (يعرف أيضا باسم المخطط). يتم عادةً تخزين البيانات شبه الهيكلية أو غير المُهيكلة في أنظمة بلا مخططات مثل مخازن القيم الأساسية.
- تشير نظرية CAP إلى أن أي نظام تخزين موزع مع بيانات مشتركة يمكن أن يكون على الأكثر اثنتين من الخصائص الثلاث المرغوب فيها من بين ما يلي: التناسق والتوفر والتسامح مع التقسيم.
- يتم تنظيم بيانات نماذج RDBMS في جداول مترابطة. يعرف المخطط القواعد المتعلقة بأنواع كل عمود من الجدول ومدخلاته الصحيحة. يتم تعريف الجداول والوصول إليها وتعديلها من خلال لغة الاستعلام (عادة ما تكون SQL).
- يدعم RDBMS العمليات من خلال توفير ضمانات آلية الرجوع والتناسق والعزل والقدرة على الصمود.
- يمكن يغيّر السعة قواعد البيانات التقليدية إما رأسيًا أو أفقيًا. يتطلب التحجيم الرأسي ببساطة تحديث الأجهزة الأساسية (وحدة المعالجة المركزية والذاكرة والقرص وما إلى ذلك).
- ولكن عند القيام بالتحجيم الأفقي، يتم توزيع قاعدة بيانات عبر أجهزة متعددة، إما من خلال النسخ المتماثل (يتم تخزين نفس البيانات عبر أجهزة متعددة) أو التقسيم (يتم توزيع البيانات عبر أجهزة متعددة).
- إن تحقيق خاصية آلية الرجوع والتناسق والعزل والقدرة على الصمود في قاعدة بيانات موزعة أمر صعب. عادةً يستخدم بروتوكول تثبيت من مرحلتين (2PC) لضمان خصائص ACID في قواعد البيانات تلك. وعلى الرغم من ذلك، يؤثر هذا النهج على الأداء على يغيّر السعة للغاية.
- تتخذ قواعد بيانات NoSQL نهجًا ضعيفًا من أجل ضمانات التناسق الصارمة كي توفر التوفر والتسامح مع التقسيم على يغيّر السعة والأداء العالي.
- تتضمن أنواع قليلة من قواعد بيانات NoSQL مخازن مستندات وقواعد بيانات الرسم البياني ومخازن القيمة الأساسية وقواعد البيانات عمودية.
- توفر قواعد بيانات NoSQL عادةً مرونة البيانات وقابلية التوسع وأداء عاليًا لكميات كبيرة من البيانات عند مقارنتها بإصدارات RDBMS التقليدية.
- ينبغي على التطبيقات أخذ نموذج التناسق الضعيف الخاص بمخازن بيانات NoSQL في الاعتبار. ويؤدي الافتقار إلى التوحيد القياسي إلى صعوبة ترحيل البيانات من قاعدة بيانات إلى أخرى.
- وتسعى قواعد بيانات NewSQL للجمع بين نموذج البيانات الارتباطية وواجهة SQL الخاصة بإصدارات RDBMS مع قابلية التوسع والأداء الخاص بأنظمة NoSQL. ويتحقق ذلك عن طريق إعادة هندسة محركات قاعدة البيانات لتعمل بشكلٍ جيد على يغيّر السعة من خلال التخزين في الذاكرة وبنية لا شيء مشترك.
- تقدم مخازن العناصر تجريدًا للعنصر (وهي حاوية عامة لتخزين أي كتابة عشوائية من المعلومات) ومجموعة من العمليات الأساسية للغاية — من إنشاء وقراءة وتحديث وحذف (CRUD) - لتمكين التخزين متصلة بالإنترنت. ويمكن اعتبارها إصدار موجه للخدمة من مخازن القيمة الأساسية.
- عادةً يتم الوصول إلى مخازن العناصر باستخدام API التي يتم الوصول إليها عبر الشبكة باستخدام اتصالات نمط REST/SOAP.
- يُعد تخزين Blob Azure مثالاً على مخزن العناصر، وCDMI هو معيار مفتوح مرتقب، والذي يحدد بيئة تخزين المجموعة.