أنظمة الملفات الموزعة
- 10 دقائق
سنقوم بتغيير الموضوع الآن، وسنناقش أنظمة الملفات الموزعة. يُقصد بنظام الملفات الموزعة نظام ملفات يحتوي على ملفات موزعة بين خوادم ملفات متعددة.
من المهم ملاحظة أنه في نظام الملفات الموزعة، يقوم العميل بعرض مساحة اسم تخزين عمومي واحدة، والتي تشمل كافة الملفات عبر كافة خوادم نظام الملفات، كما هو موضح في الشكل التالي.
كما هو الحال مع نظام الملفات المشتركة، تتطلب نظام الملفات الموزعة إدارة بيانات التعريف بحيث يمكن للعملاء تحديد موقع الملفات المطلوبة وكتل الملفات عبر خوادم الملفات. يمكن أن يكون خادم بيانات التعريف غير متماثل (خادم بيانات تعريف مفردة) أو متماثل (خوادم بيانات التعريف على كل خادم ملف)، مشابهة لنظم الملفات المشتركة.
الشكل 12: نظامالملفات الموزعة 1
منشأ أنظمة الملفات الموزعة وتطورها
تتضمن أمثلة أنظمة الملفات الموزعة نظام الملفات Andrew. ويُقصد بنظام الملفات Andrew هو نظام الملفات الموزعة التي تمكن المضيفين المشتركين (العملاء والخوادم) من تبادل موارد نظام الملفات بكفاءة عبر كل من المساحة المحلية والشبكات واسعة النطاق. تتكون AFS من خلايا، وهي عبارة عن تجمع إداري للخوادم التي تقدم نظام ملفات متماسكًا واحدًا. يمكن ضم الخلايا إلى نموذج مساحة اسم تخزين عمومي واحدة. سيقوم أي عميل يصل إلى البيانات من خلال نظام الملفات Andrew أولاً بنسخ الملف محليًا إلى العميل. وسيتم إجراء تغييرات على الملف محليًا طالما أن الملف مفتوح. عند إغلاق الملف، سيقوم العميل المستخدم نظام الملفات Andrew بمزامنة التغييرات إلى الخلف إلى الخادم. CODA هو نسخة مطورة من AFS، وهو عبارة عن نظام ملفات موزعة قيد التحسن على AFS، خاصة فيما يتعلق بمشاركة الدلالة والنسخ المتماثل.
في عام 2003، كشفت جوجل عن تصميم نظام الملفات الموزعة الخاص بها، ودعا GFS2،الذي صُمّم من الصفر لتوفير إمكانية الوصول الفعال والموثوق به للبيانات باستخدام مجموعات كبيرة من الأجهزة السلعية. تم تصميم نظام التنبؤات العالمي لتخزين ملفات كبيرة جدًا على شكل مجموعات (عادة 64 ميغابايت في الحجم)، بطريقة منسوخة. فعلى الرغم من أن نظام التنبؤات العالمي لديه طريقة عرض عميل مفرد مثل نظام الملفات Andrew، يتم كشف موقع مجموعة الملفات للمستخدم، نظرًا لفرص إحضار الملفات من أقرب نسخة متماثلة متاحة. إن نظام التنبؤات العالمي هو مصدر إلهام وراء نظام الملفات الموزعة Hadoop، والتي يتم شرحها بالتفصيل في الوحدة النمطية التالية.
خصائص التصميم في أنظمة الملفات الموزعة
يتم نشر نظام التنبؤات العالمي عادةً على عدة عقد مشاركة الملفات وهي مخصصة للاستخدام من قبل عدة مستخدمين في نفس الوقت. كما هو الحال مع أي مورد مشترك، يجب مراعاة اعتبارات التصميم المتعددة، ومن بينها:
- التسامح مع الخطأ
- النسخ المتماثل
- الاتساق
- دلالات مشاركة الملفات
يجب تصميم أنظمة الملفات المشتركة، والتي تم ربطها بشبكة مع وضع الإخفاقات في الاعتبار. يُقصد بالتسامح مع الخطأ قدرة النظام على الاستجابة بأمان إلى فشل البرامج والأجهزة غير المتوقع. في حالة أنظمة الملفات، يتطلب التسامح مع الخطأ نظام الملفات للاستجابة بأمان إلى القرص والعقدة وفشل الشبكة. باستخدام أنظمة الملفات المشتركة وشبكة الاتصال، تزيد احتمالات فشل القرص مع عدد الأقراص في الصفيف/التجمع. على مستوى الأجهزة، يمكن التسامح مع الأخطاء باستخدام بعض نماذج RAID.
وعلى مستوى نظام الملفات، يمكن نسخ البيانات في النظم الموزعة نسخًا متماثلاً؛ قد يتم الاحتفاظ بنفس البيانات على عقدة واحدة أو أكثر في نظام الملفات الموزعة. يتم إجراء هذا النسخ المتماثل بهدف:
- تحسين الأداء (عميل يُحتمل أن يجد نسخة متماثلة الأقرب إلى موقعه).
- تحسين قابلية النظام للتوسع (يمكن معالجة طلبات البيانات المتزامنة باستخدام خوادم مختلفة).
- تحسين الموثوقية (يمكن أن توفر النسخ المتماثلة التسامح مع الخطأ وتوفير آلية المجموع الاختباري لضمان سلامة البيانات).
النسخ المتماثل هو الآلية الأساسية لتقديم التسامح مع الخطأ في نظام الملفات الموزعة. عادةً ما تتأثر قدرة نظام الملفات الموزعة بواسطة عامل النسخ المتماثلة (عدد النسخ المتماثلة النشطة التي سيتم الاحتفاظ بها). على سبيل المثال، يمكن لنظام الملفات الموزعة ذات سعة أولية تبلغ 15 تيرابايت تخزين 5 تيرابايت فقط من البيانات، إذا تم نسخ كافة البيانات ثلاث مرات.
ويشكل التكرار تحديًا إضافيًا للتناسق. يجب تطبيق التحديثات للملفات على كافة النسخ المتماثلة، في حالة وجود نظام موزع كبير. يؤثر مستوى التناسق المعتمد في نظام الملفات الموزعة أيضًا على تفاعلات العميل مع نظام الملفات.
عند مشاركة مورد، مثل ملف، بين عدة مستخدمين، من الضروري تحديد دلالات القراءة والكتابة إلى الملف. فيما يلي بعض دلالات التي يمكن تطبيقها باستخدام نظام الملفات الموزعة:
- دلالات UNIX: في دلالات UNIX، ستؤدي عملية القراءة التي يتم إجراؤها مباشرة بعد عملية الكتابة إلى إرجاع القيمة التي تمت كتابتها للتو. يستخدم UNIX دلالات مشاركة الملفات الأكثر صرامة في أنظمة الملفات. باستخدام دلالات UNIX، قد يتأثر الأداء لأنه قد يلزم تسلسل عمليات القراءة والكتابة لضمان اتساق جميع عمليات نظام الملفات.
- دلالات الجلسة: في دلالات جلسة العمل، تكون التغييرات على ملف مفتوح مرئية في البداية فقط للعملية التي عدلت الملف. وبمجرد إغلاق الملف، يتم تحول التغييرات إلى تغييرات مرئية لعمليات أخرى. تعمل دلالات الجلسة على تخفيف المتطلبات الصارمة التي تستخدمها دلالات UNIX، ولكن تظهر مسألة معالجة التعارض: عندما يقوم عميلان بتحرير نفس الملف في الوقت نفسه، يتم احترام جلسته؟ بعض النهج ترجح بأن العميل الأخير هو من يقوم بإغلاق الملف، بينما البعض الآخر قد يكون لم يحدد ذلك.
- دلالات غير قابلة للتغيير: في دلالات غير قابلة للتغيير، يمكن كتابة الملفات مرة واحدة فقط في نظام الملفات ولا يمكن إعادة فتحها لمزيد من التعديل. يمكن حذف الملفات، أو يمكن إنشاء ملف جديد لاستبدال الملف القديم. إذا حاول اثنان أو أكثر من العمليات استبدال الملف في وقت متزامن، يجب أن يحلل نظام الملف العقدة من خلال نهج أسلوب (ما يرد أولاً يُصرف أولاً)، أو باستخدام طريقة غير محددة. كما أن نظام الملفات عليه مراعاة إمكانية أن إحدى العمليات يمكنها استبدال ملف بينما تُجرى قراءته بواسطة الأخرى. وخلال هذا السيناريو، يجب على نظام الملفات إما الترتيب للقارئ لمتابعة استخدام الملف القديم أو الكشف عن أن الملف الآن تم استبداله وعدم السماح لعملية القراءة بمتابعة الوصول إلى الملف.
-
العمليات الذرية: في نموذج المعاملة الذرية، يتم وضع علامة على بداية ونهاية تسلسل عمليات القراءة والكتابة على أنها معاملة تحدث فيها التغييرات على الملفات بشكل ذري (إما أن يتم تنفيذ التغييرات ككل أو لا يتم الالتزام بها على الإطلاق).
المراجع
- توماس ريفيرا (2012). تطوّر برامج رابطة صناعة شبكات التخزين التعليمية المتعلقة بأنظمة الملفات
- سانجاي غيماوات، هوارد غوبيوف، شاون تاك ليونغ (2003). أنظمة ملفات Google ندوة ACM التاسعة عشر بشأن مبادئ أنظمة التشغيل
اختبر معلوماتك
الملاحظات
هل كانت هذه الصفحة مفيدة؟
لا
هل تحتاج إلى مساعدة مع هذا الموضوع؟
هل تريد محاولة استخدام Ask Learn لتوضيح هذا الموضوع أو إرشادك خلاله؟