مساحة الاسم الهرمية ل Azure Data Lake Storage

آلية رئيسية تسمح ل Azure Data Lake Storage بتوفير أداء نظام الملفات على نطاق تخزين الكائن والأسعار هي إضافة مساحة اسم هرمية. يسمح هذا لمجموعة من الكائنات/الملفات داخل حساب لتنظيمها في تسلسل هرمي من الدلائل والدلائل الفرعية المضمنة بنفس الطريقة التي يتم بها تنظيم نظام الملفات على الكمبيوتر الخاص بك. مع تمكين مساحة أسماء هرمية، يصبح حساب التخزين قادرًا على توفير قابلية التوسع والفعالية من حيث التكلفة لتخزين الكائن، مع دلالات نظام الملفات المألوفة لمحركات التحليلات وأطر العمل.

فوائد مساحة الاسم الهرمية

الفوائد التالية مقترنة بأنظمة الملفات التي تقوم بتطبيق مساحة أسماء هرمية عبر بيانات blob:

  • Atomic directory manipulation: تقوم مخازن الكائنات بتقريب التسلسل الهرمي للدليل من خلال اعتماد اصطلاح تضمين الشرطات المائلة (/) في اسم الكائن للإشارة إلى مقاطع المسار. بينما تعمل هذه الاتفاقية لتنظيم العناصر، لا يوفر الاصطلاح أي مساعدة لإجراءات مثل النقل أو إعادة التسمية أو حذف الدلائل. بدون الدلائل الحقيقية يجب أن تعالج التطبيقات الملايين من النقط الفردية المحتملة لتحقيق مهام على مستوى الدليل. وعلى النقيض من ذلك، تقوم مساحة أسماء هرمية بمعالجة هذه المهام عن طريق تحديث إدخال واحد (الدليل الأصلي).

    هذا التحسين الدرامي مهم بشكل خاص للعديد من أطر تحليلات البيانات الضخمة. أدوات مثل Hive، Spark، إلخ غالبًا تكتب الإخراج إلى مواقع مؤقتة ثم تعيد تسمية الموقع في ختام المهمة. بدون مساحة أسماء هرمية، قد تستغرق إعادة التسمية هذه وقتًا أطول من عملية التحليل نفسها. انخفاض زمن الانتقال إلى المهام يساوي انخفاض التكلفة الإجمالية للتملك (TCO) لأحمال عمل التحليلات.

  • Familiar Interface Style: أنظمة الملفات مفهومة جيدًا من قبل المطورين والمستخدمين على حد سواء. ليست هناك حاجة لمعرفة نموذج تخزين جديد عند الانتقال إلى السحابة حيث إن واجهة نظام الملفات التي تعرضها Data Lake Storage هي نفس النموذج الذي تستخدمه أجهزة الكمبيوتر، الكبيرة والصغيرة.

أحد الأسباب التي لم يتم اعتمادها تاريخيًا بمساحة أسماء هرمية أن مساحة الأسماء الهرمية تحد المقياس. ومع ذلك، يتم قياس مساحة الاسم الهرمية Data Lake Storage خطيا ولا تتدهور إما سعة البيانات أو الأداء.

تحديد ما إذا كنت تريد تمكين مساحة اسم هرمية

بعد تمكين مساحة اسم هرمية على حسابك، لا يمكنك إعادتها مرة أخرى إلى مساحة اسم ثابت. لذلك، ضع في اعتبارك ما إذا كان من المنطقي تمكين مساحة اسم هرمية استنادًا إلى طبيعة أحمال عمل تخزين الكائنات. لتقييم تأثير تمكين مساحة اسم هرمية على أحمال العمل والتطبيقات والتكاليف وتكامل الخدمة والأدوات والميزات والوثائق، راجع ترقية Azure Blob Storage باستخدام قدرات Azure Data Lake Storage.

قد لا تحصل بعض أحمال العمل على أي فائدة من خلال تمكين مساحة اسم هرمية. تتضمن الأمثلة النسخ الاحتياطية وتخزين الصور والتطبيقات الأخرى حيث يتم تخزين تنظيم الكائنات بشكل منفصل عن الكائنات نفسها (على سبيل المثال: في قاعدة بيانات منفصلة).

أيضًا، بينما يستمر دعم ميزات تخزين Blob والنظام البيئي لخدمة Azure في النمو، لا تزال هناك بعض الميزات وخدمات Azure غير المدعومة حتى الآن في الحسابات التي تحتوي على مساحة اسم هرمية. راجع المشاكل المعروفة.

بشكل عام، نوصي بتشغيل مساحة اسم هرمية لأحمال عمل التخزين المصممة لأنظمة الملفات التي تتعامل مع الدلائل. ويشمل ذلك جميع أعباء العمل المخصصة أساسًا لمعالجة التحليلات. ستستفيد مجموعات البيانات التي تتطلب درجة عالية من التنظيم أيضًا من خلال تمكين مساحة اسم هرمية.

يتم تحديد أسباب تمكين مساحة اسم هرمية من خلال تحليل إجمالي التكلفة الإجمالية للتملك (TCO). بشكل عام، ستتطلب التحسينات في زمن انتقال عبء العمل بسبب تسريع التخزين موارد حسابية لوقت أقل. قد يتم تحسين زمن الوصول للعديد من أحمال العمل بسبب معالجة الدليل الذري الذي يتم تمكينه بواسطة مساحة اسم هرمية. في العديد من أعباء العمل، يمثل مورد الحوسبة > 85% من التكلفة الإجمالية، وبالتالي حتى الانخفاض المتواضع في زمن انتقال عبء العمل يعادل قدرًا كبيرًا من توفير التكلفة الإجمالية للتملك (TCO). حتى في الحالات التي يؤدي فيها تمكين مساحة الأسماء الهرمية إلى زيادة تكاليف التخزين، لا تزال التكلفة الإجمالية للتملك (TCO) منخفضة بسبب انخفاض تكاليف الحساب.

لتحليل الاختلافات في أسعار تخزين البيانات وأسعار المعاملات وتسعير حجز سعة التخزين بين الحسابات التي تحتوي على مساحة اسم هرمية ثابتة مقابل مساحة اسم هرمية، راجع تسعير Azure Data Lake Storage.

الخطوات التالية