مقارنة خيارات التخزين للاستخدام مع أنظمة مجموعات Azure HDInsight

يمكنك الاختيار بين عدد قليل من خدمات تخزين Azure المختلفة عند إنشاء أنظمة مجموعات HDInsight:

توفر هذه المقالة نظرة عامة على أنواع التخزين هذه وميزاتها الفريدة.

أنواع التخزين وميزاته

يلخص الجدول التالي خدمات تخزين Azure المعتمدة مع إصدارات مختلفة من HDInsight:

خدمة التخزين نوع الحساب نوع مساحة الاسم الخدمات المدعومة مستويات الأداء المدعومة مستويات الوصول المعتمدة إصدار HDInsight نوع شبكة نظام المجموعة
Azure Data Lake Storage Gen2 V2 للأغراض العامة التسلسل الهرمي (نظام الملفات) كائن ثنائي كبير الحجم قياسي حار، بارد، أرشيف 3.6+ الكل باستثناء Spark 2.1 و2.2
تخزين Azure V2 للأغراض العامة ‏‏الكائن كائن ثنائي كبير الحجم قياسي حار، بارد، أرشيف 3.6+ الكل
تخزين Azure V1 للأغراض العامة ‏‏الكائن كائن ثنائي كبير الحجم قياسي ‏‫غير متوفر‬ الكل الكل
تخزين Azure مخزن البيانات الثنائية الكبيرة** ‏‏الكائن الكتلة كبيرة الحجم قياسي حار، بارد، أرشيف الكل الكل
Azure Data Lake Storage الجيل الأول ‏‫غير متوفر‬ التسلسل الهرمي (نظام الملفات) ‏‫غير متوفر‬ غير متاح ‏‫غير متوفر‬ 3.6 فقط الكل باستثناء HBase
تخزين Azure الكتلة كبيرة الحجم ‏‏الكائن الكتلة كبيرة الحجم متميز ‏‫غير متوفر‬ 3.6+ HBase فقط مع الكتابات المتسارعة
Azure Data Lake Storage Gen2 الكتلة كبيرة الحجم التسلسل الهرمي (نظام الملفات) الكتلة كبيرة الحجم متميز ‏‫غير متوفر‬ 3.6+ HBase فقط مع الكتابات المتسارعة

** بالنسبة لأنظمة مجموعات HDInsight، يمكن أن تكون حسابات التخزين الثانوية فقط من النوع BlobStorage ولا تُعتبر Page Blob خيارًا معتمدًا للتخزين.

لمزيد من المعلومات حول أنواع حسابات التخزين في Azure، راجع نظرة عامة على حساب تخزين Azure

لمزيد من المعلومات حول مستويات الوصول إلى Azure Storage، راجع تخزين Azure Blob: مستويات تخزين Premium (معاينة) وحار، وبارد، وأرشيف

يمكنك إنشاء أنظمة مجموعات باستخدام مجموعات من الخدمات للتخزين الثانوي الأساسي والاختياري. يلخص الجدول التالي تكوينات تخزين أنظمة المجموعات المعتمدة حاليًا في HDInsight:

إصدار HDInsight التخزين الأساسي التخزين الثانوي مدعوم
3.6 & 4.0 V1 للأغراض العامة، V2 للأغراض العامة V1 للأغراض العامة، V2 للأغراض العامة، BlobStorage(Block Blobs) ‏‏نعم‬
3.6 & 4.0 V1 للأغراض العامة، V2 للأغراض العامة Data Lake Storage Gen2 لا
3.6 & 4.0 Data Lake Storage Gen2* Data Lake Storage Gen2 ‏‏نعم‬
3.6 & 4.0 Data Lake Storage Gen2* V1 للأغراض العامة، V2 للأغراض العامة، BlobStorage(Block Blobs) ‏‏نعم‬
3.6 & 4.0 Data Lake Storage Gen2 Data Lake Storage Gen1 لا
3.6 Data Lake Storage Gen1 Data Lake Storage Gen1 ‏‏نعم‬
3.6 Data Lake Storage Gen1 V1 للأغراض العامة، V2 للأغراض العامة، BlobStorage(Block Blobs) ‏‏نعم‬
3.6 Data Lake Storage Gen1 Data Lake Storage Gen2 لا
4.0 Data Lake Storage Gen1 أي لا
4.0 V1 للأغراض العامة، V2 للأغراض العامة Data Lake Storage Gen1 لا

*=قد يكون هذا Data Lake Storage Gen2 واحد أو متعدد، طالما تم إعدادها جميعًا لاستخدام نفس الهوية المدارة للوصول إلى نظام المجموعة.

إشعار

تخزين Data Lake Storage Gen2 غير معتمد في أنظمة مجموعات Spark 2.1 أو 2.2.

النسخ المتماثل البيانات

لا يخزن Azure HDInsight بيانات العملاء. وسائل التخزين الأساسية لنظام المجموعة هي حسابات التخزين المقترنة بها. يمكنك إرفاق نظام المجموعة بحساب تخزين موجود أو إنشاء حساب تخزين جديد أثناء عملية إنشاء نظام المجموعة. إذا تم إنشاء حساب جديد، سيتم إنشاؤه كحساب تخزين مكرر محليًا (LRS)، وسيفي بمتطلبات موقع البيانات داخل المنطقة بما في ذلك تلك المحددة في مركز التوثيق.

يمكنك التحقق من أن HDInsight تم تكوينه بشكل صحيح لتخزين البيانات في منطقة واحدة من خلال التأكد من أن حساب التخزين المقترن بـ HDInsight هو LRS أو خيار تخزين آخر مذكور في مركز التوثيق.

إشعار

ترقية حساب التخزين الأساسي أو الثانوي لنظام مجموعة قيد التشغيل مع قدرات Azure Data Lake Storage Gen2 غير مدعوم. لتغيير نوع التخزين لمجموعة HDInsight موجودة إلى Data Lake Storage Gen2، ستحتاج إلى إعادة إنشاء نظام المجموعة وتحديد حساب تخزين ممكن لمساحة اسم هرمية.

الخطوات التالية