ملاحظة
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تسجيل الدخول أو تغيير الدلائل.
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تغيير الدلائل.
Azure Data Lake Storage عبارة عن مجموعة من القدرات المخصصة لتحليلات البيانات الضخمة، مبنية على Azure Blob Storage.
يتقارب Azure Data Lake Storage بين قدرات Azure Data Lake Storage Gen1 مع Azure Blob Storage. على سبيل المثال، يوفر Data Lake Storage دلالات نظام الملفات والأمان على مستوى الملف والمقياس. نظرا لأن هذه الإمكانات مبنية على تخزين Blob، فإنك تحصل أيضا على تخزين منخفض التكلفة ومتدرج، مع إمكانات قابلية وصول عالية/استرداد البيانات بعد الكوارث.
يجعل Data Lake Storage Azure Storage الأساس لبناء مستودعات بيانات المؤسسة على Azure. مصممة من البداية لخدمة بيتابايت متعددة من المعلومات مع الحفاظ على مئات الجيجابت من معدل النقل، يسمح لك Data Lake Storage بإدارة كميات هائلة من البيانات بسهولة.
ما هي Data Lake؟
مستودع البيانات هو مستودع مركزي واحد حيث يمكنك تخزين جميع بياناتك؛ سواء كانت مُهيكلة أو غير مُهيكلة. يتيح مستودع البيانات لمؤسستك تخزين مجموعة متنوعة من البيانات والوصول إليها وتحليلها بسرعةٍ وبسهولةٍ أكبر في موقعٍ واحد. باستخدام مستودع البيانات، لا تحتاج إلى مطابقة بياناتك لتلائم بنية موجودة. بدلًا من ذلك، يمكنك تخزين البيانات بتنسيقها الأولي أو الأصلي، عادةً باعتبارها ملفات أو كائنات ثنائية كبيرة (blobs).
Azure Data Lake Storage هو حل مستودع بيانات المنشأة المستند إلى السحابة. صُمم لتخزين كميات هائلة من البيانات بأي تنسيق، ولتسهيل أحمال العمل التحليلية للبيانات الضخمة. يمكنك استخدامه لتسجيل البيانات من أي نوع واستيعابها بسرعةٍ في موقع واحد لسهولة الوصول إليها وتحليلها باستخدام أطر عمل متنوعة.
Data Lake Store
Azure Data Lake Storage ليس خدمة مخصصة أو نوع حساب. بدلا من ذلك، يتم تنفيذه كم مجموعة من القدرات التي تستخدمها مع خدمة Blob Storage لحساب Azure Storage الخاص بك. يمكنك إلغاء تأمين هذه الإمكانات عن طريق تمكين إعداد مساحة الاسم الهرمية.
يتضمن Data Lake Storage الإمكانات التالية.
✓ الوصول المتوافق مع Hadoop
✓ هيكل الدليل الهرمي
✓ تحسين التكلفة والأداء
✓ أفضل نموذج أمان الحبوب
✓ قابلية التوسع الهائلة
وصول متوافق مع Hadoop
تم تصميم Azure Data Lake Storage بشكل أساسي للعمل مع Hadoop وجميع أطر العمل التي تستخدم نظام الملفات الموزعة Apache Hadoop (HDFS) كطبقة وصول إلى البيانات الخاصة بهم. تتضمن توزيعات Hadoop برنامج تشغيل نظام ملفات Azure Blob (ABFS)، والذي يمكن العديد من التطبيقات وأطر العمل من الوصول إلى بيانات Azure Blob Storage مباشرة. تم تحسين برنامج تشغيل ABFS خصيصا لتحليلات البيانات الضخمة. تظهر واجهات برمجة التطبيقات REST المطابقة من خلال نقطة النهاية dfs.core.windows.net
.
أُطر عمل تحليل البيانات التي تستخدم HDFS باعتبارها طبقة وصول إلى البيانات يمكنها الوصول مباشرةً إلى بيانات Azure Data Lake Storage من خلال ABFS. يعد محرك تحليلات Apache Spark ومحرك استعلام Presto SQL أمثلة على مثل أطر العمل هذه.
لمزيد من المعلومات حول الخدمات والأنظمة الأساسية المدعومة، راجع خدمات Azure التي تدعم Azure Data Lake Storage والأنظمة الأساسية مفتوحة المصدر التي تدعم Azure Data Lake Storage.
بنية الدليل الهرمي
مساحة الاسم الهرمية هي ميزة رئيسية تمكن Azure Data Lake Storage من توفير وصول عالي الأداء إلى البيانات على نطاق تخزين الكائن وسعره. يمكنك استخدام هذه الميزة لتنظيم جميع الكائنات والملفات داخل حساب التخزين الخاص بك في تسلسل هرمي للدلائل والدلائل الفرعية المتداخلة. بمعنى آخر، تُنظَّم بيانات Azure Data Lake Storage خاصتك بالطريقة نفسها التي يجري بها تنظيم الملفات على حاسوبك.
تصبح عمليات مثل إعادة تسمية أو حذف الأدلة بمثابة عمليات بيانات وصفية دقيقة في الدليل. لا حاجة إلى عدِّ ومعالجة كافة العناصر التي تشترك في بادئة اسم المجلد.
التكلفة والأداء المحسنان
يُسعَّر Azure Data Lake Storage بمستويات تخزين Azure Blob. يعتمد على قدرات Azure Blob Storage مثل إدارة نهج دورة الحياة التلقائية ومستوى الكائن لإدارة تكاليف تخزين البيانات الضخمة.
تم تحسين الأداء لأنك لا تحتاج إلى نسخ البيانات أو تحويلها كشرط أساسي للتحليل. تسمح إمكانية مساحة الأسماء الهرمية لـ Azure Data Lake Storage بالوصول والتنقل الفعّال. تعني هذه البنية أن معالجة البيانات تتطلب موارد حسابية أقل، ما يقلل من سرعة وتكلفة الوصول إلى البيانات.
نموذج أمان أدق للحبوب
يدعم نموذج التحكم في الوصول إلى Azure Data Lake Storage كلا من التحكم في الوصول المستند إلى الدور Azure (Azure RBAC) وواجهة نظام التشغيل المحمولة لقوائم التحكم في الوصول UNIX (POSIX) (ACLs). هناك أيضًا بعض إعدادات الأمان الإضافية التي تخص Azure Data Lake Storage. يمكنك تعيين الأذونات إما على مستوى الدليل أو على مستوى الملف. يجري تشفير جميع البيانات المُخزنة في وضع غير نشط باستخدام مفاتيح التشفير التي تديرها Microsoft أو التي يديرها العميل.
قابلية التوسع الهائلة
يقدم Azure Data Lake Storage مساحة تخزين ضخمة ويقبل العديد من أنواع البيانات للتحليلات. لا يفرض أي قيود على أحجام الحسابات أو أحجام الملفات أو كمية البيانات التي يمكن تخزينها في مستودع البيانات. يمكن أن تحتوي الملفات الفردية على أحجام تتراوح بين بضعة كيلوبايت (KBs) إلى عدد قليل من بيتابايت (PBs). تُنفذ عملية المعالجة خلال مدة الانتظار لكل طلب ثابت تقريبا والتي يتم قياسها على مستويات الخدمة والحساب والملف.
يعني هذا التصميم أن Azure Data Lake Storage يمكنه توسيع نطاقه بسهولة وسرعة لتلبية أحمال العمل الأكثر تطلبا. يمكن أيضًا تضييق نطاقه بسهولة عند انخفاض الطلب.
مبني على Azure Blob Storage
تستمر البيانات التي تقوم بتخزينها ككائنات ثنائية كبيرة الحجم في حساب التخزين. الخدمة التي تدير الكائنات الثنائية كبيرة الحجم هي خدمة Azure Blob Storage. يصف Data Lake Storage القدرات أو "التحسينات" لهذه الخدمة التي تلبي متطلبات أحمال العمل التحليلية للبيانات الضخمة.
نظرا لأن هذه الإمكانات مبنية على Blob Storage، تتوفر ميزات مثل التسجيل التشخيصي، طبقات الوصول، ونهج إدارة دورة الحياة لحسابك. معظم ميزات Blob Storage مدعومة بالكامل، ولكن قد يتم دعم بعض الميزات فقط على مستوى المعاينة وهناك عدد قليل منها غير مدعوم حتى الآن. للحصول على قائمة كاملة من عبارات الدعم، راجع دعم ميزة Blob Storage في حسابات Azure Storage. ستتغير حالة كل ميزة مدرجة بمرور الوقت مع استمرار توسيع الدعم.
الوثائق والمصطلحات
يحتوي جدول محتويات Azure Blob Storage على قسمين من المحتوى. يوفر قسم Data Lake Storage من المحتوى أفضل الممارسات والإرشادات لاستخدام قدرات Data Lake Storage. يوفر قسم Blob Storage من المحتوى إرشادات لميزات الحساب غير الخاصة ب Data Lake Storage.
أثناء التنقل بين المقاطع، قد تلاحظ بعض الاختلافات الطفيفة في المصطلحات. على سبيل المثال، سيستخدم المحتوى المميز في وثائق Blob Storage مصطلح blob بدلا من الملف. من الناحية الفنية، تصبح الملفات التي تستوعبها في حساب التخزين الخاص بك نقاطا في حسابك. لذلك، فإن المصطلح صحيح. ومع ذلك، يمكن أن يسبب مصطلح blob ارتباكا إذا كنت معتادا على ملف المصطلح. سترى أيضا مصطلح الحاوية المستخدم للإشارة إلى نظام الملفات. اعتبر هذه المصطلحات مترادفة.