ما هو Azure Data Lake Storage Gen1؟

ملاحظة

تم الآن إيقاف Azure Data Lake Storage Gen1. انظر إعلان التقاعد هنا. لم يعد من الممكن الوصول إلى الموارد Data Lake Storage Gen1. إذا كنت بحاجة إلى مساعدة خاصة، فالرجاء الاتصال بنا.

Azure Data Lake Storage Gen1 مستودع واسع النطاق على مستوى المؤسسة لأحمال العمل التحليلية للبيانات الضخمة. يتيح لك Azure Data Lake التقاط البيانات بأي حجم ونوع وسرعة استيعاب في مكان واحد للتحليلات التشغيلية والاستكشافية.

يمكن الوصول إلى Data Lake Storage Gen1 من Hadoop (متوفر مع مجموعة HDInsight) باستخدام واجهات برمجة التطبيقات REST المتوافقة مع WebHDFS. تم تصميمه لتمكين تحليل البيانات المخزنة وتم تحسينه لأداء سيناريوهات تحليل البيانات. Data Lake Storage Gen1 يشمل جميع الميزات على مستوى المؤسسة: الأمان وقابلية الإدارة وقابلية التوسع والموثوقية والتوافر.

Azure Data Lake

القدرات الأساسية

تتضمن بعض القدرات الرئيسية لـ Gen1 تخزين بحيرة البيانات ما يلي.

بنيت لـ Hadoop

Data Lake Storage Gen1 هو نظام ملفات Apache Hadoop متوافق مع نظام الملفات الموزعة Hadoop (HDFS)، ويعمل مع النظام البيئي Hadoop. يمكن للتطبيقات أو الخدمات HDInsight الموجودة التي تستخدم واجهة برمجة تطبيقات WebHDFS أن تتكامل بسهولة مع Data Lake Storage Gen1. يعرض Data Lake Storage Gen1 أيضًا واجهة REST متوافقة مع WebHDFS للتطبيقات.

يمكنك بسهولة تحليل البيانات المخزنة في Data Lake Storage Gen1 باستخدام أطر تحليلية Hadoop مثل MapReduce أو Hive. يمكنك توفير مجموعات Azure HDInsight وتكوينها للوصول مباشرة إلى البيانات المخزنة في Data Lake Storage Gen1.

تخزين غير محدود، ملفات بيتابايت

يوفر Data Lake Storage Gen1 مساحة تخزين غير محدودة ويمكنه تخزين مجموعة متنوعة من البيانات للتحليلات. لا يفرض أي قيود على أحجام الحسابات أو أحجام الملفات أو كمية البيانات التي يمكن تخزينها في بحيرة البيانات. يمكن أن يتراوح حجم الملفات الفردية بين كيلوبايت وبيتابايت. يتم تخزين البيانات بشكل دائم عن طريق عمل نسخ متعددة. لا يوجد حد للمدة الزمنية التي يمكن خلالها تخزين البيانات في بحيرة البيانات.

ضبط الأداء لتحليل البيانات الضخمة

تم بناء Data Lake Storage Gen1 لتشغيل أنظمة تحليلية واسعة النطاق التي تتطلب الإنتاجية الهائلة للاستعلام وتحليل كميات كبيرة من البيانات. تنشر بحيرة البيانات أجزاء من ملف عبر عدد من خوادم التخزين الفردية. يؤدي هذا إلى تحسين سرعة القراءة عند قراءة الملف بالتوازي مع إجراء تحليلات البيانات.

معدة للمؤسسات: متوفرة وآمنة للغاية

يوفر Data Lake Storage Gen1 التوافر والموثوقية وفقًا لمعايير الصناعة. يتم تخزين أصول بياناتك بشكل دائم عن طريق عمل نسخ زائدة عن الحاجة للحماية من أي أعطال غير متوقعة.

يوفر Data Lake Storage Gen1 أيضًا أمانًا على مستوى المؤسسة للبيانات المخزنة. لمزيد من المعلومات، راجع تأمين البيانات في Azure Data Lake Storage Gen1.

كل البيانات

يمكن لـ Data Lake Storage Gen1 تخزين أي بيانات في صيغته الأصلية، دون الحاجة إلى أي تحويلات سابقة. لا يتطلب "Data Lake Storage Gen1" تحديدًا مخططًا قبل تحميل البيانات، وترك الأمر للإطار التحليلي الفردي لتفسير البيانات وتحديد المخطط وقت التحليل. القدرة على تخزين الملفات ذات الأحجام والأشكال التعسفية يجعل من الممكن لـ Data Lake Storage Gen1 التعامل مع البيانات المنظمة وشبه المنظمة وغير المنظمة.

حاويات Data Lake Storage Gen1 للبيانات هي أساس المجلدات والملفات. تعمل على البيانات المخزنة باستخدام SDKs ومدخل Azure وAzure PowerShell. إذا وضعت بياناتك في المخزن باستخدام هذه الواجهات واستخدام الحاويات المناسبة، يمكنك تخزين أي نوع من البيانات. لا يقوم Data Lake Storage Gen1 بأي معالجة خاصة للبيانات بناءً على نوع البيانات التي يخزنها.

تأمين البيانات

يستخدم Data Lake Storage Gen1 Microsoft Entra ID للمصادقة وقوائم التحكم في الوصول (ACLs) لإدارة الوصول إلى بياناتك.

الميزة الوصف
المصادقة يتكامل Data Lake Storage Gen1 مع Microsoft Entra ID لإدارة الهوية والوصول لجميع البيانات المخزنة في Data Lake Storage Gen1. وبسبب التكامل، تستفيد Data Lake Storage Gen1 من جميع ميزات Microsoft Entra مثل المصادقة متعددة العوامل والوصول المشروط والتحكم في الوصول المستند إلى الدور في Azure ومراقبة استخدام التطبيق ومراقبة الأمان والتنبيه وما إلى ذلك. يدعم "Data Lake Storage Gen1" بروتوكول OAuth 2.0 للحماية داخل واجهة REST. راجع حماية Data Lake Storage Gen1.
التحكم في الوصول يوفر Data Lake Storage Gen1 التحكم في إمكانية الوصول من خلال دعم صلاحيات POSIX التي كشفها بروتوكول WebHDFS. يمكنك إتاحة قوائم التحكم في إمكانية الوصول ACL في المجلد الرئيسي والمجلدات الفرعية والملفات الفردية. لمزيد من المعلومات حول كيفية عمل قوائم التحكم في إمكانية الوصول ACL في سياق "Data Lake Storage Gen1"، راجع التحكم في إمكانية الوصول في "Data Lake Storage Gen1".
التشفير يوفر Data Lake Storage Gen1 أيضًا تشفيرًا للبيانات المخزنة في الحساب. يمكنك تحديد إعدادات التشفير في أثناء إنشاء حساب "Data Lake Storage Gen1". يمكنك الاختيار ما بين تشفير بياناتك أو عدم تشفيرها. لمزيد من المعلومات، راجع التشفير في Data Lake Storage Gen1. للحصول على إرشادات حول كيفية توفير الإعدادات المرتبطة بالتشفير، راجع البدء باستخدام Data Lake Storage Gen1 من خلال بوابة Azure.

للحصول على إرشادات حول كيفية تأمين البيانات في Data Lake Storage Gen1، راجع تأمين البيانات في Azure Data Lake Storage Gen1.

توافق التطبيقات

Data Lake Storage Gen1 متوافق مع معظم العناصر مفتوحة المصدر في النظام الإيكولوجي Hadoop. كما أنه يتكامل بشكل جيد مع خدمات Azure الأخرى. لمعرفة المزيد حول كيفية استخدام "Data Lake Storage Gen1" مع العناصر المفتوحة المصدر وخدمات Azure الأخرى، استخدم الروابط التالية:

نظام ملفات Data Lake Storage Gen1

يمكن الوصول إلى Data Lake Storage Gen1 عبر نظام الملفات AzureDataLakeFilesystem (adl: //) في بيئات Hadoop (متوفرة مع مجموعة HDInsight). يمكن للتطبيقات والخدمات التي تستخدم adl:// الاستفادة من تحسينات الأداء الإضافية غير المتوفرة حاليًا في WebHDFS. ونتيجة لذلك، يمنحك Data Lake Storage Gen1 المرونة إما للاستفادة من أفضل أداء باستخدام الخيار الموصى به لاستخدام adl:// أو الحفاظ على التعليمات البرمجية الموجودة من خلال الاستمرار في استخدام واجهة برمجة تطبيقات WebHDFS مباشرة. يستفيد Azure HDInsight بشكل كامل من نظام AzureDataLakeFilesystem لتوفير أفضل أداء على Data Lake Storage Gen1.

يمكنك الوصول إلى بياناتك في Data Lake Storage Gen1 باستخدام adl://<data_lake_storage_gen1_name>.azuredatalakestore.net. لمزيد من المعلومات حول كيفية الوصول إلى البيانات في "Data Lake Storage Gen1"، راجع عرض خصائص البيانات المخزنة.

الخطوات التالية