مقدمة
أمضت العديد من المؤسسات العقدين الماضيين في بناء مستودعات البيانات وحلول المعلومات المهنية (BI) استنادًا إلى أنظمة قواعد البيانات الارتباطية. لقد فقدت العديد من حلول المعلومات المهنية فرص تخزين البيانات غير المنظمة بسبب التكلفة والتعقيد في هذه الأنواع من البيانات في قواعد البيانات.
أصبحت مستودعات البيانات حلا شائعا لهذه المشكلة. يوفر مستودع البيانات تخزينا مستندا إلى الملفات، عادة في نظام ملفات موزع يدعم قابلية التوسع العالية لكميات هائلة من البيانات. يمكن للمؤسسات تخزين الملفات المنظمة وشبه المنظمة وغير المنظمة في مستودع البيانات ثم استهلاكها من هناك في تقنيات معالجة البيانات الضخمة، مثل Apache Spark.
يوفر Azure Data Lake Storage Gen2 حلا مستندا إلى السحابة لتخزين مستودع البيانات في Microsoft Azure، ويدعم العديد من حلول التحليلات واسعة النطاق المبنية على Azure.