توصيات للعمل مع جذر DBFS
يستخدم Azure Databricks الدليل الجذر DBFS كموقع افتراضي لبعض إجراءات مساحة العمل. توصي Databricks بعدم تخزين أي بيانات إنتاج أو معلومات حساسة في جذر DBFS. تركز هذه المقالة على التوصيات لتجنب التعرض العرضي للبيانات الحساسة على جذر DBFS.
إشعار
يقوم Azure Databricks بتكوين موقع تخزين خاص منفصل للبيانات والتكوينات المستمرة في التخزين السحابي المملوك للعميل، والمعروف باسم DBFS الداخلي. لا يتعرض هذا الموقع للمستخدمين.
هام
بدءا من 6 مارس 2023، تستخدم مساحات عمل Azure Databricks الجديدة حسابات تخزين Azure Data Lake Storage Gen2 لجذر DBFS. تستخدم مساحات العمل التي تم توفيرها مسبقا Blob Storage.
تثقيف المستخدمين بعدم تخزين البيانات على جذر DBFS
نظرا لأن جذر DBFS يمكن الوصول إليه لجميع المستخدمين في مساحة العمل، يمكن لجميع المستخدمين الوصول إلى أي بيانات مخزنة هنا. من المهم توجيه المستخدمين لتجنب استخدام هذا الموقع لتخزين البيانات الحساسة. الموقع الافتراضي للجداول المدارة في Hive metastore على Azure Databricks هو جذر DBFS؛ لمنع المستخدمين النهائيين الذين يقومون بإنشاء جداول مدارة من الكتابة إلى جذر DBFS، قم بتعريف موقع على التخزين الخارجي عند إنشاء قواعد البيانات في Hive metastore.
تستخدم الجداول المدارة في كتالوج Unity موقع تخزين آمن بشكل افتراضي. توصي Databricks باستخدام كتالوج Unity للجداول المدارة.
استخدام تسجيل التدقيق لمراقبة النشاط
إشعار
للحصول على تفاصيل حول أحداث تدقيق DBFS، راجع أحداث DBFS.
تشفير بيانات جذر DBFS باستخدام مفتاح يديره العميل
يمكنك تشفير بيانات جذر DBFS باستخدام مفتاح يديره العميل. راجع المفاتيح المدارة من قبل العميل لجذر DBFS
هام
لا تقم بتعطيل Storage account key access
حساب التخزين الذي يدعم جذر DBFS. يؤدي تعطيل هذا الإعداد إلى سلوكيات وأخطاء غير متوقعة.