وحدات التخزين المدارة مقابل وحدات التخزين الخارجية
تتناول هذه المقالة الاختلافات بين وحدات التخزين المدارة ووحدات التخزين الخارجية وأسباب اختيار استخدام وحدات التخزين الخارجية. توصي Databricks بوحدات التخزين المدارة كحل أبسط لتخزين وإدارة الوصول إلى البيانات غير الجدولية.
لمزيد من الإرشادات حول استخدام كتالوج Unity لتكوين الوصول إلى تخزين الكائنات السحابية، راجع الاتصال بتخزين كائن السحابة باستخدام كتالوج Unity.
اختلافات السلوك بين وحدات التخزين المدارة والخارجية
توفر وحدات التخزين المدارة والخارجية تجارب متطابقة تقريبا عند استخدام أدوات Azure Databricks وواجهات برمجة التطبيقات وواجهات برمجة التطبيقات. فيما يلي الاختلافات بين أنواع وحدات التخزين هذه.
توفر وحدات التخزين المدارة تجربة تخزين مدارة بالكامل. وهذا يعني ما يلي:
- يجب أن تمر جميع التفاعلات مع الملفات في وحدات التخزين المدارة من خلال كتالوج Unity.
- تتم إدارة تسمية الدليل وتخطيط البيانات بواسطة كتالوج Unity. تتضمن أسماء الدلائل تجزئات لتجنب التعارضات في حسابات تخزين الكائنات السحابية الأساسية.
- عند إسقاط وحدة تخزين مدارة، يحذف Azure Databricks البيانات الأساسية في غضون 30 يوما.
تجلب وحدات التخزين الخارجية حوكمة البيانات إلى تخزين الكائنات السحابية. وهذا يعني ما يلي:
- يمكنك استخدام عناوين URL السحابية في Azure Databricks أو الأنظمة الخارجية للتفاعل مع الملفات في وحدات التخزين الخارجية.
- جميع الدلائل التي تم إنشاؤها داخل وحدة تخزين خارجية أو ملفات تم تحميلها نسبة إلى
LOCATION
المحدد عند الإنشاء. - عند إسقاط وحدة تخزين خارجية، يمكنك إزالة وحدة التخزين من كتالوج Unity ولكن البيانات الأساسية تظل دون تغيير في الموقع الخارجي.
لماذا تستخدم وحدات التخزين الخارجية؟
تسمح لك وحدات التخزين الخارجية بإضافة إدارة بيانات كتالوج Unity إلى دلائل تخزين الكائنات السحابية الموجودة. تتضمن بعض حالات الاستخدام لوحدات التخزين الخارجية ما يلي:
- إضافة الحوكمة إلى ملفات البيانات دون ترحيل.
- تحكم الملفات التي تنتجها أنظمة أخرى يجب استيعابها أو الوصول إليها بواسطة Azure Databricks.
- تحكم البيانات التي تنتجها Azure Databricks والتي يجب الوصول إليها مباشرة من تخزين الكائنات السحابية بواسطة أنظمة أخرى.
توصي Databricks باستخدام وحدات التخزين الخارجية لتخزين ملفات البيانات غير الجدولية التي تقرأها أو تكتبها الأنظمة الخارجية بالإضافة إلى Azure Databricks. لا يحكم كتالوج Unity عمليات القراءة والكتابة التي يتم إجراؤها مباشرة مقابل تخزين كائن السحابة من الأنظمة الخارجية، لذلك يجب عليك تكوين نهج وبيانات اعتماد إضافية في حساب السحابة الخاص بك لضمان احترام نهج إدارة البيانات خارج Azure Databricks.