الاتصال بمصادر البيانات
توفر هذه المقالة توصيات تم إبداء الرأي بشأن كيفية قيام المسؤولين ومستخدمي الطاقة الآخرين بتكوين الاتصالات بين Azure Databricks ومصادر البيانات. إذا كنت تحاول تحديد ما إذا كان لديك حق الوصول لقراءة البيانات من نظام خارجي، فابدأ بمراجعة البيانات التي لديك حق الوصول إليها في مساحة العمل الخاصة بك. راجع اكتشاف البيانات.
ملاحظة
للحصول على معلومات حول الاتصال بالخدمات الخارجية التي ليست بالضرورة مصادر بيانات، راجع إدارة الوصول إلى الخدمات السحابية الخارجية باستخدام بيانات اعتماد الخدمة.
يمكنك توصيل حساب Azure Databricks بمصادر البيانات مثل تخزين الكائنات السحابية وأنظمة إدارة قواعد البيانات الارتباطية وخدمات البيانات المتدفقة والأنظمة الأساسية للمؤسسات مثل CRMs. تعتمد الامتيازات المحددة المطلوبة لتكوين الاتصالات على مصدر البيانات وكيفية تكوين الأذونات في مساحة عمل Azure Databricks والأذونات المطلوبة للتفاعل مع البيانات في المصدر ونموذج إدارة البيانات وطريقتك المفضلة للاتصال.
تتطلب معظم الأساليب امتيازات مرتفعة على كل من مصدر البيانات ومساحة عمل Azure Databricks لتكوين الأذونات الضرورية لدمج الأنظمة. يجب على المستخدمين الذين ليس لديهم هذه الأذونات طلب المساعدة. راجع طلب الوصول إلى مصادر البيانات.
يوفر تخزين الكائنات السحابية الأساس لتخزين معظم البيانات على Azure Databricks. لمعرفة المزيد حول تخزين الكائنات السحابية ومكان تخزين Azure Databricks للبيانات، راجع أين يكتب Azure Databricks البيانات؟.
توصي Databricks باستخدام كتالوج Unity لتكوين الوصول إلى تخزين كائن السحابة. يوفر كتالوج Unity إدارة البيانات لكل من البيانات المنظمة وغير المنظمة في تخزين الكائنات السحابية. راجع الاتصال بمساحة تخزين الكائنات السحابية والخدمات باستخدام كتالوج Unity.
يجب على العملاء الذين لا يستخدمون كتالوج Unity تكوين الاتصالات باستخدام الأساليب القديمة. راجع تكوين الوصول إلى تخزين كائن السحابة ل Azure Databricks.
لتكوين الشبكات إلى تخزين الكائنات السحابية، راجع الشبكات.
توصي Databricks بعدة خيارات لتكوين الاتصالات بأنظمة البيانات الخارجية وفقا لاحتياجاتك. يوفر الجدول التالي نظرة عامة عالية المستوى على هذه الخيارات:
خيار | الوصف |
---|---|
Lakehouse Federation | يوفر الوصول للقراءة فقط إلى البيانات في أنظمة بيانات المؤسسة. يتم تكوين الاتصالات من خلال كتالوج Unity على مستوى الكتالوج أو المخطط، ومزامنة جداول متعددة مع تكوين واحد. راجع ما هو Lakehouse Federation؟. |
اتصال الشريك | الاستفادة من حلول شركاء التكنولوجيا للاتصال بمصادر البيانات الخارجية وأتمتة استيعاب البيانات إلى lakehouse. تتضمن بعض الحلول أيضا ETL العكسي والوصول المباشر إلى بيانات مستودع البيانات من الأنظمة الخارجية. راجع ما هو اتصال شريك Databricks؟ |
Drivers | يتضمن Azure Databricks برامج تشغيل لأنظمة البيانات الخارجية في كل وقت تشغيل Databricks. يمكنك اختياريا تثبيت برامج تشغيل الجهات الخارجية للوصول إلى البيانات في أنظمة أخرى. يجب تكوين الاتصالات لكل جدول. تتضمن بعض برامج التشغيل الوصول للكتابة. راجع الاتصال بالأنظمة الخارجية. |
JDBC | تعتمد العديد من برامج التشغيل المضمنة للأنظمة الخارجية على دعم JDBC الأصلي، ويوفر خيار JDBC خيارات قابلة للتوسيع لتكوين الاتصالات بالأنظمة الأخرى. يجب تكوين الاتصالات لكل جدول. راجع قواعد بيانات الاستعلام باستخدام JDBC. |
يوفر Azure Databricks موصلات محسنة للعديد من أنظمة بيانات الدفق.
بالنسبة لجميع مصادر بيانات الدفق، يجب إنشاء بيانات اعتماد توفر الوصول وتحميل بيانات الاعتماد هذه في Azure Databricks. توصي Databricks بتخزين بيانات الاعتماد باستخدام الأسرار، لأنه يمكنك استخدام البيانات السرية لجميع خيارات التكوين وفي جميع أوضاع الوصول.
تدعم جميع موصلات البيانات لمصادر الدفق تمرير بيانات الاعتماد باستخدام الخيارات عند تعريف استعلامات الدفق. راجع تكوين مصادر بيانات الدفق.
في العديد من المؤسسات، لا يملك معظم المستخدمين امتيازات كافية على Azure Databricks أو مصادر البيانات الخارجية لتكوين اتصالات البيانات.
ربما تكون مؤسستك قد قامت بالفعل بتكوين الوصول إلى مصدر بيانات باستخدام أحد الأنماط الموضحة في المقالات المرتبطة من هذه الصفحة. إذا كانت مؤسستك لديها عملية محددة جيدا لطلب الوصول إلى البيانات، توصي Databricks باتباع هذه العملية.
إذا لم تكن متأكدا من كيفية الوصول إلى مصدر بيانات، فقد يساعدك هذا الإجراء على:
- استخدم مستكشف الكتالوج لعرض الجداول ووحدات التخزين التي يمكنك الوصول إليها. راجع ما هو مستكشف الكتالوج؟.
- اسأل زملائك في الفريق أو المديرين عن مصادر البيانات التي يمكنهم الوصول إليها.
- تستخدم معظم المؤسسات المجموعات التي تمت مزامنتها من موفر الهوية (على سبيل المثال: Okta أو Microsoft Entra ID) لإدارة الأذونات لمستخدمي مساحة العمل. إذا كان بإمكان أعضاء فريقك الآخرين الوصول إلى مصادر البيانات التي تحتاج إلى الوصول إليها، فاعمل على أن يضيفك مسؤول مساحة العمل إلى المجموعة الصحيحة لمنحك حق الوصول.
- إذا تم تكوين جدول أو وحدة تخزين أو مصدر بيانات معين بواسطة زميل في العمل، يجب أن يكون لدى هذا الشخص أذونات لمنحك حق الوصول إلى البيانات.
- تقوم بعض المؤسسات بتكوين أذونات الوصول إلى البيانات من خلال الإعدادات على مجموعات الحوسبة ومستودعات SQL.
- يمكن أن يختلف الوصول إلى مصادر البيانات حسب الحساب.
- يمكنك عرض منشئ الحوسبة على علامة التبويب Compute . تواصل مع المنشئ للسؤال عن مصادر البيانات التي يجب الوصول إليها.