استيعاب البيانات في مستودع Databricks

يوفر Azure Databricks طرقا مختلفة لاستيعاب البيانات من مصادر مختلفة في بحيرة مدعومة من Delta Lake. تسرد هذه المقالة مصادر البيانات وتوفر ارتباطات إلى خطوات لاستيعاب البيانات من كل نوع مصدر.

تخزين كائن سحابي

للتعرف على كيفية تكوين الاستيعاب التزايدي من تخزين كائن السحابة، راجع استيعاب البيانات من تخزين كائن السحابة.

LakeFlow Connect

يوفر Databricks LakeFlow Connect موصلات أصلية لاستيعابها من تطبيقات المؤسسة وقواعد البيانات. يتم التحكم في البنية الأساسية لبرنامج ربط العمليات التجارية الناتجة عن الاستيعاب بواسطة كتالوج Unity ويتم تشغيلها بواسطة حساب بلا خادم وجداول Delta Live.

يستفيد LakeFlow Connect من عمليات القراءة والكتابة التزايدية الفعالة لجعل استيعاب البيانات أسرع وأكثر قابلية للتطوير وأكثر كفاءة من حيث التكلفة، بينما تظل بياناتك حديثة لاستهلاك انتقال البيانات من الخادم.

مصادر الدفق

يمكن دمج Azure Databricks مع خدمات مراسلة الدفق لاستيعاب البيانات في الوقت الفعلي تقريبا في مستودع. راجع البث والاستيعاب التزايدي.

ملفات البيانات المحلية

يمكنك تحميل ملفات البيانات المحلية بأمان أو تنزيل الملفات من عنوان URL عام. راجع تحميل الملفات إلى Azure Databricks.

ترحيل البيانات إلى Delta Lake

لمعرفة كيفية ترحيل البيانات الموجودة إلى Delta Lake، راجع ترحيل البيانات إلى Delta Lake.