كيفية استيعاب البيانات باستخدام Azure Data Factory في Azure Cosmos DB ل PostgreSQL
ينطبق على: Azure Cosmos DB ل PostgreSQL (مدعوم بملحق قاعدة بيانات Citus إلى PostgreSQL)
Azure Data Factory هي خدمة تكامل البيانات وETL المستندة إلى السحابة. يسمح لك بإنشاء مهام سير عمل تعتمد على البيانات لنقل البيانات وتحويلها على نطاق واسع.
باستخدام Data Factory، يمكنك إنشاء وجدولة مهام سير العمل المستندة إلى البيانات (تسمى المسارات) التي استيعاب البيانات من مخازن البيانات المتباينة. يمكن تشغيل البنية الأساسية لبرنامج ربط العمليات التجارية محليا، في Azure، أو على موفري السحابة الآخرين للتحليات وإعداد التقارير.
يحتوي Data Factory على مصدر بيانات ل Azure Cosmos DB ل PostgreSQL. يسمح لك مصدر البيانات بإحضار بياناتك (علائقية، NoSQL، ملفات مستودع البيانات) إلى Azure Cosmos DB لجداول PostgreSQL للتخزين والمعالجة وإعداد التقارير.
هام
لا يدعم Data Factory نقاط النهاية الخاصة ل Azure Cosmos DB ل PostgreSQL في الوقت الحالي.
مصنع البيانات لاستيعاب في الوقت الحقيقي
فيما يلي الأسباب الرئيسية لاختيار Azure Data Factory لاستيعاب البيانات في Azure Cosmos DB ل PostgreSQL:
- سهل الاستخدام - يوفر بيئة مرئية خالية من التعليمات البرمجية لتنسيق حركة البيانات وأتمتتها.
- قوي - يستخدم السعة الكاملة للنطاق الترددي للشبكة الأساسية، ما يصل إلى 5 غيغابايت/ ثانية من معدل النقل.
- الموصلات المضمنة - تدمج جميع مصادر البيانات الخاصة بك، مع أكثر من 90 موصلا مضمنا.
- فعالة من حيث التكلفة - تدعم خدمة سحابية بدون خادم مدارة بالكامل للدفع أولا بأول والتي تتوسع حسب الطلب.
خطوات استخدام Data Factory
في هذه المقالة، يمكنك إنشاء مسار بيانات باستخدام واجهة مستخدم Data Factory (UI). ينسخ المسار في مصنع البيانات هذا البيانات من تخزين Azure Blob إلى قاعدة بيانات. للحصول على قائمة بمخازن البيانات المدعومة كمصادر ومتلقين، راجع جدول مخازن البيانات المدعومة.
في Data Factory، يمكنك استخدام نشاط النسخ لنسخ البيانات بين مخازن البيانات الموجودة في الموقع وفي السحابة إلى Azure Cosmos DB ل PostgreSQL. إذا كنت مستخدما جديدا لمصنع البيانات، فإليك دليل سريع حول كيفية البدء:
بمجرد توفير Data Factory، انتقل إلى مصنع البيانات الخاص بك وابدأ تشغيل Azure Data Factory Studio. ترى الصفحة الرئيسية Data Factory كما هو موضح في الصورة التالية:
في الصفحة الرئيسية ل Azure Data Factory Studio، حدد Orchestrate.
ضمن Properties، أدخل اسما للبنية الأساسية لبرنامج ربط العمليات التجارية.
في مربع أدوات الأنشطة، قم بتوسيع الفئة نقل وتحويل، واسحب نشاط نسخ البيانات وأفلته إلى سطح مصمم البنية الأساسية لبرنامج ربط العمليات التجارية. في أسفل جزء المصمم، في علامة التبويب عام ، أدخل اسما لنشاط النسخ.
تكوين المصدر.
في صفحة الأنشطة ، حدد علامة التبويب المصدر . حدد جديد لإنشاء مجموعة بيانات مصدر.
في مربع الحوار New Dataset ، حدد Azure Blob Storage، ثم حدد Continue.
اختر نوع تنسيق بياناتك، ثم حدد متابعة.
في صفحة Set properties ، ضمن Linked service، حدد New.
في صفحة خدمة مرتبطة جديدة، أدخل اسما للخدمة المرتبطة، وحدد حساب التخزين الخاص بك من قائمة اسم حساب التخزين.
ضمن Test connection، حدد To file path، وأدخل الحاوية والدليل للاتصال به، ثم حدد Test connection.
حدد Create لحفظ التكوين.
في شاشة تعيين الخصائص ، حدد موافق.
تكوين المتلقي.
في صفحة Activities ، حدد علامة التبويب Sink . حدد New لإنشاء مجموعة بيانات متلقي.
في المربع الحواري لمجموعة بيانات Azure الجديدة، حدد Azure Database لـPostgreSQL، ثم حدد متابعة.
في صفحة Set properties ، ضمن Linked service، حدد New.
في صفحة خدمة مرتبطة جديدة، أدخل اسما للخدمة المرتبطة، وحدد إدخال يدويا في طريقة تحديد الحساب.
أدخل اسم منسق نظام المجموعة في حقل اسم المجال المؤهل بالكامل. يمكنك نسخ اسم المنسق من صفحة نظرة عامة على Azure Cosmos DB لنظام مجموعة PostgreSQL.
اترك المنفذ الافتراضي 5432 في حقل المنفذ للاتصال المباشر بالمنسق أو استبدله بالمنفذ 6432 للاتصال بمنفذ PgBouncer المدار.
أدخل اسم قاعدة البيانات على نظام المجموعة الخاص بك وقدم بيانات الاعتماد للاتصال بها.
حدد SSL في القائمة المنسدلة لأسلوب التشفير.
حدد Test connection في أسفل اللوحة للتحقق من صحة تكوين المتلقي.
حدد Create لحفظ التكوين.
في شاشة تعيين الخصائص ، حدد موافق.
في علامة التبويب Sink في صفحة Activities ، حدد Open بجوار القائمة المنسدلة Sink dataset وحدد اسم الجدول على نظام المجموعة الوجهة حيث تريد استيعاب البيانات.
ضمن أسلوب الكتابة، حدد الأمر نسخ.
من شريط الأدوات أعلى اللوحة، حدد تحقق للتحقق من صحة إعدادات المسار. إصلاح أي أخطاء وإعادة التحقق من صحة وتأكد من التحقق من صحة البنية الأساسية لبرنامج ربط العمليات التجارية بنجاح.
حدد Debug من شريط الأدوات لتنفيذ البنية الأساسية لبرنامج ربط العمليات التجارية.
بمجرد تشغيل البنية الأساسية لبرنامج ربط العمليات التجارية بنجاح، في شريط الأدوات العلوي، حدد Publish all. ينشر هذا الإجراء الكيانات (مجموعات البيانات والتدفقات) التي أنشأتها من خلال مصنع البيانات.
استدعاء إجراء مخزن في Data Factory
في بعض السيناريوهات المحددة، قد تحتاج إلى استدعاء إجراء/وظيفة مخزنة لدفع البيانات المجمعة من الجدول المرحلي إلى جدول الملخص. لا يقدم Data Factory نشاط إجراء مخزنا ل Azure Cosmos DB ل PostgreSQL، ولكن كحل بديل يمكنك استخدام نشاط البحث مع استعلام لاستدعاء إجراء مخزن كما هو موضح أدناه:
الخطوات التالية
- تعرف على كيفية إنشاء لوحة معلومات في الوقت الحقيقي باستخدام Azure Cosmos DB ل PostgreSQL.
- تعرف على كيفية نقل حمل العمل إلى Azure Cosmos DB ل PostgreSQL