نسخ كائنات متعددة نسخا متماثلا من SAP عبر SAP CDC

ينطبق على:Azure Data Factory Azure Synapse Analytics

تلميح

جرب Data Factory في Microsoft Fabric، وهو حل تحليلي متكامل للمؤسسات. يغطي Microsoft Fabric كل شيء بدءا من حركة البيانات إلى علم البيانات والتحليلات في الوقت الحقيقي والمعلومات المهنية وإعداد التقارير. تعرف على كيفية بدء إصدار تجريبي جديد مجانا!

توضح هذه المقالة قالب حل يمكنك استخدامه لنسخ كائنات ODP متعددة من SAP عبر موصل SAP CDC إلى Azure Data Lake Gen2 بتنسيق Delta مع قسم المفتاح.

حول قالب الحل هذا

يقرأ هذا القالب ملف تحكم خارجي بتنسيق json على مخزن التخزين الخاص بك، والذي يحتوي على سياقات SAP ODP وعناصر SAP ODP والأعمدة الرئيسية من نظام مصدر SAP بالإضافة إلى الحاويات والمجلدات والأقسام من مخزن وجهة Azure Data Lake Gen2. ثم ينسخ كل عنصر من عناصر SAP ODP من نظام SAP إلى Azure Data Lake Gen2 بتنسيق Delta.

يحتوي القالب على ثلاثة أنشطة:

  • يسترد البحث قائمة كائنات SAP ODP ليتم تحميلها ومسار مخزن الوجهة من ملف تحكم خارجي على مخزن Azure Data Lake Gen2.
  • يحصل ForEach على قائمة عناصر SAP ODP من نشاط البحث ويكرر كل كائن إلى نشاط تعيين تدفق البيانات.
  • ينسخ تعيين تدفق البيانات كل كائن SAP ODP من نظام SAP إلى Azure Data Lake Gen2 بتنسيق Delta. سيقوم بالتحميل الكامل الأولي في التشغيل الأول ثم يقوم بالتحميل التزايدي في عمليات التشغيل اللاحقة تلقائيا. سيقوم بدمج التغييرات في Azure Data Lake Gen2 بتنسيق Delta.

مطلوب ملف تحكم خارجي بتنسيق json في هذا القالب. مخطط ملف التحكم كما هو موضح أدناه.

  • checkPointKey هو مفتاحك المخصص لإدارة نقطة التحقق لتسجيل البيانات التي تم تغييرها في ADF. يمكنك الحصول على مزيد من التفاصيل هنا.
  • sapContext هو سياق SAP ODP الخاص بك من نظام SAP المصدر. يمكنك الحصول على مزيد من التفاصيل هنا.
  • sapObjectName هو اسم كائن SAP ODP ليتم تحميله من نظام SAP. يمكنك الحصول على مزيد من التفاصيل هنا.
  • sapRunMode هو تحديد كيفية تحميل كائن SAP. يمكن أن يكون fullLoad أو incrementalLoad أو fullAndIncrementalLoad.
  • sapKeyColumns هي أسماء أعمدة المفاتيح الخاصة بك من كائنات SAP ODP المستخدمة للقيام ب dedupe في تعيين تدفق البيانات.
  • sapPartitions هي قائمة بشروط القسم التي تؤدي إلى عمليات استخراج منفصلة في نظام SAP المتصل.
  • deltaContainer هو اسم الحاوية في Azure Data Lake Gen2 كمخزن الوجهة.
  • deltaFolder هو اسم المجلد الخاص بك في Azure Data Lake Gen2 كمخزن الوجهة.
  • deltaKeyColumns هي الأعمدة المستخدمة لتحديد ما إذا كان صف من المصدر يطابق صفا من المتلقي عندما تريد تحديث صف أو حذفه.
  • deltaPartition هو العمود المستخدم لإنشاء أقسام لكل قيمة فريدة في مثل هذا العمود لكتابة البيانات بتنسيق Delta على Azure Data Lake Gen2 عبر مجموعة Spark المستخدمة من قبل تعيين تدفق البيانات. يمكنك الحصول على مزيد من التفاصيل هنا

يوجد نموذج لملف التحكم كما يلي:

[
  {
    "checkPointKey":"CheckPointFor_ZPERFCDPOS$F",
    "sapContext": "ABAP_CDS",
    "sapObjectName": "ZPERFCDPOS$F",
    "sapRunMode": "fullAndIncrementalLoad",
    "sapKeyColumns": [
      "TABKEY"
    ],
    "sapPartitions": [
	[{
        "fieldName": "TEXTCASE",
        "sign": "I",
        "option": "EQ",
        "low": "1"
       },
       {
        "fieldName": "TEXTCASE",
        "sign": "I",
        "option": "EQ",
        "low": "X"
      }]
    ],
    "deltaContainer":"delta",
    "deltaFolder":"ZPERFCDPOS",
    "deltaKeyColumns":["TABKEY"],
    "deltaPartition":"TEXTCASE",
    "stagingStorageFolder":"stagingcontainer/stagingfolder"
  },
  {
    "checkPointKey":"CheckPointFor_Z0131",
    "sapContext": "SAPI",
    "sapObjectName": "Z0131",
    "sapRunMode": "incrementalLoad",
    "sapKeyColumns": [
      "ID"
    ],
    "sapPartitions": [],
    "deltaContainer":"delta",
    "deltaFolder":"Z0131",
    "deltaKeyColumns":["ID"],
    "deltaPartition":"COMPANY",
    "stagingStorageFolder":"stagingcontainer/stagingfolder"
  }
]

كيفية استخدام قالب الحل هذا

  1. إنشاء ملف تحكم وتحميله بتنسيق json إلى Azure Data Lake Gen2 كمخزن الوجهة. الحاوية الافتراضية لتخزين ملف التحكم هي العرض التوضيحي واسم ملف التحكم الافتراضي هو SapToDeltaParameters.json.

  2. انتقل إلى قالب Replicate multiple tables from SAP ODP إلى Azure Data Lake Storage Gen2 بتنسيق Delta وانقر فوقه .

    Screenshot of SAP CDC search template.

  3. انقر فوق متابعة وأدخل الخدمة المرتبطة المتصلة بنظام SAP كمصدر، والخدمة المرتبطة المتصلة ب Azure Data Lake Gen2 كوجهة. يمكنك الحصول على مزيد من التفاصيل حول خدمة SAP CDC المرتبطة من هنا. يجب أن تدرك أنه يجب تحميل ملف التحكم الخارجي الخاص بك إلى نفس الحساب من Azure Data Lake Gen2.

    Screenshot of SAP CDC use template.

  4. انقر فوق استخدام هذا القالب وسترى أن البنية الأساسية لبرنامج ربط العمليات التجارية جاهزة للاستخدام.

    Screenshot of SAP CDC pipeline.