نظرة عامة حول مصادر البيانات
لتكوين Dynamics 365 Customer Insights - Data، قم أولاً بإحضار بيانات المصدر للمعالجة. يوفر Customer Insights - Data عدة أنواع من موصلات البيانات للاتصال بالبيانات واستيعابها من مجموعة واسعة من المصادر.
توضح هذه المقالة الخيارات التي يمكن أن تؤثر على أداء استيعاب البيانات.
تنسيق Delta
يعد تنسيق بيانات Delta هو تنسيق المعالجة الأصلي الذي يستخدمه Customer Insights – Data. إذا كان بإمكانك توفير بيانات المصدر بتنسيق Delta، فهناك العديد من المزايا.
- كفاءة أفضل مع Customer Insights - Data: يتم استخدام تنسيق Delta داخليًا بواسطة Customer Insights - Data.
- استيعاب أسرع للبيانات: يوفر تنسيق Delta ضغطًا فائقًا لنقل البيانات بشكل أسرع.
- توحيد أسرع: باستخدام ميزة Delta للوقت والسفر، يقوم Customer Insights – Data فقط البيانات التي تم تغييرها بدلاً من إعادة معالجة مجموعة البيانات بأكملها. يتطلب التوحيد المتزايد أن تكون جميع مدخلات البيانات بتنسيق Delta.
- الحد من مشكلات تلف البيانات: يقلل من الأقسام التالفة ومشكلات تلف البيانات الشائعة الناتجة عن التنسيقات القديمة مثل CSV.
- تصميم أكثر موثوقية لإدارة البيانات: لا يتطلب تنسيق Delta تحديثات يدوية للبيانات والمخططات وملفات الأقسام.
- صحة بيانات أعلى: يوفر تنسيق Delta معاملات الذرية والاتساق والعزل والمتانة (ACID) ومستويات العزل في Spark.
يمكنك استخدام تنسيق Delta مع الموصلات التالية:
Delta هو مصطلح تم تقديمه مع Delta Lake، وهو الأساس لتخزين البيانات والجداول في Databricks Lakehouse Platform. Delta Lake عبارة عن طبقة تخزين مفتوحة المصدر توفر معاملات ACID (الذرية والاتساق والعزل والمتانة) لأحمال عمل البيانات الضخمة. لمزيد من المعلومات، راجع صفحة وثائق Delta Lake.
استيراد أو إرفاق مصدر البيانات المرفق
أحد الاعتبارات الأساسية عند اختيار كيفية استيعاب بياناتك هو ما إذا كان الموصل متصلاً بالبيانات أو يقوم بعمل نسخ من البيانات. يوصي Customer Insights - Data بالإرفاق بالبيانات لأنه يتم الوصول إلى البيانات مباشرة عندما يحين وقت معالجتها. يؤدي نسخ البيانات إلى حدوث تأخيرات عند تحديث البيانات.
يتم إرفاق موصلات البيانات التالية ببياناتك.
- جداول Delta لـ Azure Data Lake
- Azure Data Lake Storageجداول نماذج البيانات العامة
- Microsoft Dataverse
- Azure Synapse Analytics (إصدار أولي)
إذا لم تتمكن من استخدام أحد الموصلات المرفقة، فانسخ البيانات باستخدام أحد موصلات Power Query. يوفر Power Query طريقة مفيدة لتحويل البيانات.
تعريف البيانات
عند استيعاب البيانات، يقوم Customer Insights – Data بتنفيذ بعض ملفات تعريف البيانات الأساسية مثل تكرار القيم المتكررة في العمود. يمكنك استخدام بيانات ملف التعريف لفهم بياناتك ومعالجة المشكلات. على سبيل المثال، إذا كنت تقوم بالمطابقة في عمود الاسم الكامل، فيمكن أن يساعدك ملف تعريف البيانات في اكتشاف ظهور القيمة الافتراضية "أدخل اسمك" في 10 آلاف صف. قد تؤدي مطابقة هذه القيمة إلى تطابق 10 آلاف من الصفوف مع ما لا ينبغي أن تتطابق. يمكنك تمكين ملفات تعريف البيانات لمزيد من الأعمدة عند إضافة Azure Data Lake أو جداول Delta أو مصادر بيانات Azure Synapse.
بعد استيعاب البيانات، قم بعرض نتائج تصنيف البيانات:
انتقل إلى البيانات>الجداول وحدد جدولاً. حدد الرمز الملخص لحقل، مثل DateOfBirth.
اعرض تفاصيل أي أخطاء أو قيم مفقودة.
صفحة مصادر البيانات
تسرد صفحة مصادر البيانات مصادر البيانات في ثلاثة أقسام:
- مُدار بواسطتي: تدفقات بيانات Power Platform التي أنشأتها أنت وتديرها أنت فقط. يمكن للمستخدمين الآخرين فقط عرض تدفقات البيانات هذه ولكن لا يمكنهم تحريرها أو تحديثها أو حذفها.
- يديره آخرون: تدفقات بيانات Power Platform التي تم إنشاؤها بواسطة مسؤولين آخرين. يمكنك عرضها فقط. تسرد مالك تدفق البيانات للاتصال به للحصول على أية مساعدة.
ملاحظة
يمكن عرض جميع الجداول واستخدامها من قبل مستخدمين آخرين. على الرغم من أن مصادر البيانات مملوكة للمستخدم الذي قام بإنشائها، إلا أن الجداول الناتجة من استيعاب البيانات يمكن استخدامها بواسطة كل مستخدم Customer Insights - Data.