اختر تقنية تنسيق البنية الأساسية لبرنامج ربط العمليات التجارية للبيانات في Azure

تتكون معظم حلول البيانات الضخمة من عمليات معالجة بيانات متكررة مغلفة في مهام سير العمل. منظم خط التدفق هو أداة تساعد على أتمتة تدفقات العمل هذه. يمكن للمنسق جدولة الوظائف وتنفيذ مهام سير العمل وتنسيق التبعيات بين المهام.

ما هي الخيارات المتاحة أمامك لتنسيق خطوط تدفق البيانات؟

في Azure، ستلبي الخدمات والأدوات التالية المتطلبات الأساسية لتنسيق خطوط التدفق والتحكم في التدفق وحركة البيانات:

يمكن استخدام هذه الخدمات والأدوات بشكل مستقل عن بعضها البعض، أو استخدامها معاً لإنشاء حل مختلط. على سبيل المثال، يمكن لـ Integration Runtime (IR) في Azure Data Factory V2 تنفيذ حزم SSIS في بيئة حوسبة Azure مُدارة. على الرغم من وجود بعض التداخل في الوظائف بين هذه الخدمات، إلا إن هناك بعض الاختلافات الرئيسية.

معايير اختيار المفتاح

لتضييق الخيارات، ابدأ بالإجابة على هذه الأسئلة:

  • هل تحتاج إلى إمكانات البيانات الضخمة لنقل بياناتك وتحويلها؟ عادةً ما يعني هذا بيانات متعددة من غيغابايت إلى تيرابايت. إذا كانت الإجابة نعم، فحدد خياراتك حتى تكون أكثر ملاءمة للبيانات الضخمة.

  • هل تحتاج إلى خدمة مُدارة يمكن أن تعمل على نطاق واسع؟ إذا كانت الإجابة نعم، فحدد إحدى الخدمات المستندة إلى مجموعة النظراء والتي لا تقتصر على قوة المعالجة المحلية لديك.

  • هل توجد بعض مصادر البيانات الخاصة بك في أماكن العمل؟ إذا كانت الإجابة نعم، فابحث عن الخيارات التي يمكن أن تعمل مع كل من مصادر البيانات السحابية والمحلية أو الوجهات.

  • هل يتم تخزين بيانات المصدر في تخزين Blob على نظام ملفات HDFS؟ إذا كان الأمر كذلك، فحدد خياراً يدعم استعلامات Apache Hive.

مصفوفة الإمكانات

تلخص الجداول التالية الاختلافات الرئيسية في القدرات.

الإمكانات العامة

الإمكانية Azure Data Factory SQL Server Integration Services (SSIS) Oozie على HDInsight
مُدار ‏‏نعم‬ لا ‏‏نعم‬
المستند إلى السحابة ‏‏نعم‬ لا (محلي) ‏‏نعم‬
المتطلب الأساسي اشتراك Azure SQL Server اشتراك Azure، مجموعة HDInsight
أدوات الإدارة مدخل Microsoft Azure وPowerShell وCLI و.NET SDK Management Studio، بوويرشيل Bash shell، Oozie REST API، Oozie web UI
التسعير الدفع لكل استخدام الترخيص / الدفع مقابل الميزات لا توجد رسوم إضافية على تشغيل مجموعة HDInsight

قدرات خطوط التدفق

الإمكانية Azure Data Factory SQL Server Integration Services (SSIS) Oozie على HDInsight
نسخ البيانات ‏‏نعم‬ نعم ‏‏نعم‬
التحولات المخصصة ‏‏نعم‬ ‏‏نعم‬ نعم (وظائف MapReduce وPig Apache Hive)
سجل التعلم الآلي من Microsoft Azure ‏‏نعم‬ نعم (مع البرمجة النصية) لا
HDInsight عند الطلب ‏‏نعم‬ لا لا
Azure Batch ‏‏نعم‬ لا لا
Pig, Apache Hive, MapReduce ‏‏نعم‬ لا ‏‏نعم‬
Spark ‏‏نعم‬ لا لا
تنفيذ حزمة SSIS ‏‏نعم‬ نعم لا
تدفق التحكم ‏‏نعم‬ نعم ‏‏نعم‬
الوصول إلى بيانات محلية ‏‏نعم‬ نعم لا

قدرات قابلية التوسع

الإمكانية Azure Data Factory SQL Server Integration Services (SSIS) Oozie على HDInsight
تكبير الحجم ‏‏نعم‬ لا لا
التوسيع ‏‏نعم‬ لا نعم (عن طريق إضافة عقد عاملة إلى نظام المجموعة)
الأمثل للبيانات الضخمة ‏‏نعم‬ لا ‏‏نعم‬

المساهمون

تحتفظ Microsoft بهذه المقالة. وهي مكتوبة في الأصل من قبل المساهمين التاليين.

الكاتب الرئيسي:

الخطوات التالية