استخدام Azure Data Factory لترحيل البيانات من مستودع البيانات إلى Azure

ينطبق على:Azure Data Factory Azure Synapse Analytics

تلميح

جرب Data Factory في Microsoft Fabric، وهو حل تحليلي متكامل للمؤسسات. يغطي Microsoft Fabric كل شيء بدءا من حركة البيانات إلى علم البيانات والتحليلات في الوقت الحقيقي والمعلومات المهنية وإعداد التقارير. تعرف على كيفية بدء إصدار تجريبي جديد مجانا!

إذا كنت ترغب في ترحيل بحيرة البيانات أو مستودع بيانات المؤسسة (EDW) إلى Microsoft Azure، ففكر في استخدام Azure Data Factory. إن Azure Data Factory مناسباً تماماً للسيناريوهات التالية:

  • ترحيل حمل العمل للبيانات الضخمة من Amazon Simple Storage Service (Amazon S3) أو Hadoop Distributed File System (HDFS) المحلي إلى Azure
  • ترحيل مستودع بيانات المؤسسة من Oracle Exadata، أو Netezza، أو Amazon Redshift إلى Azure

يمكن لـ Azure Data Factory نقل بيتابايت (PB) من البيانات لترحيل مستودع البيانات، وعشرات تيرابايت (TB) من البيانات لترحيل مستودع البيانات.

لماذا يمكن استخدام Azure Data Factory لترحيل البيانات

  • يمكن لـ Azure Data Factory زيادة قوة المعالجة بسهولة لنقل البيانات بلا خادم مع أداء عالٍ ومرونة وقابلية للتوسع. وتدفع فقط مقابل ما تستخدمه. لاحظ أيضا ما يلي:
    • لا توجد قيود على Azure Data Factory بالنسبة لحجم البيانات أو عدد الملفات.
    • يمكن لـ Azure Data Factory استخدام النطاق الترددي للشبكة والتخزين بشكل كامل لتحقيق أكبر حجم لمعدل نقل البيانات في بيئتك.
    • يستخدم Azure Data Factory طريقة الدفع أولاً بأول، بحيث تدفع فقط مقابل الوقت الذي تستخدمه بالفعل لتشغيل ترحيل البيانات إلى Azure.
  • يمكن أن يقوم Azure Data Factory بإجراء كل من تحميل سجل المحفوظات لمرة واحدة والأحمال المتزايدة المجدولة.
  • يقوم Azure Data Factory باستخدام Azure integration runtime (IR) لنقل البيانات بين نقاط نهاية بحيرة البيانات والمستودع المتاحين للوصول العام. كما يمكنه استخدام وقت تشغيل التكامل المستضاف ذاتياً لنقل البيانات لنقاط نهاية بحيرة البيانات والمستودع داخل شبكة Azure الظاهرية (VNet) أو خلف جدار حماية.
  • يحتوي Azure Data Factory على أمان على مستوى المؤسسة: يمكنك استخدام Windows Installer (MSI) أو هوية الخدمة لتكامل مؤمن من خدمة إلى خدمة، أو استخدام Azure Key Vault لإدارة بيانات الاعتماد.
  • يوفر Azure Data Factory تجربة تأليف دون تعليمات برمجية ولوحة معلومات مراقبة غنية ومضمنة. 

ترحيل البيانات عبر الإنترنت مقابل ترحيل البيانات دون الاتصال بالإنترنت

يعد Azure Data Factory أداة قياسية لترحيل البيانات عبر الإنترنت لنقل البيانات عبر شبكة (إنترنت أو ER أو VPN). بينما مع ترحيل البيانات دون اتصال بالإنترنت، يقوم المستخدمون بشحن أجهزة نقل البيانات فعلياً من مؤسستهم إلى مركز بيانات Azure.

هناك ثلاثة اعتبارات رئيسية عند الاختيار بين نهج الترحيل عبر الإنترنت والترحيل دون الاتصال بالإنترنت:

  • حجم البيانات المطلوب ترحيلها
  • النطاق الترددي للشبكة
  • الفترة الزمنية للترحيل

على سبيل المثال، افترض أنك تخطط لاستخدام Azure Data Factory لإكمال ترحيل بياناتك في غضون أسبوعين (الفترة الزمنية للترحيل). لاحظ خط القطع الوردي/الأزرق في الجدول التالي. تعرض الخلية الوردية الأدنى لأي عمود معين اقتران النطاق الترددي لحجم البيانات/الشبكة الذي تكون فترة الترحيل فيه هي الأقرب ولكن أقل من أسبوعين. (أي اقتران حجم/النطاق الترددي في خلية زرقاء له فترة ترحيل عبر الإنترنت تزيد عن أسبوعين.)

online vs. offline يساعدك هذا الجدول على تحديد ما إذا كان يمكنك تلبية نافذة الترحيل المقصودة من خلال الترحيل عبر الإنترنت (Azure Data Factory) استنادا إلى حجم بياناتك وعرض النطاق الترددي للشبكة المتوفرة. إذا كانت فترة الترحيل عبر الإنترنت أكثر من أسبوعين، فستحتاج إلى استخدام الترحيل دون اتصال بالإنترنت.

إشعار

باستخدام الترحيل عبر الإنترنت، يمكنك تحقيق كل من تحميل بيانات سجل المحفوظات والموجزات المتزايدة من نهاية إلى نهاية من خلال أداة واحدة. من خلال هذا النهج، يمكن أن تظل بياناتك متزامنة بين المخزن الحالي والمخزن الجديد أثناء فترة الترحيل بأكملها. وهذا يعني أنك تستطيع إعادة إنشاء منطق ETL الخاص بك على المخزن الجديد ببيانات محدثة.