ملاحظة
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تسجيل الدخول أو تغيير الدلائل.
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تغيير الدلائل.
هذه المقالة هي الجزء الأول من سلسلة الأجزاء السبعة التي توفر إرشادات حول كيفية الترحيل من Netezza إلى Azure Synapse Analytics. ينصب تركيز هذه المقالة على أفضل الممارسات الخاصة بالتصميم والأداء.
نظرة عامة
نظرًا لتكلفة وتعقيد الحفاظ على بيئات Oracle المحلية القديمة وترقيتها، يرغب العديد من مستخدمي Oracle الحاليين في الاستفادة من الابتكارات التي توفرها البيئات السحابية الحديثة. تتيح لك البيئات السحابية لخدمة تأجير البنية التحتية (IaaS) والنظام الأساسي كخدمة (PaaS) تفويض مهام مثل صيانة البنية الأساسية وتطوير النظام الأساسي إلى موفر السحابة.
تلميح
أكثر من مجرد قاعدة بيانات - تتضمن بيئة Azure مجموعة شاملة من القدرات والأدوات.
على الرغم من أن Oracle وAzure Synapse Analytics هما قاعدة بيانات SQL التي تستخدم تقنيات المعالجة المتوازية على نطاق واسع (MPP) لتحقيق أداء استعلام عال على وحدات تخزين البيانات الكبيرة بشكل استثنائي، هناك بعض الاختلافات الأساسية في النهج:
غالبًا ما يتم تثبيت أنظمة Oracle القديمة محليًا وتستخدم أجهزة غالية نسبيًا، بينما يعتمد Azure Synapse على السحابة ويستخدم Azure Storage وموارد الحوسبة.
تعد ترقية تكوين Oracle مهمة رئيسية تتضمن أجهزة مادية إضافية وربما إعادة تكوين قاعدة بيانات طويلة، أو تفريغ وإعادة تحميل. نظرًا لأن موارد التخزين والحساب منفصلة في بيئة Azure ولديها قدرة تحجيم مرنة، يمكنك تحجيم هذه الموارد صعودًا أو هبوطًا بشكل مستقل.
يمكنك إيقاف Azure Synapse مؤقتًا أو تغيير حجمه حسب الحاجة لتقليل استخدام الموارد والتكلفة.
Microsoft Azure هي بيئة سحابية متاحة عالميًا وآمنة للغاية وقابلة للتطوير تتضمن Azure Synapse والنظام البنائي من الأدوات والقدرات الداعمة. يلخص الرسم التخطيطي التالي النظام البيئي Azure Synapse.
يوفر Azure Synapse أفضل أداء لقاعدة البيانات الارتباطية باستخدام تقنيات مثل MPP والتخزين المؤقت التلقائي في الذاكرة. يمكنك رؤية نتائج هذه الأساليب في معايير مستقلة مثل تلك التي تم تشغيلها مؤخرًا بواسطة GigaOm، والذي يقارن Azure Synapse بعروض مستودع البيانات السحابية الشائعة الأخرى. يرى العملاء الذين يقومون بالترحيل إلى بيئة Azure Synapse العديد من الفوائد، بما في ذلك:
تحسين الأداء والسعر/الأداء.
زيادة سرعة الحركة ووقت أقصر للقيمة.
نشر أسرع للخادم وتطوير التطبيقات.
قابلية التوسع المرنة - تدفع فقط مقابل الاستخدام الفعلي.
تحسين الأمان/التوافق.
انخفاض تكاليف التخزين والإصلاح بعد كارثة.
انخفاض إجمالي التكلفة الإجمالية للتكلفة، والتحكم في التكلفة بشكل أفضل، والنفقات التشغيلية المبسطة (OPEX).
لتحقيق أقصى قدر من هذه الفوائد، قم بترحيل البيانات والتطبيقات الجديدة أو الموجودة إلى النظام الأساسي Azure Synapse. في العديد من المؤسسات، يتضمن الترحيل نقل مستودع بيانات موجود من نظام أساسي محلي قديم، مثل Oracle، إلى Azure Synapse. على مستوى عالٍ، يتضمن الترحيل الخطوات التالية:
الإعداد 🡆
تعريف النطاق - ما الذي سيتم ترحيله.
إنشاء مخزون بيانات وعمليات للترحيل.
تعريف تغييرات نموذج البيانات (إن وجدت).
تعريف آلية استخراج بيانات المصدر.
حدد أدوات وميزات Azure والجهات الخارجية المناسبة لاستخدامها.
تدريب الموظفين في وقت مبكر على النظام الأساسي الجديد.
إعداد نظام Azure الأساسي المستهدف.
الترحيل 🡆
ابدأ صغيرًا وبسيطًا.
أتمتة حيثما أمكن ذلك.
استفد من الأدوات والميزات المضمنة في Azure لتقليل جهود الترحيل.
ترحيل بيانات التعريف للجداول وطرق العرض.
ترحيل البيانات التاريخية للاحتفاظ بها.
ترحيل الإجراءات المخزنة والعمليات التجارية أو إعادة بناء التعليمات البرمجية لها.
ترحيل أو إعادة بناء التعليمات البرمجية لعمليات التحميل الإضافي ETL / ELT.
ما بعد الترحيل
مراقبة وتوثيق جميع مراحل العملية.
استخدم التجربة المكتسبة لإنشاء قالب للترحيلات المستقبلية.
إعادة تصميم نموذج البيانات إذا لزم الأمر (باستخدام أداء النظام الأساسي الجديد وقابلية التوسع).
اختبار التطبيقات وأدوات الاستعلام.
قياس أداء الاستعلام وتحسينه.
توفر هذه المقالة معلومات وإرشادات عامة لتحسين الأداء عند ترحيل مستودع بيانات من بيئة Oracle موجودة إلى Azure Synapse. الهدف من تحسين الأداء هو تحقيق نفس أداء مستودع البيانات أو أداء أفضل في Azure Synapse بعد الترحيل.
اعتبارات التصميم
نطاق الترحيل
عند التحضير للترحيل من بيئة Oracle، ضع في اعتبارك خيارات الترحيل التالية.
اختر حمل العمل للترحيل الأولي
عادة ما تطورت بيئات Oracle القديمة بمرور الوقت لتشمل مجالات مواضيع متعددة وأحمال عمل مختلطة. عندما تقرر من أين تبدأ في مشروع ترحيل، اختر منطقة ستتمكن فيها من القيام بنا يلي:
إثبات قابلية الترحيل إلى Azure Synapse من خلال تقديم فوائد البيئة الجديدة بسرعة.
السماح للموظفين التقنيين الداخليين باكتساب خبرة متعلقة بالعملية والأدوات التي سيستخدمونها عند ترحيل مناطق أخرى.
إنشاء قالب لمزيد من عمليات الترحيل الخاصة ببيئة Oracle المصدر والأدوات والعمليات الحالية الموجودة بالفعل.
دعم المرشح الجيد للترحيل الأولي من بيئة Oracle العناصر السابقة، و:
تنفيذ حمل عمل المعلومات المهنية /والتحليلات بدلًا من حمل عمل معالجة المعاملات عبر الإنترنت (OLTP).
يحتوي على نموذج بيانات، مثل مخطط نجمي أو مخطط بلورة ثلجية، يمكن ترحيله بأقل تعديل.
تلميح
إنشاء مخزون من الكائنات التي تحتاج إلى ترحيلها وتوثيق عملية الترحيل.
يجب أن يكون حجم البيانات التي تم ترحيلها في الترحيل الأولي كبيرًا بما يكفي لتوضيح قدرات وفوائد بيئة Azure Synapse ولكن ليس كبيرًا للغاية لإظهار القيمة بسرعة. الحجم نموذجي هو الذي يتراوح من 1 إلى 10 تيرابايت.
يتمثل النهج الأولي لمشروع الترحيل في تقليل المخاطر والجهد والوقت اللازمين بحيث ترى بسرعة فوائد بيئة سحابة Azure. تحد النهج التالية من نطاق الترحيل الأولي إلى متاجر البيانات فقط ولا تعالج جوانب الترحيل الأوسع، مثل ترحيل ETL وترحيل البيانات التاريخية. ومع ذلك، يمكنك معالجة هذه الجوانب في المراحل اللاحقة للمشروع بمجرد إعادة تعبئة طبقة متجر البيانات التي تم ترحيلها بالبيانات وعمليات الإنشاء المطلوبة.
الرفع والنقل الترحيل مقابل النهج المرحلي
بشكل عام، هناك نوعان من الترحيل بغض النظر عن الغرض من الترحيل المخطط له ونطاقه: الرفع والنقل كما هو ونهج مرحلي يتضمن التغييرات.
الرفع والنقل
في ترحيل الرفع والنقل يتم ترحيل نموذج بيانات موجود، مثل مخطط نجمي، دون تغيير إلى نظام Azure Synapse الأساسي الجديد. يقلل هذا النهج من المخاطر ووقت الترحيل عن طريق تقليل العمل المطلوب لتحقيق فوائد الانتقال إلى بيئة سحابة Azure. يعد ترحيل الرفع والنقل مناسبًا لهذه السيناريوهات:
- لديك بيئة Oracle حالية مع متجر البيانات واحد لترحيلها، أو
- لديك بيئة Oracle حالية مع بيانات موجودة بالفعل في مخطط نجمة أو مخطط بلورة ثلجية مصمم جيدًا، أو
- أنت تحت ضغوط الوقت والتكلفة للانتقال إلى بيئة سحابية حديثة.
تلميح
يعد الرفع والنقل نقطة بداية جيدة، حتى إن كانت المراحل اللاحقة ستنفذ تغييرات على نموذج البيانات.
النهج المرحلي الذي يتضمن التغييرات
إذا تطور مستودع بيانات قديم على مدار فترة زمنية طويلة، فقد تحتاج إلى إعادة تصميمه للحفاظ على مستويات الأداء المطلوبة. قد تحتاج أيضًا إلى إعادة تصميم لدعم البيانات الجديدة مثل تدفقات إنترنت الأشياء (IoT). قم بالترحيل إلى Azure Synapse للحصول على فوائد بيئة سحابية قابلة للتطوير كجزء من عملية إعادة الهندسة. قد يتضمن الترحيل تغييرًا في نموذج البيانات الأساسي، مثل الانتقال من نموذج Inmon إلى مخزن بيانات.
توصي Microsoft بنقل نموذج البيانات الموجود كما هو إلى Azure واستخدام أداء ومرونة بيئة Azure لتطبيق تغييرات إعادة التصميم. وبهذه الطريقة، يمكنك استخدام قدرات Azure لإجراء التغييرات دون التأثير على نظام المصدر الحالي.
استخدام مرافق Microsoft لتنفيذ ترحيل يستند إلى بيانات التعريف
يمكنك أتمتة عملية الترحيل وتنسيقها باستخدام قدرات بيئة Azure. يقلل هذا النهج من الأداء على بيئة Oracle الحالية، والتي قد تكون بالفعل قريبة من السعة الكاملة.
يمكن لمساعد الترحيل SQL Server (SSMA) لـOracle أتمتة العديد من أجزاء عملية الترحيل، بما في ذلك في بعض الحالات الوظائف والرمز الإجرائي. يدعم SSMA Azure Synapse كبيئة مستهدفة.
يمكن أن يساعدك SSMA لـ Oracle في ترحيل مستودع بيانات Oracle أو مخزن بيانات إلى Azure Synapse. تم تصميم SSMA لأتمتة عملية ترحيل الجداول وطرق العرض والبيانات من بيئة Oracle موجودة.
Azure Data Factory عبارة عن خدمة تكامل بيانات مستندة إلى السحابة تدعم إنشاء مهام سير عمل تعتمد على البيانات في السحابة تنظم وتقوم بأتمتة حركة البيانات وتحويل البيانات. يمكنك استخدام Azure Data Factory لإنشاء وجدولة مهام سير العمل المستندة إلى البيانات (المسارات) التي تستوعب البيانات من مخازن البيانات المختلفة. يمكن لمصنع البيانات معالجة البيانات وتحويلها باستخدام خدمات الحوسبة مثل Azure HDInsight Hadoop وSpark وAzure Data Lake Analytics والتعلم الآلي Azure.
يمكن استخدام Data Factory لترحيل البيانات في المصدر إلى هدف Azure SQL. تساعد حركة البيانات هذه دون اتصال على تقليل وقت تعطل الترحيل بشكل كبير.
يمكن أن تساعدك خدمات ترحيل قاعدة بيانات Azure على تخطيط وتنفيذ الترحيل من بيئات مثل Oracle.
عندما تخطط لاستخدام مرافق Azure لإدارة عملية الترحيل، قم بإنشاء بيانات تعريف تسرد جميع جداول البيانات التي سيتم ترحيلها وموقعها.
اختلافات التصميم بين Oracle وAzure Synapse
كما ذكرنا سابقًا، هناك بعض الاختلافات الأساسية في النهج بين قواعد بيانات Oracle وAzure Synapse Analytics. لا يساعد SSMA لـ Oracle في سد هذه الثغرات فحسب، بل يساعد أيضًا على أتمتة الترحيل. على الرغم من أن SSMA ليس النهج الأكثر كفاءة لكميات كبيرة جدًا من البيانات، إلا أنه مفيد للجداول الأصغر.
قواعد بيانات متعددة مقابل قاعدة بيانات واحدة ومخططات
غالبًا ما تحتوي بيئة Oracle على قواعد بيانات منفصلة متعددة. على سبيل المثال، قد تكون هناك قواعد بيانات منفصلة: لاستيعاب البيانات وجداول التقسيم المرحلي ولجداول المستودعات الأساسية ولمتاجر البيانات يشار إليها أحيانًا بالطبقة الدلالية. المعالجة في البنية الأساسية لـ ETL أو ELT يمكنها تنفيذ عمليات ربط عبر قاعدة البيانات ونقل البيانات بين قواعد البيانات المنفصلة.
في المقابل، تحتوي بيئة Azure Synapse على قاعدة بيانات واحدة وتستخدم المخططات لفصل الجداول إلى مجموعات منفصلة منطقيًا. نوصي بأن تستخدم سلسلة من المخططات داخل قاعدة بيانات Azure Synapse الهدف لمحاكاة قواعد بيانات منفصلة تم ترحيلها من بيئة Oracle. إن كانت بيئة Oracle تستخدم المخططات بالفعل، فقد تحتاج إلى استخدام اصطلاح تسمية جديد عند تحريك جداول وطرق عرض Oracle الحالية إلى البيئة الجديدة. على سبيل المثال، قد تقوم بدمج مخطط Oracle وأسماء الجداول الموجودة في اسم جدول Azure Synapse الجديد، واستخدام أسماء المخططات في البيئة الجديدة للاحتفاظ بأسماء قاعدة البيانات المنفصلة الأصلية. على الرغم من أنه يمكنك استخدام طرق عرض SQL أعلى الجداول الأساسية للحفاظ على البنيات المنطقية، إلا أن هناك جوانب سلبية محتملة لهذا الأسلوب:
طرق العرض في Azure Synapse للقراءة فقط، لذلك يجب إجراء أي تحديثات للبيانات على الجداول الأساسية الموجودة.
قد تكون هناك بالفعل طبقة واحدة أو أكثر من طرق العرض الموجودة، وقد تؤثر إضافة طبقة إضافية من طرق العرض على الأداء.
تلميح
اجمع قواعد بيانات متعددة في قاعدة بيانات أحادية داخل Azure Synapse واستخدم أسماء المخططات لفصل الجداول منطقياً.
عملية اعتبارات الجدول
عندما تقوم بترحيل جداول بين بيئات مختلفة، عادةً ما يتم ترحيل البيانات الأولية وبيانات التعريف التي تصفها فعليًا فقط. عادة لا يتم ترحيل عناصر قاعدة البيانات الأخرى من النظام المصدر، مثل الفهارس، لأنها قد تكون غير ضرورية أو يتم تنفيذها بشكل مختلف في البيئة الجديدة.
تشير تحسينات الأداء في بيئة المصدر، مثل الفهارس، إلى المكان الذي يمكنك فيه إضافة تحسين الأداء في البيئة الجديدة. على سبيل المثال، إذا كانت الاستعلامات في بيئة Oracle المصدر تستخدم فهارس bit-map بشكل متكرر، يشير ذلك إلى أنه يجب إنشاء فهرس غير مجمع داخل Azure Synapse. قد تكون تقنيات تحسين الأداء الأصلية الأخرى مثل النسخ المتماثل للجدول أكثر قابلية للتطبيق من إنشاء الفهرس المباشر. يمكن استخدام SSMA لـ Oracle لتقديم توصيات الترحيل لتوزيع الجدول والفهرسة.
تلميح
تشير الفهارس الموجودة إلى المرشحين للفهرسة في المستودع الذي تم ترحيله.
أنواع عناصر قاعدة بيانات Oracle غير معتمدة
يمكن استبدال ميزات خاصة بـ Oracle بميزات Azure Synapse. ومع ذلك، لا يتم دعم بعض كائنات قاعدة بيانات Oracle مباشرة في Azure Synapse. توضح القائمة التالية لكائنات قاعدة بيانات Oracle غير المدعومة كيف يمكنك تحقيق وظيفة مكافئة في Azure Synapse.
خيارات الفهرسة المختلفة: في Oracle، لا تحتوي العديد من خيارات الفهرسة، مثل الفهارس المعينة بت والفهارس المستندة إلى الوظائف وفهرس المجال، على أي مكافئ مباشر في Azure Synapse.
يمكنك معرفة الأعمدة التي تتم فهرستها ونوع الفهرس حسب:
الاستعلام عن جداول وطرق عرض كتالوج النظام، مثل
ALL_INDEXES
وDBA_INDEXES
وUSER_INDEXES
وDBA_IND_COL
. يمكنك استخدام الاستعلامات المضمنة في Oracle SQL Developer، كما هو موضح في لقطة الشاشة التالية.أو قم بتشغيل الاستعلام التالي للعثور على جميع الفهارس من نوع معين:
SELECT * FROM dba_indexes WHERE index_type LIKE 'FUNCTION-BASED%';
الاستعلام عن طرق العرض
dba_index_usage
أوv$object_usage
عند تمكين المراقبة. يمكنك الاستعلام عن طرق العرض هذه في Oracle SQL Developer، كما هو موضح في لقطة الشاشة التالية.
الفهارس المستندة إلى الدالة، حيث يحتوي الفهرس على نتيجة دالة على أعمدة البيانات الأساسية، ليس لها مكافئ مباشر في Azure Synapse. نوصي بترحيل البيانات أولًا، ثم في Azure Synapse، قم بتشغيل استعلامات Oracle التي تستخدم الفهارس المستندة إلى الدالة لقياس الأداء. إذا كان أداء هذه الاستعلامات في Azure Synapse غير مقبول، ففكر في إنشاء عمود يحتوي على القيمة المحسوبة مسبقًا ثم فهرسة هذا العمود.
عند تكوين بيئة Azure Synapse، من المنطقي تنفيذ الفهارس قيد الاستخدام فقط. يدعم Azure Synapse حاليًا أنواع الفهرس الموضحة هنا:
ميزات Azure Synapse، مثل معالجة الاستعلام المتوازي والتخزين المؤقت في الذاكرة للبيانات والنتائج، تجعل من المحتمل أن تكون هناك حاجة إلى فهارس أقل لتطبيقات مستودع البيانات لتحقيق أهداف الأداء. نوصي باستخدام أنواع الفهارس التالية في Azure Synapse:
فهارس تخزين الأعمدة المجمعة: عندما لا يتم تحديد خيارات فهرس لجدول، يقوم Azure Synapse بشكل افتراضي بإنشاء فهرس مخزن أعمدة متفاوت المسافات. توفر جداول تخزين الأعمدة المجمعة أعلى مستوى من ضغط البيانات، وأفضل أداء استعلام عام، وتفوق بشكل عام على الفهرس المتفاوت المسافات أو جداول كومة الذاكرة المؤقتة. عادة ما يكون فهرس تخزين الأعمدة المجمع هو الخيار الأفضل للجداول الكبيرة. عند إنشاء جدول، اختر مخزن أعمدة متفاوت المسافات إذا لم تكن متأكدًا من كيفية فهرسة الجدول. ومع ذلك، هناك بعض السيناريوهات التي لا تكون فيها فهارس تخزين الأعمدة المجمعة الخيار الأفضل:
- يمكن أن تستفيد الجداول التي تحتوي على بيانات الفرز المسبق على مفتاح (مفاتيح) فرز من إزالة المقطع التي تم تمكينها بواسطة فهارس تخزين الأعمدة المجمعة مرتبة .
- الجداول ذات أنواع البيانات varchar(max) أو nvarchar(max) أو varbinary(max)، لأن فهرس مخزن الأعمدة المجمع لا يدعم أنواع البيانات هذه. بدلًا من ذلك، ضع في اعتبارك استخدام كومة الذاكرة المؤقتة أو فهرس متفاوت المسافات.
- الجداول التي تحتوي على بيانات عابرة، لأن جداول تخزين الأعمدة قد تكون أقل كفاءة من كومة الذاكرة المؤقتة أو الجداول المؤقتة.
- جداول صغيرة بها أقل من 100 مليون صف. بدلًا من ذلك، ضع في اعتبارك استخدام جداول كومة الذاكرة المؤقتة.
فهارس تخزين الأعمدة المجمعة المرتبة: من خلال تمكين القضاء الفعال على الجزء، توفر فهارس تخزين الأعمدة المجمعة المرتبة في تجمعات SQL المخصصة ل Azure Synapse أداء أسرع بكثير عن طريق تخطي كميات كبيرة من البيانات المرتبة التي لا تتطابق مع دالة تقييم الاستعلام. قد يستغرق تحميل البيانات في جدول CCI المرتب وقتًا أطول من جدول CCI غير المرتب بسبب عملية فرز البيانات، ومع ذلك يمكن تشغيل الاستعلامات بشكل أسرع بعد ذلك باستخدام CCI المطلوب. لمزيد من المعلومات حول فهارس تخزين الأعمدة لبيانات مجمعة مرتبة، راجع ضبط الأداء مع فهرس تخزين الأعمدة لبيانات مجمعة مرتب.
الفهارس متفاوتة المسافات وغير متفاوتة المسافات: يمكن أن تتفوق الفهارس المجمعة على فهارس تخزين الأعمدة المجمعة عندما يحتاج صف واحد إلى استرداده بسرعة. بالنسبة للاستعلامات التي يجب أن يتم فيها إجراء بحث صف واحد، أو عدد قليل من عمليات البحث عن الصفوف، بسرعة قصوى، ضع في اعتبارك استخدام فهرس نظام المجموعة أو فهرس ثانوي غير متفاوت المسافات. ما يعيب استخدام فهرس متفاوت المسافات أن الاستعلامات بعامل تصفية انتقائي للغاية على عمود الفهرس المجمع. لتحسين التصفية على الأعمدة الأخرى، يمكنك إضافة فهرس غير متفاوت المسافات إلى الأعمدة الأخرى. ومع ذلك، يستخدم كل فهرس تضيفه إلى جدول مساحة أكبر ويزيد من وقت المعالجة لتحميله.
جداول كومة الذاكرة المؤقتة: عندما تهبط البيانات مؤقتًا على Azure Synapse، قد تجد أن استخدام جدول كومة الذاكرة المؤقتة يجعل العملية الإجمالية أسرع. وذلك لأن تحميل البيانات إلى جداول كومة الذاكرة المؤقتة أسرع من تحميل البيانات إلى جداول الفهرسة، وفي بعض الحالات يمكن إجراء القراءات اللاحقة من ذاكرة التخزين المؤقت. إذا كنت تقوم بتحميل البيانات فقط لتنظيمها قبل تشغيل المزيد من التحويلات، فمن الأسرع بكثير تحميلها إلى جدول كومة الذاكرة المؤقتة من جدول تخزين الأعمدة المتفاوت المسافات. وأيضًا، فإن تحميل البيانات إلى جدول مؤقت يكون أسرع من تحميل جدول إلى تخزين دائم. بالنسبة لجداول البحث الصغيرة التي تحتوي على أقل من 100 مليون صف، عادة ما تكون جداول كومة الذاكرة المؤقتة الخيار الصحيح. جداول تخزين أعمدة نظام المجموعة تبدأ في تحقيق الضغط الأمثل عندما تحتوي على أكثر من 100 مليون صف.
الجداول المجمعة: يمكن تنظيم جداول Oracle بحيث يتم تخزين صفوف الجدول التي يتم الوصول إليها بشكل متكرر معا (استنادًا إلى قيمة مشتركة) معا فعليا لتقليل إدخال/إخراج القرص عند استرداد البيانات. توفر Oracle أيضا خيار نظام مجموعة التجزئة للجداول الفردية، والتي تطبق قيمة التجزئة على مفتاح نظام المجموعة وتخزن الصفوف فعليًا بنفس قيمة التجزئة معًا. لسرد المجموعات داخل قاعدة بيانات Oracle، استخدم الاستعلام
SELECT * FROM DBA_CLUSTERS;
. لتحديد ما إذا كان الجدول داخل نظام مجموعة، استخدم الاستعلامSELECT * FROM TAB;
، الذي يعرض اسم الجدول ومعرف نظام المجموعة لكل جدول.في Azure Synapse، يمكنك تحقيق نتائج مماثلة باستخدام الجداول المجسدة و/أو المنسوخة نسخًا متماثلًا، لأن أنواع الجداول هذه تقلل الإدخال/الإخراج المطلوب في وقت تشغيل الاستعلام.
طرق العرض المجسدة: يدعم Oracle طرق العرض المجسدة ويوصي باستخدام واحد أو أكثر منها على جداول كبيرة مع العديد من الأعمدة إذا تم استخدام عدد قليل فقط من هذه الأعمدة بانتظام في الاستعلامات. يتم تحديث طرق العرض المجسدة تلقائيًا بواسطة النظام عند تحديث البيانات في الجدول الأساسي.
في عام 2019، أعلنت Microsoft أن Azure Synapse سيدعم طرق العرض المجسدة بنفس الوظائف كما هو الحال في Oracle. أصبحت طرق العرض المجسدة الآن ميزة معاينة في Azure Synapse.
مشغلات داخل قاعدة البيانات: في Oracle، يمكن تكوين المشغل للتشغيل تلقائيًا عند حدوث حدث تشغيل. يمكن أن يكون تشغيل الأحداث:
يتم تشغيل عبارة لغة معالجة البيانات (DML)، مثل
INSERT
أوUPDATE
أوDELETE
على جدول. إذا قمت بتعريف مشغل يتم تشغيله قبل عبارةINSERT
على جدول عميل، فسيتم تشغيل المشغل مرة واحدة قبل إدراج صف جديد في جدول العميل.يتم تشغيل عبارة DDL، مثل
CREATE
أوALTER
. غالبًا ما يستخدم هذا المشغل لأغراض التدقيق لتسجيل تغييرات المخطط.حدث نظام، مثل بدء تشغيل قاعدة بيانات Oracle أو إيقاف تشغيلها.
حدث مستخدم، مثل تسجيل الدخول أو تسجيل الخروج.
يمكنك الحصول على قائمة بالمشغلات المعرفة في قاعدة بيانات Oracle عن طريق الاستعلام عن طرق العرض
ALL_TRIGGERS
أوDBA_TRIGGERS
أوUSER_TRIGGERS
. تظهر لقطة الشاشة التالية استعلامDBA_TRIGGERS
في Oracle SQL Developer.لا يدعم Azure Synapse مشغلات قاعدة بيانات Oracle. ومع ذلك، يمكنك إضافة وظائف مكافئة باستخدام Data Factory، على الرغم من أن القيام بذلك سيتطلب منك إعادة بناء التعليمات البرمجية للعمليات التي تستخدم المشغلات.
المرادفات: تدعم Oracle تعريف المرادفات كأسماء بديلة للعديد من أنواع عناصر قاعدة البيانات. تتضمن أنواع الكائنات هذه: الجداول أو طرق العرض أو التسلسلات أو الإجراءات أو الوظائف المخزنة أو الحزم أو طرق العرض المجسدة أو كائنات مخطط فئة Java أو الكائنات المعرفة من قبل المستخدم أو مرادف آخر.
لا يدعم Azure Synapse حاليا تعريف المرادفات، على الرغم من أنه إذا كان المرادف في Oracle يشير إلى جدول أو طريقة عرض، فيمكنك تعريف طريقة عرض في Azure Synapse لمطابقة الاسم البديل. إذا كان المرادف في Oracle يشير إلى دالة أو إجراء مخزن، فيمكنك في Azure Synapse إنشاء دالة أخرى أو إجراء مخزن، باسم لمطابقة المرادف، الذي يستدعي الهدف.
الأنواع المعرفة من قبل المستخدم: تدعم Oracle الكائنات المعرفة من قبل المستخدم والتي يمكن أن تحتوي على سلسلة من الحقول الفردية، ولكل منها تعريفها وقيمها الافتراضية. يمكن الرجوع إلى هذه الكائنات داخل تعريف جدول بنفس الطريقة التي تتم بها الإشارة إلى أنواع البيانات المضمنة مثل
NUMBER
أوVARCHAR
. يمكنك الحصول على قائمة بالأنواع المعرفة من قبل المستخدم داخل قاعدة بيانات Oracle عن طريق الاستعلام عن طرق العرضALL_TYPES
أوDBA_TYPES
أوUSER_TYPES
.لا يدعم Azure Synapse حاليًا الأنواع المعرفة من قبل المستخدم. إذا كانت البيانات التي تحتاج إلى ترحيلها تتضمن أنواع بيانات معرفة من قبل المستخدم، إما "تبسيطها" في تعريف جدول تقليدي، أو إذا كانت صفائف بيانات، فقم بتطبيعها في جدول منفصل.
تعيين نوع بيانات Oracle
معظم أنواع بيانات Oracle لها مكافئ مباشر في Azure Synapse. يعرض الجدول التالي النهج الموصى به لتعيين أنواع بيانات Oracle إلى Azure Synapse.
نوع بيانات Oracle | نوع بيانات Azure Synapse |
---|---|
BFILE | غير مدعومة. تعيين إلى VARBINARY (MAX). |
BINARY_FLOAT | غير مدعومة. تعيين إلى FLOAT. |
BINARY_DOUBLE | غير مدعومة. تعيين إلى DOUBLE. |
BLOB | غير مدعوم مباشرة. استبدل بـ VARBINARY(MAX). |
CHAR | CHAR |
CLOB | غير مدعوم مباشرة. استبدل بـ VARCHAR(MAX). |
التاريخ | يمكن أن يحتوي DATE في Oracle أيضًا على معلومات الوقت. اعتمادًا على خريطة الاستخدام إلى DATE أو TIMESTAMP. |
عشري | عشري |
مزدوج | PRECISION DOUBLE |
حُر | حُر |
INTEGER | Int |
الفاصل الزمني من سنة إلى شهر | أنواع بيانات الفاصل الزمني غير مدعومة. استخدم دالات مقارنة التاريخ، مثل DATEDIFF أو DATEADD، لحسابات التاريخ. |
الفاصل الزمني من يوم إلى ثانية | أنواع بيانات الفاصل الزمني غير مدعومة. استخدم دالات مقارنة التاريخ، مثل DATEDIFF أو DATEADD، لحسابات التاريخ. |
LONG | غير مدعومة. تعيين إلى VARCHAR(MAX). |
LONG RAW | غير مدعومة. تعيين إلى VARBINARY(MAX). |
NCHAR | NCHAR |
NVARCHAR2 | nvarchar |
NUMBER | حُر |
NCLOB | غير مدعوم مباشرة. استبدل بـ NVARCHAR(MAX). |
رقمي | رقمي |
أنواع بيانات وسائط ORD | غير مدعوم |
RAW | غير مدعومة. تعيين إلى VARBINARY. |
حقيقي | حقيقي |
ROWID | غير مدعومة. تعيين إلى GUID، وهو مشابه. |
أنواع البيانات المكانية SDO | غير مدعوم |
smallint | smallint |
الطابع الزمني | DATETIME2 أو الدالة CURRENT_TIMESTAMP() |
الطابع الزمني مع المنطقة الزمنية المحلية | غير مدعومة. تعيين إلى DATETIMEOFFSET. |
الطابع الزمني مع المنطقة الزمنية | غير مدعوم لأنه يتم تخزين TIME باستخدام توقيت "ساعة الحائط" بدون إزاحة المنطقة الزمنية. |
URIType | غير مدعومة. تخزين في VARCHAR. |
UROWID | غير مدعومة. تعيين إلى GUID، وهو مشابه. |
VARCHAR | VARCHAR |
VARCHAR2 | VARCHAR |
XMLType | غير مدعومة. تخزين بيانات XML في VARCHAR. |
تدعم Oracle أيضًا تعريف الكائنات المعرفة من قبل المستخدم التي يمكن أن تحتوي على سلسلة من الحقول الفردية، لكل منها تعريفها وقيمها الافتراضية. يمكن بعد ذلك الرجوع إلى هذه الكائنات داخل تعريف جدول بنفس الطريقة التي تتم بها الإشارة إلى أنواع البيانات المضمنة مثل NUMBER
أو VARCHAR
. لا يدعم Azure Synapse حاليًا الأنواع المعرفة من قبل المستخدم. إذا كانت البيانات التي تحتاج إلى ترحيلها تتضمن أنواع بيانات معرفة من قبل المستخدم، إما "تبسيطها" في تعريف جدول تقليدي، أو إذا كانت صفائف بيانات، فقم بتطبيعها في جدول منفصل.
تلميح
تقييم عدد أنواع البيانات غير المدعومة ونوعها أثناء مرحلة إعداد الترحيل.
يقدم بائعون تابعون لجهات خارجية أدوات وخدمات لأتمتة الترحيل، بما في ذلك تعيين أنواع البيانات. في حال كانت أداة استخراج وتحويل وتحميل تابعة لجهة خارجية قيد الاستخدام بالفعل في بيئة Oracle، استخدم لهذه الأداة لتنفيذ أي تحويلات مطلوبة للبيانات.
اختلافات بناء جملة SQL DML
توجد اختلافات في بناء جملة SQL DML بين Oracle SQL وAzure Synapse T-SQL. تتم مناقشة هذه الاختلافات بالتفصيل في تقليل مشكلات SQL لترحيل Oracle. في بعض الحالات، يمكنك أتمتة ترحيل DML باستخدام أدوات Microsoft مثل SSMA لـ Oracle وAzure Database Migration Services، أو منتجات وخدمات الترحيل التابعة لجهة خارجية.
دالات وإجراءات مخزنة وتسلسلات
عند ترحيل مستودع بيانات من بيئة ناضجة مثل Oracle، ربما تحتاج إلى ترحيل عناصر أخرى غير الجداول وطرق العرض البسيطة. تحقق مما إذا كانت الأدوات داخل بيئة Azure يمكنها استبدال وظيفة الوظائف والإجراءات المخزنة والتسلسلات لأنه عادة ما يكون استخدام أدوات Azure المضمنة أكثر كفاءة من إعادة ترميزها لـ Azure Synapse.
كجزء من مرحلة الإعداد الخاصة بك، أنشئ مخزونًا من الكائنات التي تحتاج إلى ترحيل، وحدد طريقة لمعالجتها، وخصص الموارد المناسبة في خطة الترحيل الخاصة بك.
يمكن لأدوات Microsoft مثل SSMA لـ Oracle وAzure Database Migration Services، أو منتجات وخدمات الترحيل التابعة لجهة خارجية، أتمتة ترحيل الوظائف والإجراءات المخزنة والتسلسلات.
تناقش الأقسام التالية أيضًا ترحيل الوظائف والإجراءات المخزنة والتسلسلات.
الوظائف
كما هو الحال مع معظم منتجات قواعد البيانات، تدعم Oracle النظام والوظائف المحددة بواسطة المستخدم ضمن تطبيق SQL. عند ترحيل نظام أساسي قديم لقاعدة البيانات إلى Azure Synapse، يمكن عادة ترحيل وظيفة النظام الشائعة دون تغيير. قد يكون لبعض وظائف النظام بناء جملة مختلف قليلاً، ولكن يمكن أتمتة أي تغير من التغييرات المطلوبة. يمكنك الحصول على قائمة بالوظائف داخل قاعدة بيانات Oracle عن طريق الاستعلام عن طريقة العرض ALL_OBJECTS
باستخدام عبارة WHERE
المناسبة. يمكنك استخدام Oracle SQL Developer للحصول على قائمة بالوظائف، كما هو موضح في لقطة الشاشة التالية.
بالنسبة لوظائف نظام Oracle أو الوظائف العشوائية المعرفة من قبل المستخدم والتي ليس لها ما يعادلها في Azure Synapse، أعد ترميز هذه الوظائف باستخدام لغة بيئة مستهدفة. يتم ترميز الوظائف المعرفة بواسطة مستخدم Oracle بلغات PL/SQL أو Java أو C. بينما يستخدم Azure Synapse لغة Transact-SQL لتنفيذ الوظائف المعرفة من قبل المستخدم.
الإجراءات المخزنة
تدعم معظم منتجات قواعد البيانات الحديثة إجراءات التخزين داخل قاعدة البيانات. يوفر Oracle لغة PL/SQL لهذا الغرض. يحتوي الإجراء المخزن عادة على كلٍ من عبارات SQL والمنطق الإجرائي، وقد يرجع بيانات أو حالة. يمكنك الحصول على قائمة بالإجراءات المخزنة داخل قاعدة بيانات Oracle عن طريق الاستعلام عن طريقة العرض ALL_OBJECTS
باستخدام عبارة WHERE
المناسبة. يمكنك استخدام Oracle SQL Developer للحصول على قائمة بالإجراءات المخزنة، كما هو موضح في لقطة الشاشة التالية.
يدعم Azure Synapse الإجراءات المخزنة باستخدام T-SQL، لذلك ستحتاج إلى إعادة ترميز أي إجراءات مخزنة تم ترحيلها بتلك اللغة.
التسلسلات
في Oracle، التسلسل هو كائن قاعدة بيانات مسمى، تم إنشاؤه باستخدام CREATE SEQUENCE
. يوفر التسلسل قيما رقمية فريدة عبر الأسلوبين CURRVAL
وNEXTVAL
. يمكنك استخدام الأرقام الفريدة التي تم إنشاؤها كقيم مفاتيح بديلة للمفاتيح الأساسية.
لا يقوم Azure Synapse بتنفيذ CREATE SEQUENCE
، ولكن يمكنك تنفيذ التسلسلات باستخدام أعمدة IDENTITY أو التعليمات البرمجية SQL التي تنشئ رقم التسلسل التالي في سلسلة.
استخراج بيانات التعريف والبيانات من بيئة Oracle
إنشاء لغة تعريف البيانات
يحدد معيار ANSI SQL بناء الجملة الأساسي لأوامر لغة توصيف البيانات (DDL). بعض أوامر DDL، مثل CREATE TABLE
و CREATE VIEW
، شائعة لكلٍ من Oracle وAzure Synapse ولكنها توفر أيضًا ميزات خاصة بالتطبيق مثل الفهرسة وتوزيع الجدول وخيارات التقسيم.
يمكنك تحرير البرامج النصية CREATE TABLE
وCREATE VIEW
لـ Oracle الموجودة لتحقيق تعريفات مكافئة في Azure Synapse. للقيام بذلك، قد تحتاج إلى استخدام أنواع البيانات المعدلة وإزالة عبارات خاصة بـ Oracle أو تعديلها مثل TABLESPACE
.
ضمن بيئة Oracle، تقوم جداول كتالوج النظام بتحديد الجدول الحالي وتعرض التعريف. على عكس الوثائق التي يحتفظ بها المستخدم، تكون معلومات كتالوج النظام دائمًا كاملة ومتزامنة مع تعريفات الجدول الحالية. يمكنك الوصول إلى معلومات كتالوج النظام باستخدام أدوات مساعدة مثل Oracle SQL Developer. يمكن لمطور Oracle SQL إنشاء عبارات DDL CREATE TABLE
التي يمكنك تحريرها لإنشاء جداول مكافئة في Azure Synapse.
أو يمكنك استخدام SSMA لـ Oracle لترحيل الجداول من بيئة Oracle موجودة إلى Azure Synapse. سيطبق SSMA لـ Oracle تعيينات نوع البيانات المناسبة وأنواع الجدول والتوزيع الموصى بها، كما هو موضح في لقطة الشاشة التالية.
يمكنك أيضًا استخدام أدوات الترحيل وETL التابعة لجهة خارجية التي تعالج معلومات كتالوج النظام لتحقيق نتائج مماثلة.
استخراج البيانات من Oracle
يمكنك استخراج بيانات الجدول الخام من جداول Oracle إلى ملفات محددة مسطحة، مثل ملفات CSV، باستخدام أدوات Oracle المساعدة القياسية مثل Oracle SQL Developer وSQL*Plus وSCLcl. بعد ذلك، يمكنك ضغط الملفات المحددة المسطحة باستخدام gzip، وتحميل الملفات المضغوطة إلى Azure Blob Storage باستخدام أدوات نقل البيانات AzCopy أو Azure مثل Azure Data Box.
استخراج بيانات الجدول بأكبر قدر ممكن من الكفاءة - خاصة عند ترحيل جداول الحقائق الكبيرة. بالنسبة لجداول Oracle، استخدم التوازي لزيادة معدل نقل الاستخراج إلى أقصى حد. يمكنك تحقيق التوازي عن طريق تشغيل عمليات متعددة تستخرج مقاطع منفصلة من البيانات بشكل فردي، أو باستخدام أدوات قادرة على أتمتة الاستخراج المتوازي من خلال التقسيم.
تلميح
استخدم التوازي لاستخراج البيانات الأكثر كفاءة.
في حالة توفر نطاق ترددي كافٍ للشبكة، يمكنك استخراج البيانات من نظام Oracle الداخلي مباشرةً إلى جداول Azure Synapse أو تخزين بيانات Azure Blob. للقيام بذلك، استخدم عمليات Data Factory أو Azure Database Migration Service أو ترحيل البيانات التابعة لجهة خارجية أو منتجات ETL.
ينبغي أن تحتوي ملفات البيانات المستخرجة على نص محدد بتنسيق CSV أو عمود الصف المحسن (ORC) أو تنسيق Parquet.
لمزيد من المعلومات بشأن ترحيل البيانات وETL من بيئة Oracle، راجع ترحيل البيانات وETL وتحميل عمليات ترحيل Oracle.
توصيات الأداء لترحيلات Oracle
الهدف من تحسين الأداء هو الحصول على نفس أداء مستودع البيانات أو أداء أفضل بعد الترحيل إلى Azure Synapse.
أوجه التشابه في مفاهيم نهج ضبط الأداء
العديد من مفاهيم ضبط الأداء لقواعد بيانات Oracle صحيحة لقواعد بيانات Azure Synapse. على سبيل المثال:
استخدم توزيع البيانات لدمج البيانات المراد ضمها إلى نفس عقدة المعالجة.
استخدم أصغر نوع بيانات لعمود معين لتوفير مساحة التخزين وتسريع معالجة الاستعلام.
تأكد من أن الأعمدة المراد ضمها لها نفس نوع البيانات من أجل تحسين معالجة الصلة وتقليل الحاجة إلى تحويلات البيانات.
لمساعدة المحسن على إنتاج أفضل خطة تنفيذ، تأكد من تحديث الإحصائيات.
مراقبة الأداء باستخدام قدرات قاعدة البيانات المضمنة لضمان استخدام الموارد بكفاءة.
تلميح
تحديد أولويات للإلمام بخيارات الضبط Azure Synapse في بداية الترحيل.
الاختلافات في نهج ضبط الأداء
يسلط هذا القسم الضوء على اختلافات التنفيذ لضبط الأداء ذات المستوى الأدنى بين Oracle وAzure Synapse.
خيارات توزيع البيانات
بالنسبة للأداء، تم تصميم Azure Synapse مع بنية متعددة العقد ويستخدم المعالجة المتوازية. لتحسين أداء الجدول في Azure Synapse، يمكنك تحديد خيار توزيع البيانات في عبارات CREATE TABLE
باستخدام العبارة DISTRIBUTION
. على سبيل المثال، يمكنك تحديد جدول موزع بناءً على التجزئة، والذي يوزع صفوف الجدول عبر عقد الحساب باستخدام وظيفة تجزئة محددة. لا تدعم العديد من تطبيقات Oracle، وخاصة الأنظمة المحلية القديمة، هذه الميزة.
عكس Oracle، يدعم Azure Synapse الصلات المحلية بين جدول صغير وجدول كبير من خلال النسخ المتماثل للجداول الصغيرة. على سبيل المثال، ضع في اعتبارك جدول ذو أبعاد صغير وجدول حقائق كبير داخل نموذج مخطط نجمي. يمكن لـ Azure Synapse نسخ جدول الأبعاد الأصغر عبر جميع العقد للتأكد من أن قيمة أي مفتاح ربط للجدول الكبير لها صف أبعاد مطابق ومتاح محليًا. يعد حدوث الحمل الزائد للنسخ المتماثل لجدول الأبعاد منخفض نسبيًا لجدول أبعاد صغير. بالنسبة لجداول الأبعاد الكبيرة، يكون نهج توزيع التجزئة أكثر ملاءمة. لمزيد من المعلومات حول خيارات توزيع البيانات، راجع إرشادات التصميم لاستخدام الجداول المنسوخة نسخًا متماثلًا وإرشادات لتصميم الجداول الموزعة.
تلميح
يحسن توزيع التجزئة أداء الاستعلام على جداول الحقائق الكبيرة. التوزيع بطريقة رواند روبن مفيد لتحسين سرعة التحميل.
يمكن تطبيق توزيع التجزئة على أعمدة متعددة لتوزيع أكثر التساوي للجدول الأساسي. سيسمح لك التوزيع متعدد الأعمدة باختيار ما يصل إلى ثمانية أعمدة للتوزيع. لا يقلل هذا من انحراف البيانات بمرور الوقت فحسب، بل يحسن أيضا أداء الاستعلام.
إشعار
التوزيع متعدد العواميد قيد المعاينة حاليًا لـ Azure Synapse Analytics. يمكنك استخدام التوزيع متعدد الأعمدة مع CREATE MATERIALIZED VIEW وCREATE TABLE وCREATE TABLE AS SELECT.
مرشد التوزيع
في Azure Synapse SQL، يمكن تخصيص الطريقة التي يتم بها توزيع كل جدول. تؤثر استراتيجية توزيع الجدول على أداء الاستعلام بشكل كبير.
ميزة مستشار التوزيع هي ميزة جديدة في Synapse SQL تحلل الاستعلامات وتوصي بأفضل استراتيجيات التوزيع للجداول لتحسين أداء الاستعلام. يمكن توفير الاستعلامات التي سينظر فيها المستشار من قبلك أو سحبها من الاستعلامات التاريخية المتوفرة في DMV.
للحصول على تفاصيل وأمثلة حول كيفية استخدام مستشار التوزيع، تفضل بزيارة مستشار التوزيع في Azure Synapse SQL.
فهرسة البيانات
يدعم Azure Synapse العديد من خيارات الفهرسة التي يمكن تعريفها من قبل المستخدم والتي لها عملية واستخدام مختلفين مقارنة بخرائط المنطقة المدارة من قبل النظام في Oracle. لمزيد من المعلومات حول خيارات الفهرسة المختلفة في Azure Synapse، راجع الفهارس في جداول تجمع SQL المخصصة.
توفر تعريفات الفهرس داخل بيئة Oracle المصدر مؤشرًا مفيدًا لاستخدام البيانات والأعمدة المرشحة للفهرسة في بيئة Azure Synapse. عادة، لن تحتاج إلى ترحيل كل فهرس من بيئة Oracle القديمة لأن Azure Synapse لا يعتمد بشكل مفرط على الفهارس وينفذ الميزات التالية لتحقيق أداء متميز:
معالجة الاستعلام المتوازي.
التخزين المؤقت للبيانات الموجودة في الذاكرة ومجموعة النتائج.
توزيع البيانات، مثل النسخ المتماثل لجداول الأبعاد الصغيرة، لتقليل الإدخال/الإخراج.
تقسيم البيانات
في مستودع بيانات المؤسسة، يمكن أن تحتوي جداول الحقائق على مليارات الصفوف. يعمل التقسيم على تحسين صيانة هذه الجداول والاستعلام عنها عن طريق تقسيمها إلى أجزاء منفصلة لتقليل كمية البيانات التي تمت معالجتها. في Azure Synapse، تحدد عبارة CREATE TABLE
مواصفات التقسيم لجدول.
يمكنك استخدام حقل واحد فقط لكل جدول للتقسيم. هذا الحقل هو في كثير من الأحيان حقل تاريخ لأن تصفية العديد من الاستعلامات تتم حسب التاريخ أو نطاق التاريخ. من الممكن تغيير تقسيم الجدول بعد التحميل الأولي باستخدام عبارة CREATE TABLE AS
(CTAS) لإعادة إنشاء الجدول بتوزيع جديد. للحصول على مناقشة مفصلة حول التقسيم في Azure Synapse، راجع تقسيم الجداول في تجمع SQL مخصص.
PolyBase أو COPY INTO لتحميل البيانات
يدعم PolyBase التحميل الفعال لكميات كبيرة من البيانات إلى مستودع بيانات باستخدام تدفقات التحميل المتوازية. لمزيد من المعلومات، راجع استراتيجية تحميل بيانات PolyBase.
كما يدعم COPY INTO أيضا استيعاب البيانات عالية الإنتاجية، و:
- استرداد البيانات من جميع الملفات داخل مجلد ومجلدات فرعية.
- استرداد البيانات من مواقع متعددة في نفس حساب التخزين. يمكنك تحديد مواقع متعددة باستخدام مسارات مفصولة بفواصل.
- Azure Data Lake Storage (ADLS) وAzure Blob Storage.
- تنسيقات ملفات CSV وPARQUET وORC.
تلميح
الطريقة الموصى بها لتحميل البيانات هي استخدام COPY INTO
مع تنسيق ملف PARQUET.
إدارة أحمال العمل
يمكن أن يشكل تشغيل أحمال العمل المختلطة تحديات في الموارد على الأنظمة المزدحمة. يدير مخطط إدارة حمل العمل الناجح الموارد بفعاليةٍ، ويضمن استخدام الموارد بكفاءةٍ عاليةٍ، ويزيد من العائد على الاستثمار (ROI). يسمح تصنيف حمل العمل وأهمية حمل العمل وعزل حمل العمل بمزيد من التحكم في كيفية استخدام حمل العمل لموارد النظام.
يوضح دليل إدارة حمل العمل تقنيات تحليل حمل العمل وإدارة ومراقبة أهمية حمل العمل وخطوات تحويل فئة مورد إلى مجموعة حمل عمل. استخدم مدخل Microsoft Azure واستعلامات T-SQL على DMVs لمراقبة حمل العمل لضمان استخدام الموارد القابلة للتطبيق بكفاءة.
الخطوات التالية
للتعرف على ETL والتحميل لترحيل Oracle، راجع المقالة التالية في هذه السلسلة: ترحيل البيانات وETL والتحميل لترحيلات Oracle.