إشعار
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تسجيل الدخول أو تغيير الدلائل.
يتطلب الوصول إلى هذه الصفحة تخويلاً. يمكنك محاولة تغيير الدلائل.
ينطبق على:
Azure Data Factory
Azure Synapse Analytics
تلميح
Data Factory في Microsoft Fabric هو الجيل القادم من Azure Data Factory، مع بنية أبسط، وذكاء اصطناعي مدمج، وميزات جديدة. إذا كنت جديدا في تكامل البيانات، ابدأ مع Fabric Data Factory. يمكن لأعباء عمل ADF الحالية الترقية إلى Fabric للوصول إلى قدرات جديدة في علوم البيانات، والتحليلات اللحظية، والتقارير.
في هذا الدرس، تستخدم بوابة Azure لإنشاء خط أنابيب Azure Data Factory الذي ينفذ دفتر Databricks مقابل مجموعة وظائف Databricks. كما يمرر معلمات Azure Data Factory إلى دفتر Databricks أثناء التنفيذ.
نفذ الخطوات التالية في هذا البرنامج التعليمي:
إنشاء data factory.
إنشار المسار التي يستخدمDatabricks Notebook Activity.
تتبع تشغيل البنية الأساسية
مراقبة تشغيل المسار.
إذا لم يكن لديك اشتراك Azure، أنشئ حسابا مجاني قبل أن تبدأ.
إشعار
للحصول على تفاصيل كاملة حول كيفية استخدام نشاط دفتر ملاحظات Databricks، بما في ذلك استخدام المكتبات وتمرير معلمات الإدخال والإخراج، راجع وثائق نشاط دفتر ملاحظات Databricks.
المتطلبات الأساسية
- Azure Databricks workspace. إنشاء Databricks workspace أو استخدام workspace موجودة. تقوم بإنشاء دفتر Python في مساحة عمل Azure Databricks الخاصة بك. ثم تقوم بتنفيذ الدفتر وتمرير المعلمات إليه باستخدام Azure Data Factory.
إنشاء مصدرًا للبيانات
شغل متصفح الويب Microsoft Edge أو Google Chrome. حاليا، يدعم واجهة Data Factory فقط في متصفحات الويب Microsoft Edge وGoogle Chrome.
اختر إنشاء مورد في قائمة بوابة Azure، ثم اختر Analytics>Data Factory :
في صفحة Create Data Factory، تحت تبويب Basics، اختر Azure Subscription الذي تريد إنشاء مصنع البيانات فيه.
بالنسبة إلى مجموعة الموارد، نفِّذ إحدى الخطوات التالية:
حدد مجموعة موارد موجودة من القائمة المنسدلة.
حدد إنشاء جديد وأدخل اسم مجموعة الموارد الجديدة.
للتعرف على مجموعات الموارد، راجع استخدام مجموعات الموارد لإدارة موارد Azure الخاصة بك.
بالنسبة للمنطقة، حدد موقع data factory.
تظهر القائمة فقط المواقع التي يدعمها Data Factory، وأين سيتم تخزين بيانات Azure Data Factory الوصفية. يمكن تشغيل مخازن البيانات المرتبطة (مثل تخزين Azure و قاعدة بيانات Azure SQL) والحوسبات (مثل Azure HDInsight) التي يستخدمها Data Factory في مناطق أخرى.
للاسم، أدخل ADFTutorialDataFactory.
يجب أن يكون اسم مصنع البيانات Azure global unique. إذا اطلعت على الخطأ التالي، تغيير اسمdata factory (على سبيل المثال، استخدام <yourname> ADFTutorialDataFactory). للحصول على قواعد تسمية للبيانات الاصطناعية الخاصة بـ Data Factory، راجع مقالة Data Factory - قواعد التسمية.
بالنسبة إلى Version، حدد V2.
تحديد التالي: تكوين Git، ثم حدد مربع الاختيار تكوين Git لاحقاً.
تحديد مراجعة + إنشاء، ثم حدد إنشاء بعد إتمام التحقق من الصحة.
بعد اكتمال الإنشاء، تحديد الانتقال إلى المورد للانتقال إلى صفحة Data Factory. اختر بلاطة Open Azure Data Factory Studio لبدء تطبيق واجهة المستخدم Azure Data Factory (UI) في تبويب متصفح منفصل.
إنشاء linked services
في هذا القسم، يمكنك تأليف خدمة مرتبطة بـ Databricks. تحتوي الخدمة المرتبطة على معلومات الاتصال إلى نظام مجموعة Databricks:
Create an Azure Databricks linked service
في الصفحة الرئيسية، الانتقال إلى علامة تبويب Manage في اللوحة اليسرى.
حدد الخدمات المرتبطة في إطار الاتصالات، ثم حدد +جديد.
في نافذة New المرتبطة بالخدمة المرتبطة، اختر Compute>Azure Databricks، ثم اختر Continue.
في نافذة "الخدمة المرتبطة الجديدة"، أكمل الخطوات التالية:
فيما يتعلق بـالاسم, أدخلAzureDatabricks_LinkedService.
حدد مساحة عمل Databricks المناسبة التي ستقوم بتشغيل دفتر الملاحظات فيها.
لتحديد مجموعة النظام، حدد مهام مجموعة النظام الجديدة.
بالنسبة إلى عنوان URL لمساحة عمل Databricks، يجب ملء المعلومات تلقائيا.
بالنسبة ل نوع المصادقة، إذا اخترت Access Token، قم بإنشائه من مكان Azure Databricks. يمكن العثور على الخطوات هنا. بالنسبة ل Managed Service Identity و User Assigned Managed Identity، يمنح Contributor role لكلا الهويتين في قائمة Access control الخاصة ب Azure Databricks المورد.
بالنسبة لـ إصدار نظام المجموعة، حدد الإصدار الذي تريد استخدامه.
فيما يتعلقنوع بعقدة نظام المجموعة، حددStandard_D3_v2تحت فئةالغرض العام (HDD) لهذا البرنامج التعليمي.
للعاملين، أدخل 2.
حدد إنشاء.
إنشاء البنية الأساسية لبرنامج ربط العمليات التجارية
حدد زر (علامة الزائد) + ثم حدد Pipeline المُتاح في القائمة.
إنشاء معلمة لاستخدامها في المسار. تمرير هذه المعلمة إلىDatabricks Notebook Activity لاحقاً. في المسار الفارغ، حدد معلمات علامة التبويب، ثم حدد + جديد وسميه باسم 'name'.
في مربع أدوات الأنشطة، توسيع Databricks. سحب نشاط دفتر الملاحظات من مربع أدوات الأنشطة إلى سطح مصمم المسار.
في الخصائص الخاصة بنافذة DatabricksNotebook activity في الأسفل، أكمل الخطوات التالية:
انتقل إلى تبويب Azure Databricks.
حددAzureDatabricks_LinkedService(التي جرى إنشائها في الإجراء السابق).
الانتقال إلى علامة تبويب الإعدادات.
التصفح لتحديد مسار Databricks Notebook path. لنقم بإنشاء دفتر ملاحظات وتحديد المسار هنا. يُمكن الحصول على مسار دفتر الملاحظات باتباع بعض من الخطوات التالية.
قم بتشغيل Azure Databricks Workspace الخاص بك.
إنشاء مجلد جديد في مكان العمل وتسميتها باسم adftutorial.
إنشاء دفتر ملاحظات جديد، دعنا نسميه mynotebook. انقر بزر الماوس الأيمن فوق adftutorial Folder، وحدد Create.
في دفتر الملاحظات الذي تم إنشاؤه حديثًا "mynotebook"، أضف التعليمة البرمجية التالية:
# Creating widgets for leveraging parameters, and printing the parameters dbutils.widgets.text("input", "","") y = dbutils.widgets.get("input") print ("Param -\'input':") print (y)يكون مسار دفتر الملاحظات في هذه الحالة هو /adftutorial/mynotebook.
الانتقال مرة أخرى إلى أداة تأليفData Factory UI. الانتقال إلى علامة تبويب الإعدادات في إطار نشاط Notebook1.
أ. إضافة معلمة إلى نشاط دفتر الملاحظات. يُمكن استخدام نفس المعلمة المُضافة مسبقاً إلى المسار.
ب. تسمية المعلمةعلى أنها مدخلاتوتوفير القيمة كتعبير خاص@pipeline().parameters.name.
للتحقق من صحة المسار، حدد زرالتحقق المُتاح على شريط الأدوات. لإغلاق إطار التحقق من الصحة، حدد زرالإغلاق.
حدد نشر الكل. ينشر واجهة Data Factory الكيانات (الخدمات المرتبطة وخط الأنابيب) إلى خدمة Azure Data Factory.
تتبع تشغيل البنية الأساسية
حدد إضافة مشغل على شريط الأدوات، ثم حدد المشغل الآن.
يطلب مربع حوار تشغيلمساراسمالمعلمة. استخدم /path/filename كمعلمة هنا. حدد موافق.
راقب عملية تشغيل البنية الأساسية لبرنامج ربط العمليات التجارية
انتقل إلى علامة تبويب Monitor. وتأكد من الاطلاع على تشغيل المسار. يستغرق إنشاء مجموعة مهام Databricks حوالي 5-8 دقائق، حيث يتم تنفيذ الكمبيوتر الدفتري.
حدد تحديث بشكل دوري للتحقق من حالة تشغيل البنية الأساسية لبرنامج ربط العمليات التجارية.
لعرض عمليات تشغيل النشاط المقترنة بتشغيل البنية الأساسية لبرنامج ربط العمليات التجارية، حدد الارتباط البنية الأساسية لبرنامج ربط العمليات التجارية 1 في عمود اسم البنية الأساسية لبرنامج ربط العمليات التجارية.
في الصفحة عمليات تشغيل النشاط، حدد الإخراج في العمود اسم النشاط لعرض إخراج كل نشاط، ويمكنك العثور على الارتباط إلى سجلات Databricks في جزء الإخراج للحصول على سجلات Spark أكثر تفصيلاً.
يُمكنك الانتقال مرة أخرى إلى طريقة عرض عمليات تشغيل البنية الأساسية لبرنامج ربط العمليات التجارية عن طريق تحديد ارتباط كل عمليات تشغيل البنية الأساسية لبرنامج ربط العمليات التجارية في قائمة التنقل بالأعلى.
تحقق من الإخراج
يمكنك تسجيل الدخول إلى مساحة Azure Databricks، والذهاب إلى Job Runs ويمكنك رؤية حالة Job ك pending التنفيذ، التشغيل، أو المنتهية.
يمكنك تحديد اسم الوظيفة والانتقال للاطلاع على مزيد من التفاصيل. عند التشغيل الناجح، يمكنك التحقق من صحة المعلمات التي تم تمريرها ومخرجات دفتر Python.
الملخص
يقوم المسار المذكور في النموذج بتشغيل Databricks Notebook activity وإكمال المعلمة. لقد تعرفت على كيفية:
إنشاء data factory.
إنشار المسار التي يستخدم Databricks Notebook Activity.
تتبع تشغيل البنية الأساسية
مراقبة تشغيل المسار.