التشغيل السريع: إنشاء تجمع Apache Spark بدون خادم جديد باستخدام بوابة Azure

يقدم Azure Synapse Analytics محركات تحليلات مختلفة لمساعدتك في استيعاب بياناتك، وتحويلها، ونمذجتها، وتحليلها، وتوزيعها. يوفر تجمع Apache Spark قدرات حساب البيانات الضخمة مفتوحة المصدر. بعد إنشاء تجمع Apache Spark في مساحة عمل Synapse، يمكن تحميل البيانات ونمذجتها ومعالجتها وتوزيعها للحصول على رؤية تحليلية أسرع.

في هذه البداية السريعة، يمكنك معرفة كيفية استخدام المدخل Azure لإنشاء تجمع Apache Spark في مساحة عمل Synapse.

هام

يتم تصنيف الفوترة لمثيلات Spark كل دقيقة، سواء كنت تستخدمها أم لا. تأكد من إيقاف تشغيل مثيل Spark بعد الانتهاء من استخدامه أو تحديد مهلة قصيرة. لمزيد من المعلومات، راجع قسم تنظيف الموارد من هذه المقالة.

في حال لم يكن لديك اشتراك Azure، فأنشئ حساباً مجانيّاً قبل البدء.

المتطلبات الأساسية

سجِّل الدخول إلى مدخل Azure

سجِّل الدخول إلى مدخل Azure

  1. انتقل إلى مساحة عمل Synapse حيث سيتم إنشاء تجمع Apache Spark بكتابة اسم الخدمة (أو اسم المورد مباشرة) في شريط البحث. Screenshot of the Azure portal search bar with Synapse workspaces typed in.

  2. من قائمة مساحات العمل، اكتب اسم (أو جزءًا من الاسم) لمساحة العمل لفتحها. على سبيل المثال، نستخدم مساحة عمل تسمى contosoanalytics. Screenshot from the Azure portal of the list of Synapse workspaces filtered to show those containing the name Contoso.

إنشاء مجموعة Apache Spark جديدة بدون خادم

هام

تم إهمال وقت تشغيل Azure Synapse ل Apache Spark 2.4 ولم يتم دعمه رسميا منذ سبتمبر 2023. نظرا إلى أن Spark 3.1 وSpark 3.2 هما أيضا انتهاء الدعم المعلن، نوصي العملاء بالترحيل إلى Spark 3.3.

  1. في مساحة عمل Synapse حيث تريد إنشاء تجمع، حدد New Apache Spark pool. Screenshot from the Azure portal of a Synapse workspace with a red box around the command to create a new Apache Spark pool.

  2. أدخل التفاصيل التالية في علامة التبويب الأساسيات :

    الإعدادات القيمة المقترحة الوصف
    اسم تجمع Apache Spark اسم تجمع صالح، مثل contosospark إنه الاسم الذي سيحمله تجمع Apache Spark.
    حجم العقدة صغير (4 vCPU / 32 GB) تعيين هذا إلى أصغر حجم لتقليل التكاليف لهذه البداية السريعة
    التحجيم التلقائي ⁧⁩مُعطل⁧⁩ نحن لسنا بحاجة إلى مقياس تلقائي لهذه البداية السريعة
    عدد العقد 5 استخدام حجم صغير للحد من التكاليف لهذه البداية السريعة

    Screenshot from the Azure portal of the Apache Spark pool create flow - basics tab.

    هام

    هناك قيود محددة للأسماء التي يمكن أن تستخدمها تجمعات Apache Spark. يجب أن تحتوي الأسماء على أحرف أو أرقام فقط، ويجب أن تكون 15 حرفًا أو أقل، ويجب أن تبدأ بحرف، ولا تحتوي على كلمات محجوزة، وأن تكون فريدة في مساحة العمل.

  3. حدد التالي: إعدادات إضافية وراجع الإعدادات الافتراضية. لا تقم بتعديل أي إعدادات افتراضية. Screenshot from the Azure portal that shows the 'Create Apache Spark pool' page with the 'Additional settings' tab selected.

  4. حدد Next: tags. ضع في اعتبارك استخدام علامات Azure. على سبيل المثال، علامة "المالك" أو "CreatedBy" لتحديد من أنشأ المورد، وعلامة "البيئة" لتحديد ما إذا كان هذا المورد في الإنتاج والتطوير وما إلى ذلك. لمزيد من المعلومات، راجع تطوير استراتيجية التسمية ووضع العلامات لموارد Azure. Screenshot from the Azure portal of Apache Spark pool create flow - additional settings tab.

  5. حدد "Review + create".

  6. تأكد من أن التفاصيل تبدو صحيحة اعتمادًا على ما تم إدخاله مسبقًا وحدد Create. Screenshot from the Azure portal of Apache Spark pool create flow - review settings tab.

  7. في هذه المرحلة، سيبدأ تدفق توفير الموارد، مشيرًا عند اكتماله. Screenshot from the Azure portal of that shows the 'Overview' page with a 'Your deployment is complete' message displayed.

  8. بعد اكتمال التوفير، سيُظهر الانتقال مرة أخرى إلى مساحة العمل إدخالاً جديدًا لتجمع Apache Spark المخصص الذي تم إنشاؤه حديثًا. Screenshot from the Azure portal of Apache Spark pool create flow - resource provisioning.

  9. عند هذه النقطة، لا توجد موارد قيد التشغيل، ولا توجد رسوم لـ Spark، لقد قمت بإنشاء بيانات تعريف حول مثيلات Spark التي تريد إنشاءَها.

تنظيف الموارد

تحذف الخطوات التالية تجمع Apache Spark من مساحة العمل.

تحذير

سيؤدي حذف تجمع Apache Spark إلى إزالة محرك التحليلات من مساحة العمل. لن يكون من الممكن الاتصال بالتجمع، ولن تعمل كافة الاستعلامات وخطوط الأنابيب وأجهزة الكمبيوتر المحمولة التي تستخدم تجمع Apache Spark هذا.

إذا كنت تريد حذف تجمع Apache Spark، فقم بالخطوات التالية:

  1. انتقل إلى جزء تجمعات Apache Spark في مساحة العمل.
  2. حدد تجمع Apache Spark ليتم حذفه (في هذه الحالة، contosospark).
  3. حدد حذف. Screenshot from the Azure portal of a list of Apache Spark pools, with the recently created pool selected.
  4. قم بتأكيد الحذف، وحدد الزر حذف . Screenshot from the Azure portal of the Confirmation dialog to delete the selected Apache Spark pool.
  5. عند إكمال العملية بنجاح، لن يتم سرد وعاء Spark Apache في موارد مساحة العمل.