البرنامج التعليمي: تحليل تقارير مخزون الكائنات الثنائية كبيرة الحجم

من خلال فهم كيفية تخزين الكائنات الثنائية كبيرة الحجم والحاويات وتنظيمها واستخدامها في الإنتاج، يمكنك تحسين المقايضات بين التكلفة والأداء بشكل أفضل.

يوضح لك هذا البرنامج التعليمي كيفية إنشاء إحصائيات وتصورها مثل نمو البيانات بمرور الوقت، والبيانات المضافة بمرور الوقت، وعدد الملفات المعدلة، وأحجام لقطة الكائنات الثنائية كبيرة الحجم، وأنماط الوصول عبر كل طبقة، وكيفية توزيع البيانات حاليا ومع مرور الوقت (على سبيل المثال: البيانات عبر المستويات وأنواع الملفات والحاويات وأنواع الكائنات الثنائية كبيرة الحجم).

في هذا البرنامج التعليمي، تتعلم كيفية:

  • إنشاء تقرير مخزون كائن ثنائي كبير الحجم
  • إعداد مساحة عمل Synapse
  • إعداد Synapse Studio
  • إنشاء بيانات تحليلية في Synapse Studio
  • تصور النتائج في Power BI

المتطلبات الأساسية

إنشاء تقرير مخزون

تمكين تقارير مخزون الكائن الثنائي كبير الحجم لحساب التخزين الخاص بك. راجع تمكين تقارير مخزون كائن ثنائي كبير الحجم ل Azure Storage.

قد تضطر إلى الانتظار لمدة تصل إلى 24 ساعة بعد تمكين تقارير المخزون لإنشاء تقريرك الأول.

إعداد مساحة عمل Synapse

  1. أنشئ مساحة عمل Azure Synapse. راجع إنشاء مساحة عمل Azure Synapse.

    إشعار

    كجزء من إنشاء مساحة العمل، ستقوم بإنشاء حساب تخزين يحتوي على مساحة اسم هرمية. يخزن Azure Synapse جداول Spark وسجلات التطبيق إلى هذا الحساب. يشير Azure Synapse إلى هذا الحساب كحساب تخزين أساسي. لتجنب الارتباك، تستخدم هذه المقالة مصطلح حساب تقرير المخزون للإشارة إلى الحساب الذي يحتوي على تقارير المخزون.

  2. في مساحة عمل Synapse، قم بتعيين دور المساهم إلى هوية المستخدم. راجع Azure RBAC: دور المالك لمساحة العمل.

  3. امنح مساحة عمل Synapse الإذن للوصول إلى تقارير المخزون في حساب التخزين الخاص بك عن طريق الانتقال إلى حساب تقرير المخزون الخاص بك، ثم تعيين دور Storage Blob Data Contributor إلى الهوية المدارة للنظام لمساحة العمل. راجع تعيين أدوار Azure باستخدام مدخل Microsoft Azure.

  4. انتقل إلى حساب التخزين الأساسي وقم بتعيين دور Blob Storage Contributor إلى هوية المستخدم.

إعداد Synapse Studio

  1. افتح مساحة عمل Synapse في Synapse Studio. راجع فتح Synapse Studio.

  2. في Synapse Studio، تأكد من تعيين هويتك لدور مسؤول Synapse. راجع Synapse RBAC: دور مسؤول Synapse لمساحة العمل.

  3. أنشئ مجموعة Apache Spark. راجع إنشاء تجمع Apache Spark بلا خادم.

إعداد نموذج دفتر الملاحظات وتشغيله

في هذا القسم، ستقوم بإنشاء بيانات إحصائية ستقوم بتصورها في تقرير. لتبسيط هذا البرنامج التعليمي، يستخدم هذا القسم نموذج ملف تكوين ونموذج دفتر ملاحظات PySpark. يحتوي دفتر الملاحظات على مجموعة من الاستعلامات التي يتم تنفيذها في Azure Synapse Studio.

تعديل وتحميل نموذج ملف التكوين

  1. قم بتنزيل ملف BlobInventoryStorageAccountConfiguration.json .

  2. تحديث العناصر النائبة التالية لهذا الملف:

    • تعيين storageAccountName إلى اسم حساب تقرير المخزون الخاص بك.

    • تعيين destinationContainer إلى اسم الحاوية التي تحتوي على تقارير المخزون.

    • قم بتعيين blobInventoryRuleName إلى اسم قاعدة تقرير المخزون التي أنشأت النتائج التي تريد تحليلها.

    • تعيين accessKey إلى مفتاح الحساب لحساب تقرير المخزون.

  3. قم بتحميل هذا الملف إلى الحاوية في حساب التخزين الأساسي الذي حددته عند إنشاء مساحة عمل Synapse.

استيراد نموذج دفتر ملاحظات PySpark

  1. قم بتنزيل دفتر ملاحظات نموذج ReportAnalysis.ipynb .

    إشعار

    تأكد من حفظ هذا الملف بالملحق .ipynb .

  2. افتح مساحة عمل Synapse في Synapse Studio. راجع فتح Synapse Studio.

  3. في Synapse Studio، حدد علامة التبويب Develop .

  4. حدد علامة الجمع (+) لإضافة عنصر.

  5. حدد استيراد، واستعرض وصولا إلى نموذج الملف الذي قمت بتنزيله، وحدد هذا الملف، وحدد فتح.

    يظهر مربع الحوار خصائص.

  6. في مربع الحوار خصائص ، حدد الارتباط تكوين جلسة العمل .

    لقطة شاشة لمربع الحوار

    يتم فتح مربع الحوار تكوين جلسة العمل.

  7. في القائمة المنسدلة إرفاق بمربع الحوار تكوين جلسة العمل، حدد تجمع Spark الذي قمت بإنشائه سابقا في هذه المقالة. ثم حدد الزر تطبيق .

تعديل دفتر ملاحظات Python

  1. في الخلية الأولى من دفتر ملاحظات Python، قم بتعيين قيمة storage_account المتغير إلى اسم حساب التخزين الأساسي.

  2. قم بتحديث قيمة container_name المتغير إلى اسم الحاوية في هذا الحساب الذي حددته عند إنشاء مساحة عمل Synapse.

  3. حدد الزر نشر.

تشغيل دفتر ملاحظات PySpark

  1. في دفتر ملاحظات PySpark، حدد تشغيل الكل.

    سيستغرق الأمر بضع دقائق لبدء جلسة Spark ودقائق قليلة أخرى لمعالجة تقارير المخزون. قد يستغرق التشغيل الأول بعض الوقت إذا كان هناك العديد من تقارير المخزون لمعالجتها. ستقوم عمليات التشغيل اللاحقة بمعالجة تقارير المخزون الجديدة التي تم إنشاؤها منذ التشغيل الأخير فقط.

    إشعار

    إذا أجريت أي تغييرات على دفتر الملاحظات، تشغيل دفتر الملاحظات، فتأكد من نشر هذه التغييرات باستخدام الزر نشر .

  2. تحقق من تشغيل دفتر الملاحظات بنجاح عن طريق تحديد علامة التبويب البيانات .

    يجب أن تظهر قاعدة بيانات تسمى reportdata في علامة التبويب Workspace في جزء Data. إذا لم تظهر قاعدة البيانات هذه، فقد تحتاج إلى تحديث صفحة الويب.

    لقطة شاشة لجزء البيانات الذي يعرض قاعدة بيانات التقرير

    تحتوي قاعدة البيانات على مجموعة من الجداول. يحتوي كل جدول على معلومات تم الحصول عليها عن طريق تشغيل الاستعلامات من دفتر ملاحظات PySpark.

  3. لفحص محتويات جدول، قم بتوسيع مجلد الجداول في قاعدة بيانات التقرير . ثم انقر بزر الماوس الأيمن فوق جدول، وحدد Select SQL script، ثم حدد Select TOP 100 rows.

    لقطة شاشة لخيار القائمة لإنشاء برنامج نصي sql جديد

  4. يمكنك تعديل الاستعلام حسب الحاجة ثم تحديد تشغيل لعرض النتائج.

    لقطة شاشة لمحرر الاستعلام ونتائج الاستعلام

عرض البيانات

  1. قم بتنزيل ملف تقرير نموذج ReportAnalysis.pbit .

  2. افتح Power BI Desktop. للحصول على إرشادات التثبيت، راجع الحصول على Power BI Desktop.

  3. في Power BI، حدد ملف، افتح التقرير، ثم استعرض التقارير.

  4. في مربع الحوار فتح، قم بتغيير نوع الملف إلى ملفات قالب Power BI (*.pbit).

    لقطة شاشة لنوع ملفات قالب Power BI الذي يظهر في مربع الحوار

  5. استعرض وصولا إلى موقع ملف ReportAnalysis.pbit الذي قمت بتنزيله، ثم حدد فتح.

    يظهر مربع حوار يطلب منك توفير اسم مساحة عمل Synapse واسم قاعدة البيانات.

  6. في مربع الحوار، قم بتعيين الحقل synapse_workspace_name إلى اسم مساحة العمل وتعيين حقل database_name إلى reportdata. ثم حدد الزر تحميل .

    لقطة شاشة لمربع حوار تكوين التقرير

    يظهر تقرير يوفر مرئيات للبيانات التي تم استردادها بواسطة دفتر الملاحظات. تعرض الصور التالية أنواع المخططات والرسوم البيانية التي تظهر في هذا التقرير.

    لقطة شاشة لعلامة تبويب النظرة العامة للتقرير

    لقطة شاشة لعلامة تبويب التحليل التفصيلي للتقرير

    لقطة شاشة لعلامة تبويب التصنيف التفصيلي للتقرير

الخطوات التالية