اختيار تقنية تحليلات البيانات وإعداد التقارير في Azure

يتمثل الهدف من معظم حلول البيانات الضخمة في توفير رؤى حول البيانات من خلال التحليل وإعداد التقارير. يمكن أن يتضمن ذلك التقارير والمرئيات المكونة مسبقاً أو استكشاف البيانات التفاعلية.

ما خياراتك عند اختيار تقنية تحليلات البيانات؟

هناك العديد من الخيارات للتحليل والتصورات وإعداد التقارير في Azure، اعتماداً على احتياجاتك:

Power BI

Power BI عبارة عن مجموعة من أدوات تحليلات الأعمال. يمكنها الاتصال بالمئات من مصادر البيانات، ويمكن استخدامها للتحليل المخصص. راجع هذه القائمة من مصادر البيانات المتوفرة حالياً. استخدم Power BI Embedded لدمج Power BI داخل التطبيقات لديك دون الحاجة إلى أي ترخيص إضافي.

يمكن للمؤسسات استخدام Power BI لإنتاج التقارير ونشرها إلى المؤسسة. يمكن للجميع إنشاء لوحات معلومات مخصصة، مع الحوكمة والأمان المضمن. يستخدم Power BI معرف Microsoft Entra لمصادقة المستخدمين الذين يسجلون الدخول إلى خدمة Power BI، ويستخدم بيانات اعتماد تسجيل الدخول إلى Power BI كلما حاول مستخدم الوصول إلى الموارد التي تتطلب المصادقة.

دفاتر Jupyter

دفاتر ملاحظات Jupyter توفر shell المستندة إلى المستعرض التي تتيح لعلماء البيانات إنشاء ملفات دفتر ملاحظات تحتوي على تعليمات Python أو Scala أو R البرمجية ونص markdown، ما يجعلها طريقة فعالة للتعاون من خلال مشاركة التعليمات البرمجية وتوثيقها والنتائج في مستند واحد.

تأتي معظم أنواع مجموعات HDInsight، مثل Spark أو Hadoop، مكونة مسبقاً مع دفاتر ملاحظات Jupyter للتفاعل مع البيانات وإرسال المهام للمعالجة. اعتماداً على نوع نظام مجموعة HDInsight الذي تستخدمه، سيتم توفير نواة واحدة أو أكثر لتفسير التعليمات البرمجية وتشغيلها. على سبيل المثال، توفر مجموعات Spark على HDInsight نواة ذات صلة بـ Spark والتي يمكنك الاختيار من بينها لتنفيذ التعليمة البرمجية Python أو Scala باستخدام محرك Spark.

توفر دفاتر ملاحظات Jupyter بيئة رائعة لتحليل بياناتك وتصورها ومعالجتها قبل إنشاء مرئيات أكثر تقدماً باستخدام أداة المعلومات المهنية / إعداد التقارير، مثل Power BI.

دفتر ملاحظات Zeppelin

دفاتر ملاحظات Zeppelin هي خيار آخر لـ shell المستندة إلى المستعرض، على غرار Jupyter في الوظائف. تأتي بعض أنظمة مجموعات HDInsight مكونة مسبقاً باستخدام دفاتر ملاحظات Zeppelin. ومع ذلك، إذا كنت تستخدم مجموعة HDInsight Interactive Query (Hive LLAP)، فإن Zeppelin هو حالياً خيارك الوحيد من دفتر الملاحظات الذي يمكنك استخدامه لتشغيل استعلامات Apache Hive التفاعلية. أيضاً، إذا كنت تستخدم نظام مجموعة HDInsight المرتبط بالمجال، فإن دفاتر ملاحظات Zeppelin هي النوع الوحيد الذي يمكنك من تعيين تسجيلات دخول مستخدم مختلفة للتحكم في الوصول إلى دفاتر الملاحظات وجداول Hive الأساسية.

Jupyter Notebooks في VS Code

VS Code هو محرر تعليمة برمجية مجانية ومنصة تطوير يمكنك استخدامها محليا أو متصلة بالحوسبة عن بعد. جنبا إلى جنب مع ملحق Jupyter، فإنه يوفر بيئة كاملة لتطوير Jupyter التي يمكن تحسينها بملحقات لغة إضافية. إذا كنت تريد تجربة Jupyter مجانية وأفضل في فئتها مع القدرة على استخدام الحساب الذي تختاره، فهذا خيار رائع. باستخدام VS Code، يمكنك تطوير دفاتر الملاحظات وتشغيلها مقابل أجهزة التحكم عن بعد والحاويات. لتسهيل الانتقال من دفاتر ملاحظات Azure، قمنا بتوفير صورة الحاوية بحيث يمكن استخدامها مع VS Code أيضا.

Jupyter (IPython Notebook سابقا) هو مشروع مفتوح المصدر يتيح لك الجمع بسهولة بين نص Markdown ورمز مصدر Python القابل للتنفيذ على لوحة واحدة تسمى دفتر ملاحظات. يدعم Visual Studio Code العمل مع Jupyter Notebooks في الأصل، ومن خلال ملفات التعليمات البرمجية ل Python.

معايير تحديد المفتاح

لتضييق الخيارات، ابدأ بالإجابة على هذه الأسئلة:

  • هل تحتاج إلى الاتصال بالعديد من مصادر البيانات، ما يوفر مكاناً مركزياً لإنشاء تقارير للبيانات المنتشرة في جميع أنحاء مجالك؟ إذا كان الأمر كذلك، فاختر خياراً يسمح لك بالاتصال بالمئات من مصادر البيانات.

  • هل تريد تضمين المرئيات الديناميكية في موقع ويب أو تطبيق خارجي؟ إذا كان الأمر كذلك، فاختر خياراً يوفر إمكانات التضمين.

  • هل تريد تصميم المرئيات والتقارير أثناء عدم الاتصال؟ إذا كانت الإجابة بنعم، فحدد خيارًا به إمكانيات غير متصلة بالإنترنت.

  • هل تحتاج إلى قوة معالجة كبيرة لتدريب نماذج ذكاء اصطناعي كبيرة أو معقدة أو للعمل مع مجموعات بيانات كبيرة للغاية؟ إذا كانت الإجابة بنعم، فاختر خياراً يمكنه الاتصال بمجموعة بيانات كبيرة.

مصفوفة الإمكانات

تلخص الجداول التالية الاختلافات الرئيسية في القدرات.

الإمكانات العامة

الإمكانية Power BI دفاتر Jupyter دفتر ملاحظات Zeppelin Jupyter Notebooks في VS Code
الاتصال بنظام مجموعة البيانات الضخمة للمعالجة المتقدمة ‏‏نعم‬ نعم نعم لا
⁧⁩خدمة مدارة⁧ ‏‏نعم‬ نعم 1 نعم 1 ‏‏نعم‬
الاتصال بالمئات من مصادر البيانات ‏‏نعم‬ لا لا لا
إمكانية العمل دون اتصال نعم 2 لا لا لا
إمكانات التضمين ‏‏نعم‬ لا لا لا
التحديث التلقائي للبيانات ‏‏نعم‬ لا لا لا
الوصول إلى العديد من الحزم مفتوحة المصدر لا نعم 3 نعم 3 نعم 4
خيارات تحويل البيانات/تنظيفها Power Query، R 40 لغة، بما في ذلك Python وR وJulia وScala أكثر من 20 مترجماً، بما في ذلك Python وJDBC وR Python وF# وR
التسعير مجانا ل Power BI Desktop (التأليف)، راجع التسعير لخيارات الاستضافة مجاني مجاني مجاني
التعاون متعدد المستخدمين نعم نعم (من خلال المشاركة أو مع خادم متعدد المستخدمين، مثل JupyterHub) ‏‏نعم‬ نعم (من خلال المشاركة)

[1] عند استخدامه كجزء من نظام مجموعة HDInsight المدار.

[2] باستخدام Power BI Desktop.

[2] يمكنك البحث في مستودع Maven عن الحزم التي يساهم بها المجتمع.

[3] يمكن تثبيت حزم Python باستخدام إما pip أو Conda. يمكن تثبيت حزم R من CRAN أو GitHub. يمكن تثبيت الحزم في F# عبر nuget.org باستخدام مدير تبعية Paket.

المساهمون

تحتفظ Microsoft بهذه المقالة. وهي مكتوبة في الأصل من قبل المساهمين التاليين.

الكاتب الرئيسي:

الخطوات التالية