تحليل موجزات الأخبار باستخدام تحليلات قريبة من الوقت الحقيقي باستخدام معالجة الصور واللغة الطبيعية

Azure Cosmos DB
Azure Functions
Azure Service Bus
Azure Translator Text
وجه Azure

يصف هذا السيناريو المثال البنية الأساسية لبرنامج ربط العمليات التجارية للاستيعاب الجماعي والتحليل القريب من الوقت الحقيقي للمستندات الواردة من موجزات أخبار RSS العامة. ويستخدم الخدمات المعرفية Azure لتوفير تفاصيل مفيدة استناداً إلى ترجمة النص والتعرف على الوجوه والكشف عن التوجه. على وجه التحديد، يتم توصيل خطوات معالجة الصور واللغة الطبيعية معاً في مسار المراسلة استناداً إلى ناقل خدمة Azure. إخراج البنية الأساسية للبنية الأساسية لبرنامج ربط العمليات التجارية هو إعلام يحتوي على التفاصيل أو التحليلات.

بناء الأنظمة

رسم تخطيطي للبنية: استيعاب وتحليل موجزات RSS باستخدام معالجة الصور والنصوص وإرسال الإعلامات.قم بتنزيل ملف Visio لهذه البنية.

تدفق البيانات

تتدفق البيانات من خلال الحل على النحو التالي:

  1. يعمل موجز أخبار RSS كمُنشئ يحصل على البيانات من مستند أو مقالة. على سبيل المثال، مع مقال، تتضمن البيانات عادةً عنواناً وملخصاً للنص الأصلي لعنصر الأخبار، وأحياناً صوراً.

  2. إن المُنشئ أو عملية الاستيعاب تُدرج المقالة وأي صور مقترنة في مجموعة قاعدة بيانات Azure Cosmos.

  3. يقوم الإعلام بتشغيل دالة استيعاب في Azure Functions التي تخزن نص المقالة في Azure Cosmos DB وصور المقالة (إن وجدت) في Azure Blob Storage. ثم يتم تمرير المقالة إلى قائمة الانتظار التالية.

  4. يتم تشغيل دالة ترجمة بواسطة حدث قائمة الانتظار. يتم استخدام واجهة برمجة تطبيقات ترجمة النص للخدمات المعرفية Azure للكشف عن اللغة والترجمة إذا لزم الأمر وجمع التوجه والعبارات الرئيسية والكيانات من النص والعنوان. ثم يتم تمرير المقالة إلى قائمة الانتظار التالية.

  5. يتم تشغيل دالة الكشف من المقالة المُوضوعة في قائمة الانتظار. يتم استخدام خدمة رؤية الكمبيوتر للكشف عن العناصر والمعالم والكلمات المكتوبة في الصورة المقترنة، ثم تُمرر المقالة إلى قائمة الانتظار التالية.

  6. يتم تشغيل دالة الوجه من المقالة المُوضوعة في قائمة الانتظار. يتم استخدام خدمة واجهة برمجة تطبيقات Azure Face للكشف عن وجوه للجنس والعمر في الصورة المقترنة، ثم تمرر المقالة إلى قائمة الانتظار التالية.

  7. عند اكتمال جميع الدوال، يتم تشغيل دالة الإعلام. يتم تحميل السجلات المُعالجة للمقالة ومسحها ضوئياً بحثاً عن أي نتائج تريدها. إذا تم العثور عليه، يتم وضع علامة على المحتوى ويتم إرسال إعلام إلى النظام الذي تختاره.

في كل خطوة من خطوات المعالجة، تكتب الدالة النتائج إلى قاعدة بيانات Azure Cosmos. في نهاية المطاف، يمكن استخدام البيانات حسب الرغبة. على سبيل المثال، يمكنك استخدامه لتحسين عمليات المشروع، أو تحديد موقع العملاء الجُدد، أو تحديد مشكلات رضا العملاء.

المكونات

يتم استخدام القائمة التالية لمكونات Azure في هذا المثال.

  • يتم استخدام وحدة تخزين Azure للاحتفاظ بملفات الصور والفيديو الأولية المقترنة بمقالة. يتم إنشاء حساب تخزين ثانوي باستخدام "خدمة تطبيقات Azure" ويُستخدم لاستضافة التعليمات البرمجية وسجلات "دوال Azure".

  • تحتوي قاعدة بيانات Azure Cosmos على معلومات عن تعقب النص والصور والفيديو. يتم أيضاً تخزين نتائج خطوات الخدمات المعرفية هنا.

  • تنفذ دوال Azure التعليمات البرمجية للدالة المُستخدمة للرد على رسائل قائمة الانتظار وتحويل المحتوى الوارد. تستضيف خدمة تطبيقات Azure التعليمات البرمجية للدوال وتعالج السجلات على نحوٍ تسلسلي. يتضمن هذا السيناريو خمس دوال: استيعاب وتحويل وكشف العنصر والوجه والإعلام.

  • يستضيف ناقل خدمة Azure قوائم انتظار ناقل خدمة Azure المستخدمة بواسطة الدوال.

  • توفر الخدمات المعرفية Azure الذكاء الاصطناعي للبنية الأساسية لبرنامج ربط العمليات التجارية استناداً إلى خدمة رؤية الكمبيوتر و واجهة برمجة تطبيقات Face وخدمة الترجمة الآلية لترجمة النص.

  • توفر Azure Application Insights تحليلات لمساعدتك في تشخيص المشكلات وفهم وظائف تطبيقك الخاص.

البدائل

  • بدلاً من استخدام نمط يستند إلى إعلام قائمة الانتظار ودوال Azure، يمكنك استخدام نمط موضوع واشتراك لتدفق البيانات هذا. يمكن استخدام موضوعات ناقل خدمة Azure لمعالجة الأجزاء المختلفة من المقالة بالتوازي بدلاً من المعالجة التسلسلية التي تم إجراؤها في هذا المثال. لمزيدٍ من المعلومات، بادر بمقارنة قوائم الانتظار والموضوعات.

  • استخدم Azure Logic Apps لتنفيذ التعليمات البرمجية الخاصة بالدوال وتنفيذ تأمين على مستوى السجل مثل ذلك الذي توفره خوارزمية Redlock (المطلوبة للمعالجة المتوازية حتى تدعم قاعدة بيانات Azure Cosmos التحديثات الجزئية للمستندات). لمزيد من المعلومات، قارن بين الدوال وLogic Apps.

  • نفِّذ هذا التصميم باستخدام مكونات الذكاء الاصطناعي المخصصة بدلاً من خدمات Azure الحالية. على سبيل المثال، توسيع البنية الأساسية لبرنامج ربط العمليات التجارية باستخدام نموذج مُخصص يكشف عن أشخاص معينين في صورةٍ بدلاً من بيانات إحصاء الأشخاص العامة والجنس والعمر التي تم جمعها في هذا المثال. لاستخدام التعلم الآلي المخصص أو نماذج الذكاء الاصطناعي مع هذا التصميم، بادر ببناء النماذج كنقاط نهاية RESTful بحيث يمكن استدعاؤها من دوال Azure.

  • استخدم آلية إدخال مختلفة بدلاً من موجزات RSS. استخدم مُنشئات متعددة أو عمليات استيعاب لتغذية قاعدة بيانات Azure Cosmos ووحدة تخزين Azure.

  • بحث Azure المعرفي هي ميزة الذكاء الاصطناعي في بحث Azure يمكن استخدامها أيضاً لاستخراج النص من الصور والكائنات الثنائية كبيرة الحجم ومصادر البيانات الأخرى غير المُنظَّمة.

تفاصيل السيناريو

يحتوي هذا السيناريو على أمثلة لموجزات الأخبار باللغات الإنجليزية و الروسية و الألمانية، ولكن يمكنك توسيعها بسهولة إلى موجزات RSS الأخرى واللغات الأخرى. لسهولة التوزيع، يستند جمع البيانات ومعالجتها وتحليلها بالكامل إلى خدمات Azure.

حالات الاستخدام المحتملة

على الرغم من أن هذا السيناريو يستند إلى معالجة موجزات RSS، فإنه ذو صلة بأي مستند أو موقع ويب أو مقالة تحتاج فيها إلى:

  • ترجمة النص إلى لغة من اختياره.
  • ابحث عن العبارات الرئيسية والكيانات وتوجه المستخدم في المحتوى الرقمي.
  • الكشف عن العناصر والنصوص والمعالم في الصور المقترنة بمقالةٍ رقميةٍ.
  • الكشف عن الأشخاص حسب الجنس والعمر في الصور المرتبطة بالمحتوى الرقمي.

الاعتبارات

تنفذ هذه الاعتبارات ركائز Azure Well-Architected Framework، وهو عبارة عن مجموعة من المبادئ التوجيهية التي يمكن استخدامها لتحسين جودة حمل العمل. لمزيد من المعلومات، راجع إطار العمل جيد التصميم في Microsoft Azure.

للتبسيط، يستخدم هذا السيناريو المثال عدداً قليلاً فقط من واجهات برمجة التطبيقات والخدمات المتوفرة من الخدمات المعرفية Azure. على سبيل المثال، يمكن تحليل النص في الصور باستخدام واجهة برمجة تطبيقات تحليلات النصوص. يفترض أن اللغة الهدف في هذا السيناريو هي اللغة الإنجليزية، ولكن يمكنك تغيير الإدخال إلى أي لغة مدعومة.

قابلية التوسع

يعتمد تحجيم دوال Azure على خطة الاستضافة التي تستخدمها. يفترض هذا الحل خطة استهلاك، حيث يتم تخصيص قوة الحساب تلقائياً للدوال عند الحاجة. أنت تدفع فقط عندما تكون الدوال خاصتك قيد التشغيل. هناك خيارٌ آخر وهو استخدام خطة مُخصصة، والتي تسمح لك بالتحجيم بين المستويات لتخصيص كمية مختلفة من الموارد.

باستخدام قاعدة بيانات Azure Cosmos، يكون الأساس هو توزيع حمل العمل خاصتك بالتساوي تقريباً بين عددٍ كبيرٍ بدرجةٍ كافيةٍ من مفاتيح الأقسام. لا يوجد حد لإجمالي كمية البيانات التي يمكن للحاوية تخزينها أو إجمالي مقدار معدل النقل الذي يمكن أن تدعمه الحاوية.

الإدارة والتسجيل

يستخدم هذا الحل Application Insights لجمع معلومات عن الأداء والتسجيل. يتم إنشاء مثيل Application Insights مع التوزيع في نفس مجموعة الموارد مثل الخدمات الأخرى المطلوبة لهذا التوزيع.

لعرض السجلات التي تم إنشاؤها بواسطة الحل:

  1. انتقِل إلى مدخل Azure، ثم انتقّل إلى مجموعة الموارد التي أنشأتها للتوزيع.

  2. حدد مثيل Application Insights.

  3. من قسم Application Insights، انتقل إلى Investigate\Search وابحث في البيانات.

الأمان

ويوفر عامل الأمان ضمانات للحماية من الهجمات المتعمدة واستغلال البيانات والأنظمة القيمة الخاصة بك. للمزيد من المعلومات، يرجى الرجوع إلى نظرة عامة على ركيزة الأمان.

تستخدم قاعدة بيانات Azure Cosmos اتصالاً آمناً وتوقيع وصول مشترك من خلال C# SDK التي توفرها Microsoft. لا توجد مساحات سطحية أخرى موجهه نحو الخارج. اكتشف المزيد عن أفضل ممارسات الأمان لقاعدة بيانات Azure Cosmos.

تحسين التكلفة

يركز تحسين التكلفة على البحث عن طرق للحد من النفقات غير الضرورية وتحسين الكفاءة التشغيلية. لمزيد من المعلومات، يرجى مراجعةنظرة عامة على ركيزة تحسين التكلفة.

قاعدة بيانات Azure Cosmos قوية ولكنها تتحمل أكبر تكلفة في هذا التوزيع. يمكنك استخدام حل تخزين آخر عن طريق إعادة بناء التعليمات البرمجية لدوال Azure المتوفرة.

تختلف أسعار دوال Azure وفقاً للخطة التي يتم تشغيلها فيها.

نشر هذا السيناريو

ملاحظة

يلزم أن يكون لديك حساب Azure مفعّل. إذا لم يكن لديك اشتراك Azure، فأنشئ حساباً مجانياً قبل أن تبدأ.

تتوفر جميع التعليمات البرمجية لهذا السيناريو في مستودع GitHub. يحتوي هذا المستودع على التعليمات البرمجية المصدر المُستخدَّمة لإنشاء تطبيق المُنشئ الذي يغذي البنية الأساسية لبرنامج ربط العمليات التجارية لهذا العرض التوضيحي.

الخطوات التالية

تصميمات التحليلات الإضافية: