استخدام خدمات Azure الذكاء الاصطناعي لأتمتة تعريف المستند وتصنيفه والبحث فيه
توضح هذه المقالة بنية يمكنك استخدامها لمعالجة مستندات مختلفة. تستخدم البنية ميزة الدوال الدائمة ل Azure Functions لتنفيذ البنية الأساسية لبرنامج ربط العمليات التجارية. تعالج المسارات المستندات عبر Azure الذكاء الاصطناعي Document Intelligence.
بناء الأنظمة
قم بتنزيل ملف Visio لهذه البنية.
سير العمل
يقوم المستخدم بتحميل ملف مستند إلى تطبيق ويب. يحتوي الملف على مستندات مضمنة متعددة من أنواع مختلفة، مثل ملفات PDF أو ملفات تنسيق ملف صورة العلامة متعددة الصفحات (TIFF). يتم تخزين ملف المستند في Azure Blob Storage (1a). لبدء معالجة البنية الأساسية لبرنامج ربط العمليات التجارية، يضيف تطبيق الويب رسالة أمر إلى قائمة انتظار التخزين (1b).
تؤدي رسالة الأمر إلى تشغيل تنسيق الدوال الدائمة. تحتوي الرسالة على بيانات تعريف تعرف موقع Blob Storage لملف المستند المراد معالجته. يعالج كل مثيل دوال دائمة ملف مستند واحد فقط.
تستدعي دالة نشاط التحليل واجهة برمجة تطبيقات تحليل معلومات المستند، التي تمرر موقع تخزين ملف المستند المراد معالجته. تقوم دالة التحليل بقراءة كل مستند وتحديده داخل ملف المستند. ترجع هذه الدالة اسم كل مستند مضمن ونوعه ونطاقات صفحاته ومحتوىه إلى التنسيق.
تحفظ وظيفة نشاط مخزن بيانات التعريف معلومات نوع المستند والموقع ونطاق الصفحة لكل مستند في مخزن Azure Cosmos DB.
تنشئ دالة نشاط الفهرسة مستند بحث جديدا في Azure الذكاء الاصطناعي Search لكل مستند. في مستند البحث، تستخدم هذه الدالة مكتبات البحث الذكاء الاصطناعي ل .NET لتضمين نتائج التعرف البصري على الحروف (OCR) الكاملة ومعلومات المستند. تتم إضافة معرف ارتباط أيضا إلى مستند البحث بحيث يمكن مطابقة نتائج البحث مع بيانات تعريف المستند المقابلة من Azure Cosmos DB.
يمكن للمستخدمين البحث عن المستندات باستخدام المحتويات وبيانات التعريف. للبحث عن سجلات المستندات الموجودة في Azure Cosmos DB، يمكنهم استخدام معرفات الارتباط في مجموعة نتائج البحث. تتضمن السجلات ارتباطات إلى ملف المستند الأصلي في Blob Storage.
المكونات
الدوال الدائمة هي ميزة من ميزات Azure Functions التي يمكنك استخدامها لكتابة وظائف ذات حالة في بيئة حساب بلا خادم. في هذه البنية، تؤدي الرسالة في قائمة انتظار التخزين إلى تشغيل مثيل وظائف دائمة، والذي يبدأ وينسق البنية الأساسية لمعالجة المستندات.
Azure Cosmos DB هي قاعدة بيانات متعددة النماذج موزعة عالميا يمكنك استخدامها في حلولك لتوسيع نطاق الإنتاجية وسعة التخزين عبر أي عدد من المناطق الجغرافية. تضمن اتفاقيات مستوى الخدمة الشاملة (SLAs) معدل النقل وزمن الانتقال والتوافر والاتساق. تستخدم هذه البنية Azure Cosmos DB كمخزن بيانات التعريف لمعلومات تصنيف المستندات.
Azure Storage عبارة عن مجموعة من الخدمات السحابية الآمنة والقابلة للتطوير بشكل كبير للبيانات والتطبيقات وأحمال العمل. وهو يتضمن Blob Storage وAzure Files وAzure Table Storage وAzure Queue Storage. تستخدم هذه البنية Blob Storage لتخزين ملفات المستندات التي يقوم المستخدم بتحميلها والتي تعالجها البنية الأساسية لبرنامج ربط العمليات التجارية للوظائف الدائمة.
توفر Azure App Service إطار عمل لإنشاء تطبيقات الويب ونشرها وتوسيع نطاقها. ميزة تطبيقات الويب في App Service هي أداة مستندة إلى HTTP يمكنك استخدامها لاستضافة تطبيقات الويب وواجهات برمجة تطبيقات REST والنهايات الخلفية للأجهزة المحمولة. استخدم تطبيقات الويب للتطوير في .NET أو .NET Core أو Java أو Ruby أو Node.js أو PHP أو Python. يمكن تشغيل التطبيقات بسهولة وتوسيع نطاقها في البيئات المستندة إلى Windows وLinux. في هذه البنية، يتفاعل المستخدمون مع نظام معالجة المستندات من خلال تطبيق ويب مستضاف بواسطة App Service.
الذكاء الاصطناعي Document Intelligence هي خدمة يمكنك استخدامها لاستخراج نتائج التحليلات من المستندات والنماذج والصور. تستخدم هذه البنية الذكاء الاصطناعي Document Intelligence لتحليل ملفات المستندات واستخراج المستندات المضمنة إلى جانب معلومات المحتوى وبيانات التعريف.
يوفر الذكاء الاصطناعي Search تجربة بحث غنية للمحتوى الخاص والمتنوع في تطبيقات الويب والجوال والمؤسسة. تستخدم هذه البنية الذكاء الاصطناعي Search لفهرسة محتوى المستند المستخرج ومعلومات بيانات التعريف بحيث يمكن للمستخدمين البحث عن المستندات واستردادها.
البدائل
لتسهيل التوزيع العالمي، يخزن هذا الحل بيانات التعريف في Azure Cosmos DB. قاعدة بيانات Azure SQL هي خيار تخزين دائم آخر لبيانات تعريف المستند والمعلومات.
لتشغيل مثيلات الدوال الدائمة، يمكنك استخدام الأنظمة الأساسية الأخرى للمراسلة، بما في ذلك ناقل خدمة Azure.
تفاصيل السيناريو
في هذه البنية، تحدد المسارات المستندات في ملف مستند، وتصنفها حسب النوع، وتخزن المعلومات لاستخدامها في المعالجة اللاحقة.
تحتاج العديد من الشركات إلى إدارة المستندات التي تقوم بفحصها بشكل مجمع ومعالجتها والتي تحتوي على عدة أنواع مستندات مختلفة، مثل ملفات PDF أو صور TIFF متعددة الصفحات. قد تنشأ هذه المستندات من خارج المؤسسة، ولا تتحكم الشركة المتلقية في التنسيق.
نظرا لهذه القيود، يجب على المؤسسات بناء حلول تحليل المستندات الخاصة بها والتي يمكن أن تتضمن تقنية مخصصة وعمليات يدوية. على سبيل المثال، قد يقوم شخص ما بفصل أنواع المستندات الفردية يدويا وإضافة مؤهلات التصنيف لكل مستند.
تستند العديد من هذه الحلول المخصصة إلى نمط سير عمل جهاز الحالة. تستخدم الحلول أنظمة قاعدة البيانات لاستمرار حالة سير العمل واستخدام خدمات التحقق التي تتحقق من الحالات التي يحتاجون إلى معالجتها. يمكن أن يؤدي الحفاظ على هذه الحلول وتعزيزها إلى زيادة التعقيد والجهد.
تحتاج المؤسسات إلى حلول موثوقة وقابلة للتطوير ومرنة لمعالجة وإدارة تحديد المستندات وتصنيفها لأنواع المستندات الخاصة بمؤسستها. يمكن لهذا الحل معالجة ملايين المستندات كل يوم مع إمكانية المراقبة الكاملة في نجاح أو فشل مسار المعالجة.
حالات الاستخدام المحتملة
يمكنك استخدام هذا الحل من أجل:
عناوين التقرير. تدير العديد من الوكالات الحكومية والبلديات السجلات الورقية التي لا تحتوي على نموذج رقمي. يمكن أن يقوم الحل التلقائي الفعال بإنشاء ملف يحتوي على جميع المستندات التي تحتاجها لتلبية طلب مستند.
إدارة سجلات الصيانة. قد تحتاج إلى مسح السجلات الورقية وإرسالها، مثل سجلات الطائرات والقاطرة وصيانة الآلات، إلى مؤسسات خارجية.
تصاريح العملية. تحتفظ الإدارات التي تسمح بالمدينة والمقاطعة بوثائق ورقية تقوم بتوليدها لتقارير تفتيش التصاريح. يمكنك التقاط صورة لعدة مستندات فحص وتحديد وتصنيف والبحث تلقائيا عبر هذه السجلات.
الاعتبارات
تنفذ هذه الاعتبارات ركائز Azure Well-Architected Framework، وهو عبارة عن مجموعة من المبادئ التوجيهية التي يمكن استخدامها لتحسين جودة حمل العمل. لمزيد من المعلومات، يرجى مراجعةMicrosoft Azure Well-Architected Framework.
الموثوقيه
تضمن الموثوقية أن التطبيق الخاص بك يمكن أن يفي بالالتزامات التي تتعهد بها لعملائك. لمزيد من المعلومات، راجع قائمة اختيار مراجعة التصميم للموثوقية.
يحتوي حمل العمل الموثوق به على كل من المرونة والتوافر. المرونة هي قدرة النظام على التعافي من حالات الفشل والاستمرار في العمل. الهدف من المرونة هو إعادة التطبيق إلى حالة تعمل بشكل كامل بعد حدوث فشل. يقيس التوفر ما إذا كان بإمكان المستخدمين الوصول إلى حمل العمل الخاص بك عندما يحتاجون إلى ذلك.
للحصول على معلومات الموثوقية حول مكونات الحل، راجع معلومات اتفاقية مستوى الخدمة ل Azure خدمات الإنترنت.
تحسين التكلفة
يتعلق تحسين التكلفة بالبحث عن طرق لتقليل النفقات غير الضرورية وتحسين الكفاءة التشغيلية. لمزيد من المعلومات، راجع قائمة اختيار مراجعة التصميم لتحسين التكلفة.
تتضمن التكاليف الأكثر أهمية لهذه البنية تخزين الصور في حساب التخزين ومعالجة صورة خدمات Azure الذكاء الاصطناعي ومتطلبات سعة الفهرس في الذكاء الاصطناعي Search.
لتحسين التكاليف:
استخدم نهج السعة ودورة الحياة المحجوزة لإضفاء حقوق على حسابات التخزين.
التخطيط لعمليات النشر الإقليمية وجدولة توسيع النطاق التشغيلي في الذكاء الاصطناعي Search.
استخدم تسعير مستوى الالتزام الذكاء الاصطناعي Document Intelligence لإدارة التكاليف التي يمكن التنبؤ بها.
استخدم استراتيجية الدفع أولا بأول لهيكلك وتوسيع نطاقها حسب الحاجة بدلا من الاستثمار في موارد واسعة النطاق في البداية.
ضع في اعتبارك تكاليف الفرصة في البنية الخاصة بك وموازنة استراتيجية الميزة الأولى مقابل استراتيجية المتابعة السريعة. لتقدير التكلفة الأولية والتكاليف التشغيلية، استخدم حاسبة التسعير.
إنشاء الميزانيات وعناصر التحكم التي تحدد حدود التكلفة للحل الخاص بك. لإعداد التنبؤ وتنبيهات التكلفة الفعلية، استخدم تنبيه الموازنة.
كفاءة الأداء
كفاءة الأداء هي قدرة حمل العمل الخاص بك على التوسع لتلبية الطلبات التي يضعها المستخدمون عليه بطريقة فعالة. لمزيد من المعلومات، راجع قائمة اختيار مراجعة التصميم لكفاءة الأداء.
يمكن أن يعرض هذا الحل اختناقات الأداء عند معالجة كميات كبيرة من البيانات. لضمان كفاءة الأداء المناسبة للحل الخاص بك، تأكد من فهم خيارات تحجيم Azure Functions والتخطيط لها، والتحجيم التلقائي لخدمات Azure الذكاء الاصطناعي، وتقسيم Azure Cosmos DB.
المساهمون
تحتفظ Microsoft بهذه المقالة. وهي مكتوبة في الأصل من قبل المساهمين التاليين.
الكاتب الرئيسي:
- كيفن كراوس | أخصائي Azure التقني الرئيسي
لمشاهدة ملفات تعريف LinkedIn غير العامة، سجل الدخول إلى LinkedIn.
الخطوات التالية
مقالات تمهيدية:
- مقدمة إلى Azure Storage
- ما هي الدوال الدائمة؟
- ما هي خدمات Azure الذكاء الاصطناعي؟
- ما هو الذكاء الاصطناعي Document Intelligence؟
- ما المقصود ب "البحث الذكاء الاصطناعي"؟
- نظرة عامة على App Service
- مقدمة إلى Azure Cosmos DB
- ما هو Azure Service Bus؟
وثائق المنتج:
- وثائق Azure لجميع المنتجات
- وثائق الدوال الدائمة
- وثائق خدمات Azure الذكاء الاصطناعي
- الذكاء الاصطناعي وثائق البحث