بدء استخدام أداة تسمية نموذج تحليل معلومات المستند

مقالة
03/28/2024

ينطبق هذا المحتوى على:v2.1.

تلميح

للحصول على تجربة محسنة وجودة نموذج متقدمة، جرب Document Intelligence v3.0 Studio.
يدعم v3.0 Studio أي نموذج مُدرّب على البيانات المسماة بـ v2.1.
يمكنك الرجوع إلى دليل ترحيل واجهة برمجة التطبيقات للحصول على معلومات مُفصّلة حول الترحيل من v2.1 إلى v3.0.
راجع التشغيل السريع لعدة تطوير البرامج لكل من واجهة برمجة تطبيقات REST أو C#‎ أو Java أو JavaScript أو Pythonلبدء استخدام إصدار 3.0.

أداة Azure الذكاء الاصطناعي Document Intelligence Sample Labeling هي أداة مصدر مفتوح تمكنك من اختبار أحدث ميزات خدمات ذكاء المستند والتعرف البصري على الأحرف (OCR):

تحليل المستندات باستخدام واجهة برمجة تطبيقات التخطيط. جرب واجهة برمجة تطبيقات التخطيط لاستخراج النص، والجداول، وعلامات التحديد، والبنية من المستندات.
تحليل المستندات باستخدام نموذج تم إنشاؤه مسبقًا. ابدأ بنموذج تم إنشاؤه مسبقا لاستخراج البيانات من الفواتير، أو الإيصالات، أو مستندات الهوية، أو بطاقات العمل.
تدريب وتحليل نموذج مخصص. استخدم نموذجًا مخصصًا لاستخراج البيانات من مستندات خاصة ببيانات العمل المميزة وحالات الاستخدام.

المتطلبات الأساسية

تحتاج إلى ما يلي للبدء:

اشتراك Azure - يمكنك إنشاء اشتراك مجانًا.
خدمات Azure الذكاء الاصطناعي أو مورد تحليل معلومات المستند. بمجرد أن يكون لديك اشتراك Azure، قم بإنشاء مورد معلومات مستند خدمة واحدة أو متعدد الخدمات في مدخل Microsoft Azure للحصول على المفتاح ونقطة النهاية. يمكنك استخدام مستوى التسعير الحر (F0) لتجربة الخدمة، والترقية لاحقًا إلى مستوى مدفوع للإنتاج.

تلميح

إنشاء مورد خدمات Azure الذكاء الاصطناعي إذا كنت تخطط للوصول إلى خدمات Azure الذكاء الاصطناعي المتعددة ضمن نقطة نهاية/مفتاح واحد. للوصول إلى Document Intelligence فقط، قم بإنشاء مورد Document Intelligence. يرجى ملاحظة أنك ستحتاج إلى مورد خدمة واحدة إذا كنت تنوي استخدام مصادقة Microsoft Entra.

إنشاء مورد تحليل معلومات المستند

انتقل إلى مدخل Microsoft Azure وأنشئ موردا جديدا ل Document Intelligence . في جزء إنشاء، قم بتوفير المعلومات التالية:

تفاصيل المشروع	‏‏الوصف
الاشتراك	حدد اشتراك Azure الذي تم منحه حق الوصول.
مجموعة الموارد	مجموعة موارد Azure التي تحتوي على المورد الخاص بك. يمكنك إنشاء مجموعة جديدة أو إضافتها إلى مجموعة موجودة مسبقًا.
المنطقة	موقع مورد خدمات Azure الذكاء الاصطناعي. قد تقدم مواقع مختلفة زمن الانتقال، ولكن ليس لها تأثير على توفر وقت التشغيل الخاص بالمورد.
الاسم	اسم وصفي للمورد الخاص بك. نوصي باستخدام اسم وصفي، على سبيل المثال MyNameFormRecognizer.
مستوى الأسعار	تعتمد تكلفة المورد على مستوى التسعير الذي تختاره واستخدامك. لمزيد من المعلومات، راجع تفاصيل تسعير واجهة برمجة التطبيقات.
مراجعة + إنشاء	حدد الزر "Review + create" لنشر المورد الخاص بك على مدخل Microsoft Azure.

قم باسترداد المفتاح ونقطة النهاية

عند انتهاء توزيع مورد Document Intelligence، ابحث عنه وحدده من قائمة All resources في المدخل. سيتم تحديد موقعها في صفحة مفتاح المورد ونقطة النهاية، ضمن إدارة الموارد. احفظ كلاً من هذه إلى موقع مؤقت قبل المضي قدمًا.

لقطة شاشة للمفاتيح وموقع نقطة النهاية في مدخل Microsoft Azure.

تحليل باستخدام نموذج تم إنشاؤه مسبقًا

يقدم Document Intelligence العديد من النماذج التي تم إنشاؤها مسبقا للاختيار من بينها. كل نموذج له مجموعة خاصة به من الحقول المدعومة. يعتمد النموذج الذي سيتم استخدامه للعملية Analyze على نوع المستند الذي سيتم تحليله. فيما يلي النماذج التي تم إنشاؤها مسبقا المدعومة حاليا من قبل خدمة Document Intelligence:

الفاتورة: استخراج النص، وعلامات التحديد، والجداول، وأزواج القيمة الرئيسية، والمعلومات الأساسية من الفواتير.
الإيصال: استخراج النص والمعلومات الأساسية من الإيصالات.
مستند المُعرف: استخرج النص والمعلومات الأساسية من رخص القيادة وجوازات السفر الدولية.
بطاقة العمل: تستخرج النص والمعلومات الأساسية من بطاقات العمل.

انتقل إلى Document Intelligence Sample Tool.
في الصفحة الرئيسية لأداة العينة، حدد لوحة استخدام النموذج الذي تم إنشاؤه مسبقا للحصول على البيانات .
حدد نوع النموذج لتحليله من القائمة المنسدلة.
اختر عنوان URL للملف الذي ترغب في تحليله من الخيارات التالية:
في مجال المصدر، حدد URL من القائمة المنسدلة، والصق عنوان URL المحدد، وحدد الزر إحضار.
في حقل نقطة نهاية خدمة Document Intelligence، الصق نقطة النهاية التي حصلت عليها باستخدام اشتراك Document Intelligence.
في حقل المفتاح ، الصق المفتاح الذي حصلت عليه من مورد Document Intelligence.
حدد تشغيل التحليل. تستدعي أداة تسمية نموذج تحليل معلومات المستند واجهة برمجة التطبيقات التي تم إنشاؤها مسبقا وتحليل المستند.
عرض النتائج - راجع أزواج قيم المفاتيح المستخرجة وعناصر السطر والنص المميز المستخرج والجداول المكتشفة.
قم بتنزيل ملف إخراج JSON لعرض النتائج التفصيلية.
- تحتوي عقدة "readResults" على كل سطر من النص مع موضع مربع الإحاطة الخاص به على الصفحة.
- تعرض عقدة "علامات التحديد" كل علامة تحديد (خانة اختيار، علامة راديو) وما إذا كانت حالتها selected أو unselected.
- يتضمن قسم "pageResults" الجداول المستخرجة. بالنسبة لكل جدول، يتم استخراج النص والصف وفهرس العمود، والصفوف والأعمدة الممتدة، ومربع الإحاطة، والمزيد.
- يحتوي الحقل "documentResults" على معلومات أزواج المفاتيح/ القيم ومعلومات عناصر البند للأجزاء الأكثر صلة من المستند.

تحليل التخطيط

تستخرج واجهة برمجة تطبيقات تخطيط ذكاء المستند من المستندات النص والجداول وعلامات التحديد ومعلومات البنية من المستندات (PDF وTIFF) والصور (JPG وPNG وBMP).

انتقل إلى Document Intelligence Sample Tool.
في الصفحة الرئيسية لأداة العينة حدد Use Layout to get text, tables and selection marks.
في حقل نقطة نهاية خدمة Document Intelligence، الصق نقطة النهاية التي حصلت عليها باستخدام اشتراك Document Intelligence.
في حقل المفتاح ، الصق المفتاح الذي حصلت عليه من مورد Document Intelligence.
في الحقل Source، حدد URL من القائمة المنسدلة، والصق عنوان URL https://raw.githubusercontent.com/Azure-Samples/cognitive-services-REST-api-samples/master/curl/form-recognizer/layout-page-001.jpg التالي، وحدد الزر Fetch.
حدد تشغيل التخطيط. تستدعي Analyze Layout API أداة تسمية نموذج تحليل معلومات المستند المستند وتحلله.
عرض النتائج - راجع النص المميز المستخرج وعلامات التحديد المكتشفة والجداول المكتشفة.
قم بتنزيل ملف إخراج JSON لعرض نتائج التخطيط التفصيلية.
- تحتوي العقدة readResults على كل سطر من النص مع موضع مربع الإحاطة الخاص به على الصفحة.
- تعرض العقدة selectionMarks كل علامة تحديد (خانة اختيار، علامة راديو) وما إذا كانت حالتها selected أوunselected.
- يتضمن pageResults القسم الجداول المستخرجة. بالنسبة لكل جدول، يتم استخراج النص والصف وفهرس العمود، والصفوف والأعمدة الممتدة، ومربع الإحاطة، والمزيد.

تدريب نموذج لنموذج مخصص

تدريب نموذج مخصص لتحليل واستخراج البيانات من النماذج والمستندات الخاصة بعملك. واجهة برمجة التطبيقات هي برنامج تعلم آلي مدرب على التعرف على حقول النموذج ضمن محتواك المميز واستخراج أزواج قيم المفاتيح وبيانات الجدول. تحتاج إلى خمسة أمثلة على الأقل من نفس نوع النموذج للبدء ويمكن تدريب النموذج المخصص الخاص بك مع مجموعات البيانات المسماة أو بدونها.

متطلبات تدريب نموذج لنموذج مخصص

حاوية Azure Storage للكائنات الثنائية كبيرة الحجم التي تحتوي على مجموعة من بيانات التدريب. تأكد من أن جميع وثائق التدريب هي من نفس الشكل. إذا كان لديك نماذج بتنسيقات متعددة، فقم بتنظيمها في مجلدات فرعية استنادًا إلى تنسيق شائع. لهذا المشروع، يمكنك استخدام مجموعة بيانات العينةالخاصة بنا.
إذا كنت لا تعرف كيفية إنشاء حساب تخزين Azure مع حاوية، اتبع التشغيل السريع لـ Azure Storage لمدخل Azure.
تكوين CORS

يجب تكوين CORS (مشاركة الموارد عبر المنشأ) على حساب تخزين Azure حتى يمكن الوصول إليه من Document Intelligence Studio. لتكوين CORS في مدخل Microsoft Azure، تحتاج إلى الوصول إلى علامة التبويب CORS لحساب التخزين الخاص بك.
1. حدد علامة التبويب CORS لحساب التخزين.
2. ابدأ بإنشاء إدخال CORS جديد في خدمة Blob.
3. قم بتعيين الأصول المسموح بها إلى https://fott-2-1.azurewebsites.net .
  
  تلميح
  
  يمكنك استخدام حرف البدل "*"، بدلاً من استخدام مجال محدد، للسماح لجميع مجالات الأصل بإجراء طلبات عبر CORS.
4. حدد كافة الخيارات الثمانية المتوفرة للأساليب المسموح بها.
5. الموافقة على كافة الرؤوس المسموح بها و الرؤوس المكشوفة عن طريق إدخال * في كل حقل.
6. تعيين الحد الأقصى للعمر إلى 120 ثانية أو أي قيمة مقبولة.
7. حدد زر الحفظ في أعلى الصفحة واحفظ التغييرات.

استخدام أداة تسمية العينة

انتقل إلى Document Intelligence Sample Tool.
في الصفحة الرئيسية لأداة العينة حدد Use custom form to train a model with labels and get key-value pairs.
حدد مشروع جديد

إنشاء مشروع جديد

قم بتكوين حقول إعدادات المشروع وتعبئة الحقول بالقيم التالية:

الاسم المعروض. قم بتسمية مشروعك.
رمز الأمان المميز. يقوم كل مشروع بإنشاء رمز أمان مميز تلقائيا يمكن استخدامه لتشفير/فك تشفير إعدادات المشروع الحساسة. يمكنك العثور على رموز الأمان في تطبيق الإعدادات عن طريق تحديد رمز الترس في الجزء السفلي من شريط التنقل الأيسر.
اتصال المصدر. تتصل أداة تسمية العينة بمصدر (النماذج الأصلية التي تم تحميلها) وهدف (تسميات تم إنشاؤها وبيانات إخراج). يمكن إعداد الاتصالات ومشاركتها عبر المشاريع. وهي تستخدم نموذج موفر قابل للتوسعة؛ بحيث يمكنك بسهولة إضافة مصدر جديد/ موفرين مستهدفين جدد.
- قم بإنشاء اتصال جديد، انقر فوق الزر إضافة اتصال. أكمل الحقول بالقيم التالية:
- الاسم المعروض. اسم الاتصال.
- الوصف. إضافة وصف مختصر.
- SAS URL. ألصق عنوان URL لتوقيع الوصول المشترك (SAS) لحاوية تخزين كائنات Azure الثنائية كبيرة الحجم.
- لاسترداد عنوان URL الخاص بـ SAS لبيانات تدريب النموذج المخصص، انتقل إلى مورد التخزين في مدخل Microsoft Azure وحدد علامة التبويب Storage Explorer. انتقل إلى الحاوية الخاصة بك، وانقر بزر الماوس الأيمن، وحدد Get shared access signature. من المهم الحصول على SAS لحاويتك، وليس لحساب التخزين نفسه. تأكد من اختيار الأذونات القراءة والكتابة وإزالة والقائمة، ثم انقر فوق Create. ثم انسخ القيمة الموجودة في قسم URL إلى موقع مؤقت. يجب أن يكون بالشكل: https://<storage account>.blob.core.windows.net/<container name>?<SAS value>.
مسار المجلد (اختياري). إذا كانت النماذج المصدر الخاصة بك موجودة داخل مجلد في حاوية كائن ثنائي كبير الحجم، حدد اسم المجلد.
Uri لخدمة تحليل معلومات المستند - عنوان URL لنقطة نهاية تحليل معلومات المستند.
مفتاح. مفتاح تحليل معلومات المستند.
إصدار واجهة برمجة التطبيقات. الاحتفاظ بقيمة v2.1 (الافتراضي).
الوصف (اختياري). وصف المشروع الخاص بك.

تسمية النماذج

صفحة المشروع الجديد

عند إنشاء أو فتح مشروع، يتم فتح إطار محرر العلامة الرئيسي. يتكون محرر العلامة من ثلاثة أجزاء:

جزء معاينة متغير الحجم يحتوي على قائمة نماذج قابلة للتمرير من اتصال المصدر.
جزء المحرر الرئيسي الذي يسمح لك بتطبيق العلامات.
جزء محرر العلامات الذي يسمح للمستخدمين بتعديل العلامات وتأمينها، وإعادة ترتيبها وحذفها.

تحديد النص والجداول

حدد Run Layout on unvisited documents في الجزء الأيسر للحصول على معلومات تخطيط النص والجدول لكل مستند. ترسم أداة التسمية مربعات إحاطة حول كل عنصر نصي.

تعرض أداة التسمية أيضا الجداول التي تم استخراجها تلقائيا. حدد أيقونة الجدول/الشبكة على الجانب الأيمن من المستند واطلع على الجدول المستخرج. نظرا لاستخراج محتوى الجدول تلقائيا، لا نقوم بتسمية محتوى الجدول، ولكننا نعتمد على الاستخراج التلقائي.

تصور الجدول في أداة تسمية العينة.

تطبيق التسميات على النص

بعد ذلك، يمكنك إنشاء علامات (تسميات) وتطبيقها على عناصر النص التي تريد أن يحللها النموذج. لاحظ أن مجموعة بيانات تسمية العينة تتضمن حقولا مسماة بالفعل؛ نضيف حقلا آخر.

استخدم جزء محرر العلامات لإنشاء علامة جديدة تريد تحديدها:

حدد + علامة الجمع لإنشاء علامة جديدة.
أدخل اسم العلامة "الإجمالي".
حدد Enter لحفظ العلامة.
في المحرر الرئيسي، حدد القيمة الإجمالية من عناصر النص المميز.
حدد علامة الإجمالي لتطبيقها على القيمة، أو اضغط على مفتاح لوحة المفاتيح المطابق. يتم تعيين مفاتيح الأرقام كمفاتيح اختصار لأول 10 علامات. يمكنك إعادة ترتيب العلامات باستخدام رموز السهم لأعلى ولأسفل في جزء محرر العلامة. اتبع هذه الخطوات لتسمية جميع النماذج الخمسة في عينة مجموعة البيانات:
تلميح

ضع النصائح التالية في الاعتبار عند تسمية نماذجك:
- يمكنك تطبيق علامة واحدة فقط على كل عنصر نص محدد.
- يمكن تطبيق كل علامة مرة واحدة فقط لكل صفحة. إذا ظهرت قيمة عدة مرات في نفس النموذج، فقم بإنشاء علامات مختلفة لكل مثيل. على سبيل المثال: "الفاتورة # 1" ، "الفاتورة # 2" وهلم جرًا.
- لا يمكن أن تمتد العلامات عبر الصفحات.
- قيم التسمية كما تظهر في النموذج، لا تحاول تقسيم قيمة إلى قسمين مع علامتين مختلفتين. على سبيل المثال، يجب تسمية حقل عنوان بعلامة واحدة حتى إذا كان يمتد عبر أسطر متعددة.
- لا تقم بتضمين المفاتيح في الحقول ذات العلامات⁧—⁩القيم فقط.
- يجب الكشف عن بيانات الجدول تلقائيًا، وستكون متوفرة في ملف JSON للإخراج النهائي في قسم 'pageResults'. ومع ذلك، إذا فشل النموذج في الكشف عن كافة بيانات الجدول، يمكنك أيضًا تسمية نموذج وتدريبه على اكتشاف الجداول، راجع تدريب نموذج مخصص | تسمية النماذج الخاصة بك
- استخدم الأزرار الموجودة على يمين + للبحث عن العلامات وإعادة تسميتها وإعادة ترتيبها وحذفها.
- لحذف علامة مطبقة دون حذف العلامة نفسها، حدد المستطيل المعلم في طريقة عرض المستند، واضغط على مفتاح الحذف.

تسمية العينات.

تدريب نموذج مخصص

اختر أيقونة التدريب في الجزء الأيمن وافتح صفحة التدريب. ثم حدد الزر Train لبدء تدريب النموذج. بمجرد اكتمال عملية التدريب، سترى المعلومات التالية:

معرف النموذج - معرف النموذج الذي تم إنشاؤه وتدريبه. يعمل كل استدعاء للتدريب على إنشاء نموذج جديد مع المعرف الخاص به. انسخ هذه السلسلة إلى موقع آمن؛ تحتاج إليها إذا كنت تريد إجراء استدعاءات التنبؤ من خلال واجهة برمجة تطبيقات REST أو مكتبة العميل.
متوسط الدقة - متوسط دقة النموذج. يمكنك تحسين دقة النموذج عن طريق تسمية المزيد من النماذج وإعادة التدريب لإنشاء نموذج جديد. نوصي بالبدء بتسمية خمسة نماذج لتحليل النتائج واختبارها، ثم إضافة المزيد من النماذج حسب الحاجة إذا لزم الأمر.
قائمة العلامات، والدقة المقدرة لكل علامة. لمزيد من المعلومات، راجعتفسير وتحسين الدقة والثقة.

تحليل نموذج مخصص

حدد الأيقونة Analyze من شريط التنقل واختبر النموذج الخاص بك.
حدد Local file المصدر واستعرض بحثاً عن ملف لتحديده من مجموعة بيانات العينة التي قمت بفكها في مجلد الاختبار.
اختر الزر Run analysis للحصول على توقعات أزواج المفاتيح/القيم والنصوص والجداول للنموذج. تطبق الأداة العلامات في مربعات الإحاطة وتبلغ عن ثقة كل علامة.

هكذا! لقد تعلمت كيفية استخدام أداة نموذج Document Intelligence ل Document Intelligence التي تم إنشاؤها مسبقا والتخطيط والنماذج المخصصة. كما تعلمت تحليل نموذج مخصص مع بيانات مسماة يدويا.

الخطوات التالية

Document Intelligence Studio