نماذج معالجة المستندات

هام

  • توفر إصدارات المعاينة العامة ل Document Intelligence وصولا مبكرا إلى الميزات قيد التطوير النشط.
  • قد تتغير الميزات والنهج والعمليات، قبل التوفر العام (GA)، استنادا إلى ملاحظات المستخدم.
  • إصدار المعاينة العامة لمكتبات عميل Document Intelligence افتراضيا إلى إصدار REST API 2024-02-29-preview.
  • يتوفر إصدار المعاينة العامة 2024-02-29-preview حاليا فقط في مناطق Azure التالية:
  • شرق الولايات المتحدة
  • غرب الولايات المتحدة 2
  • غرب أوروبا

ينطبق هذا المحتوى على:علامهv4.0 (معاينة) | الإصدارات السابقة:علامة اختيار زرقاءv3.1 (GA)علامة اختيار زرقاءv3.0 (GA)علامة اختيار زرقاءv2.1 (GA)

ينطبق هذا المحتوى على:علامهv3.1 (GA) | أحدث إصدار:علامة اختيار أرجوانيةv4.0 (معاينة) | الإصدارات السابقة:علامة اختيار زرقاءv3.0علامة اختيار زرقاءv2.1

ينطبق هذا المحتوى على:علامهv3.0 (GA) | أحدث الإصدارات:علامة اختيار أرجوانيةv4.0 (معاينة)علامة اختيار أرجوانيةv3.1 | الإصدار السابق:علامة اختيار زرقاءv2.1

ينطبق هذا المحتوى على:علامهv2.1 | أحدث إصدار:علامة اختيار زرقاءv4.0 (معاينة)

يدعم Azure الذكاء الاصطناعي Document Intelligence مجموعة واسعة من النماذج التي تمكنك من إضافة معالجة مستندات ذكية إلى تطبيقاتك وتدفقاتك. يمكنك استخدام نموذج خاص بالمجال تم إنشاؤه مسبقا أو تدريب نموذج مخصص مصمم خصيصا لحاجة عملك وحالات الاستخدام المحددة. يمكن استخدام ذكاء المستند مع مكتبة عميل REST API أو Python وC# وJava وJavaScript.

نظرة عامة على النموذج

يعرض الجدول التالي النماذج المتوفرة لكل معاينة حالية وواجهة برمجة تطبيقات مستقرة:

نوع النموذج النموذج معاينة 2024-02-29
رمز نقطي 2023-10-31-معاينة
2023-07-31 (GA) 2022-08-31 (GA) الإصدار 2.1 (GA)
نماذج تحليل المستندات مقروء ✔️ ✔️ ✔️ غير متوفر
نماذج تحليل المستندات تخطيط ✔️ ✔️ ✔️ ✔️
نماذج تحليل المستندات المستند العام تم نقله إلى التخطيط** ✔️ ✔️ غير متوفر
النماذج المُنشأة مسبقًا ‏‏عقد ✔️ ✔️ غير متوفر غير متوفر
النماذج المُنشأة مسبقًا بطاقة التأمين الصحي ✔️ ✔️ ✔️ غير متوفر
النماذج المُنشأة مسبقًا مستند المعرف ✔️ ✔️ ✔️ ✔️
النماذج المُنشأة مسبقًا فاتورة ✔️ ✔️ ✔️ ✔️
النماذج المُنشأة مسبقًا استلام ✔️ ✔️ ✔️ ✔️
النماذج المُنشأة مسبقًا ضريبة الولايات المتحدة 1040* ✔️ ✔️ غير متوفر غير متوفر
النماذج المُنشأة مسبقًا ضريبة الولايات المتحدة الأمريكية 1098* ✔️ غير متوفر غير متوفر غير متوفر
النماذج المُنشأة مسبقًا ضريبة الولايات المتحدة الأمريكية 1099* ✔️ غير متوفر غير متوفر غير متوفر
النماذج المُنشأة مسبقًا ضريبة W2 الأمريكية ✔️ ✔️ ✔️ غير متوفر
النماذج المُنشأة مسبقًا عنوان URL للرهن العقاري الأمريكي 1003 ✔️ غير متوفر غير متوفر غير متوفر
النماذج المُنشأة مسبقًا ملخص الرهن العقاري الأمريكي 1008 ✔️ غير متوفر غير متوفر غير متوفر
النماذج المُنشأة مسبقًا الإفصاح عن إغلاق الرهن العقاري في الولايات المتحدة ✔️ غير متوفر غير متوفر غير متوفر
النماذج المُنشأة مسبقًا شهادة زواج ✔️ غير متوفر غير متوفر غير متوفر
النماذج المُنشأة مسبقًا بطاقة الائتمان ✔️ غير متوفر غير متوفر غير متوفر
النماذج المُنشأة مسبقًا بطاقة العمل مهملة ✔️ ✔️ ✔️
نموذج تصنيف مخصص مصنف مخصص ✔️ ✔️ غير متوفر غير متوفر
نموذج استخراج مخصص عصبي مخصص. ✔️ ✔️ ✔️ غير متوفر
نموذج الطرح المخصص قالب مخصص ✔️ ✔️ ✔️ ✔️
نموذج استخراج مخصص مخصص مكون ✔️ ✔️ ✔️ ✔️
جميع النماذج إمكانات الوظيفة الإضافية ✔️ ✔️ غير متوفر غير متوفر

* - يحتوي على نماذج فرعية. راجع معلومات النموذج المحددة للتباينات والأنواع الفرعية المدعومة.

إمكانية الوظيفة الإضافية وظيفة إضافية/مجانية معاينة 2024-02-29
&رمز نقطي [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-2024-02-29-preview&preserve-view=true
2023-07-31 (GA) 2022-08-31 (GA) الإصدار 2.1 (GA)
استخراج خاصية الخط الوظيفة الإضافية ✔️ ✔️ غير متوفر غير متوفر
استخراج الصيغة الوظيفة الإضافية ✔️ ✔️ غير متوفر غير متوفر
استخراج عالي الدقة الوظيفة الإضافية ✔️ ✔️ غير متوفر غير متوفر
استخراج الرمز الشريطي مجاني ✔️ ✔️ غير متوفر غير متوفر
اكتشاف اللغات مجاني ✔️ ✔️ غير متوفر غير متوفر
أزواج القيمة الرئيسية مجاني ✔️ غير متوفر غير متوفر غير متوفر
حقول الاستعلام الوظيفة الإضافية* ✔️ غير متوفر غير متوفر غير متوفر

ميزات تحليل النموذج

معرف النموذج استخراج المحتوى حقول الاستعلام الفقرات أدوار الفقرة علامات التحديد الجداول أزواج قيم المفاتيح اللغات الباركود تحليل المستندات الصيغ* نمط الخط* دقة عالية*
prebuilt-read O O O O O
prebuilt-layout O O O O O
prebuilt-document O O O O O
prebuilt-businessCard
عقد مسبق الإنشاء O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
بطاقة ائتمان مسبقة الإنشاء O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closeDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(variations) O O O O O
prebuilt-tax.us.1040(variations) O O O O O
{ customModelName } O O O O O

✓ - تمكين
O - اختياري
* - ميزات Premium تتحمل تكاليف إضافية

الوظيفة الإضافية* - يتم تسعير حقول الاستعلام بشكل مختلف عن ميزات الوظيفة الإضافية الأخرى. للحصول على تفاصيل؛ تأكد من مراجعة الأسعار.

النموذج الوصف
نماذج تحليل المستندات
قراءة التعرف البصري على الحروف استخراج النص المطبوع والمكتوب بخط اليد بما في ذلك الكلمات والمواقع واللغات المكتشفة.
تحليل التخطيط استخراج عناصر تخطيط النص والمستند مثل الجداول وعلامات التحديد والعناوين وعناوين المقاطع والمزيد.
نماذج تم إنشاؤها مسبقا
بطاقة التأمين الصحي أتمتة عمليات الرعاية الصحية عن طريق استخراج شركة التأمين والعضو والوصفات الطبية ورقم المجموعة ومعلومات رئيسية أخرى من بطاقات التأمين الصحي الأمريكية.
نماذج المستندات الضريبية في الولايات المتحدة معالجة النماذج الضريبية الأمريكية لاستخراج الموظف وصاحب العمل والأجر ومعلومات أخرى.
نماذج مستندات الرهن العقاري في الولايات المتحدة معالجة نماذج الرهن العقاري في الولايات المتحدة لاستخراج قرض المقترض ومعلومات الممتلكات.
‏‏عقد استخراج تفاصيل الاتفاقية والطرفاة.
فاتورة أتمتة الفواتير.
استلام استخراج بيانات الإيصال من الإيصالات.
مستند الهوية (المعرف) استخراج حقول الهوية (المعرف) من رخصة القيادة الأمريكية وجوازات السفر الدولية.
بطاقة العمل امسح بطاقات العمل ضوئيا لاستخراج الحقول والبيانات الرئيسية في تطبيقاتك.
نماذج مخصصة
نموذج مخصص (نظرة عامة) استخراج البيانات من النماذج والمستندات الخاصة بعملك. يتم تدريب النماذج المخصصة على بياناتك المميزة وحالات الاستخدام الخاصة بك.
نماذج استخراج مخصصة تستخدم نماذج القوالب المخصصة الإشارات التخطيطية لاستخراج القيم من المستندات وهي مناسبة لاستخراج الحقول من المستندات ذات البنية العالية باستخدام قوالب مرئية محددة.
يتم تدريب النماذج العصبية المخصصة على أنواع المستندات المختلفة لاستخراج الحقول من المستندات المنظمة وشبه المنظمة وغير المنظمة.
نموذج تصنيف مخصص يمكن لنموذج التصنيف المخصص تصنيف كل صفحة في ملف إدخال لتحديد المستندات داخل ويمكنه أيضا تحديد مستندات متعددة أو مثيلات متعددة لمستند واحد داخل ملف إدخال.
نماذج مكونة ادمج العديد من النماذج المخصصة في نموذج واحد لأتمتة معالجة أنواع المستندات المتنوعة مع نموذج واحد مكون.

بالنسبة لجميع النماذج، باستثناء نموذج بطاقة العمل، يدعم Document Intelligence الآن قدرات الوظيفة الإضافية للسماح بتحليل أكثر تعقيدا. يمكن تمكين هذه الإمكانات الاختيارية وتعطيلها اعتمادا على سيناريو استخراج المستند. هناك سبع إمكانات إضافية متاحة 2023-07-31 لإصدار واجهة برمجة التطبيقات (GA) والإصدارات الأحدث من واجهة برمجة التطبيقات:

تفاصيل النموذج

يصف هذا القسم الإخراج الذي يمكنك توقعه من كل نموذج. يرجى ملاحظة أنه يمكنك توسيع إخراج معظم النماذج باستخدام ميزات الوظيفة الإضافية.

قراءة OCR

تقوم واجهة برمجة تطبيقات القراءة بتحليل واستخراج الأسطر والكلمات ومواقعها واللغات المكتشفة والنمط المكتوب بخط اليد إذا تم اكتشافها.

نموذج مستند تمت معالجته باستخدام Document Intelligence Studio:

لقطة شاشة لنموذج مستند تمت معالجته باستخدام Document Intelligence Studio Read

تحليل التخطيط

يقوم نموذج تحليل التخطيط بتحليل واستخراج النص والجداول وعلامات التحديد وعناصر البنية الأخرى مثل العناوين وعناوين المقاطع ورؤوس الصفحات وتذييلات الصفحات والمزيد.

نموذج مستند تمت معالجته باستخدام Document Intelligence Studio:

لقطة شاشة لصفحة صحيفة نموذجية تمت معالجتها باستخدام Document Intelligence Studio.

بطاقة التأمين الصحي

يجمع نموذج بطاقة التأمين الصحي بين قدرات التعرف البصري على الحروف (OCR) القوية ونماذج التعلم العميق لتحليل واستخراج المعلومات الرئيسية من بطاقات التأمين الصحي الأمريكية.

عينة من بطاقة التأمين الصحي الأمريكية التي تمت معالجتها باستخدام Document Intelligence Studio:

لقطة شاشة لنموذج تحليل بطاقة التأمين الصحي في الولايات المتحدة في Document Intelligence Studio.

وثائق الضرائب الأمريكية

تقوم نماذج المستندات الضريبية الأمريكية بتحليل واستخراج الحقول الرئيسية وعناصر السطر من مجموعة محددة من المستندات الضريبية. تدعم واجهة برمجة التطبيقات تحليل المستندات الضريبية باللغة الإنجليزية الأمريكية ذات التنسيقات والجودة المختلفة بما في ذلك الصور الملتقطة بالهاتف والمستندات الممسوحة ضوئيا وملفات PDF الرقمية. النماذج التالية مدعومة حاليا:

النموذج ‏‏الوصف معرف النموذج
ضريبة الولايات المتحدة W-2 استخراج تفاصيل التعويض الخاضعة للضريبة. prebuilt-tax.us.W-2
ضريبة الولايات المتحدة 1040 استخراج تفاصيل فوائد الرهن العقاري. prebuilt-tax.us.1040(variations)
ضريبة الولايات المتحدة 1098 استخراج تفاصيل فوائد الرهن العقاري. prebuilt-tax.us.1098(variations)
ضريبة الولايات المتحدة 1099 استخراج الدخل المتلقاة من مصادر أخرى غير صاحب العمل. prebuilt-tax.us.1099(variations)

نموذج مستند W-2 تمت معالجته باستخدام Document Intelligence Studio:

لقطة شاشة من عينة W-2

وثائق الرهن العقاري في الولايات المتحدة

تقوم نماذج وثيقة الرهن العقاري الأمريكية بتحليل واستخراج الحقول الرئيسية بما في ذلك المقترض والقرض ومعلومات الممتلكات من مجموعة مختارة من وثائق الرهن العقاري. تدعم واجهة برمجة التطبيقات تحليل وثائق رهن الولايات المتحدة باللغة الإنجليزية من مختلف الأشكال والجودة بما في ذلك الصور التي تم التقاطها عبر الهاتف والمستندات الممسوحة ضوئيا وملفات PDF الرقمية. النماذج التالية مدعومة حاليا:

النموذج ‏‏الوصف معرف النموذج
اتفاقية ترخيص المستخدم النهائي (EULA) 1003 استخراج القرض، المقترض، تفاصيل الملكية. prebuilt-mortgage.us.1003
مستند ملخص 1008 استخراج تفاصيل المقترض والبائع والعقارات والرهن العقاري والكتابة. prebuilt-mortgage.us.1008
إغلاق الكشف استخراج الإغلاق وتكاليف المعاملات وتفاصيل القرض. prebuilt-mortgage.us.closeDisclosure
شهادة زواج استخراج تفاصيل معلومات الزواج لمقدمي القروض المشتركة. Prebuilt-marriageCertificate
ضريبة الولايات المتحدة W-2 استخراج تفاصيل التعويض الخاضعة للضريبة للتحقق من الدخل. prebuilt-tax.us.W-2

نموذج مستند كشف الإغلاق الذي تمت معالجته باستخدام Document Intelligence Studio:

لقطة شاشة لكشف إغلاق العينة.

Contract

يقوم نموذج العقد بتحليل واستخراج الحقول الرئيسية والبنود الأساسية من الاتفاقيات التعاقدية بما في ذلك الأطراف والولاية القضائية ومعرف العقد والمسمى الوظيفي. يدعم النموذج حاليا مستندات العقد باللغة الإنجليزية.

نموذج العقد الذي تمت معالجته باستخدام Document Intelligence Studio:

لقطة شاشة لاستخراج نموذج العقد باستخدام Document Intelligence Studio.

الفاتورة

يقوم نموذج الفاتورة بأتمتة معالجة الفواتير لاستخراج اسم العميل وعنوان الفوترة وتاريخ الاستحقاق والمبلغ المستحق وعناصر السطر والبيانات الرئيسية الأخرى. حالياً، يدعم النموذج الفواتير المُحررة باللغة الإنجليزية، والإسبانية، والألمانية، والفرنسية، والإيطالية، والبرتغالية، والهولندية.

نموذج فاتورة تمت معالجته باستخدام Document Intelligence Studio:

لقطة شاشة من عينة فاتورة.

الإيصال

استخدم نموذج الإيصال لفحص إيصالات المبيعات بحثا عن اسم التاجر والتواريخ وعناصر الأسطر والكميات والإجماليات من الإيصالات المطبوعة والمكتوبة بخط اليد. يدعم الإصدار v3.0 أيضا معالجة إيصالات الفندق من صفحة واحدة.

نموذج إيصال تمت معالجته باستخدام Document Intelligence Studio:

لقطة شاشة لعينة الايصال

مستند الهوية (المعرف)

استخدم نموذج وثيقة الهوية (ID) لمعالجة تراخيص القيادة الأمريكية (جميع الولايات الخمسين ومقاطعة كولومبيا) وصفحات السيرة الذاتية من جوازات السفر الدولية (باستثناء التأشيرة ووثائق السفر الأخرى) لاستخراج الحقول الرئيسية.

نموذج رخصة القيادة الأمريكية التي تمت معالجتها باستخدام Document Intelligence Studio:

لقطة شاشة لنموذج بطاقة تعريف

شهادة زواج

استخدم نموذج شهادة الزواج لمعالجة شهادات الزواج الأمريكية لاستخراج الحقول الرئيسية بما في ذلك الأفراد والتاريخ والموقع.

نموذج شهادة زواج أمريكية تمت معالجتها باستخدام Document Intelligence Studio:

لقطة شاشة لشهادة زواج نموذجية.

بطاقة الائتمان

استخدم نموذج بطاقة الائتمان لمعالجة بطاقات الائتمان والخصم لاستخراج الحقول الرئيسية.

نموذج بطاقة الائتمان التي تمت معالجتها باستخدام Document Intelligence Studio:

لقطة شاشة لبطاقة ائتمان نموذجية.

النماذج المخصصة

يمكن تصنيف النماذج المخصصة على نطاق واسع إلى نوعين. نماذج التصنيف المخصصة التي تدعم تصنيف "نوع المستند" ونماذج الاستخراج المخصصة التي يمكنها استخراج مخطط محدد من نوع مستند معين.

رسم تخطيطي أنواع النماذج المخصصة وأوضاع بناء النموذج المقترنة.

تقوم نماذج المستندات المخصصة بتحليل واستخراج البيانات من النماذج والمستندات الخاصة بعملك. يتم تدريبهم على التعرف على حقول النموذج داخل المحتوى المميز واستخراج أزواج قيم المفاتيح وبيانات الجدول. تحتاج فقط إلى مثال واحد لنوع النموذج للبدء.

يدعم الإصدار v3.0 النموذج المخصص الكشف عن التوقيع في قالب مخصص (نموذج) وجداول عبر الصفحات في كل من القالب والنماذج العصبية.

نموذج قالب مخصص تمت معالجته باستخدام Document Intelligence Studio:

لقطة شاشة لنافذة تحليل أداة تحليل المعلومات للمستندات بشكل مخصص.

استخراج مخصص

يمكن أن يكون نموذج الاستخراج المخصص واحدا من نوعين، قالب مخصص أو عصبي مخصص. لإنشاء نموذج استخراج مخصص، قم بتسمية مجموعة بيانات من المستندات بالقيم التي تريد استخراجها وتدريب النموذج على مجموعة البيانات المسماة. تحتاج فقط إلى خمسة أمثلة من نفس نوع النموذج أو المستند للبدء.

نموذج استخراج مخصص تمت معالجته باستخدام Document Intelligence Studio:

لقطة شاشة لتحليل نموذج الاستخراج المخصص في Document Intelligence Studio.

مصنف مخصص

يمكنك نموذج التصنيف المخصص من تحديد نوع المستند قبل استدعاء نموذج الاستخراج. يتوفر نموذج التصنيف بدءا من 2023-07-31 (GA) واجهة برمجة التطبيقات. يتطلب تدريب نموذج تصنيف مخصص فئتين متميزتين على الأقل وخمس عينات كحد أدنى لكل فئة.

نماذج مكونة

يُنشأ النموذج المُركب بتسجيل مجموعة من النماذج المخصصة وتعيينها إلى نموذج واحد مُعد من أنواع نماذجك. يمكنك تعيين نماذج مخصصة متعددة لنموذج مكون يسمى بمعرف نموذج واحد. يمكنك تعيين ما يصل إلى 200 نموذج مخصص مدرب لنموذج واحد مكون.

نافذة مربع الحوار "نموذج مكون" في Document Intelligence Studio:

لقطة شاشة لنافذة مربع حوار Document Intelligence Studio لإنشاء نموذج مخصص.

متطلبات الإدخال

  • للحصول على أفضل النتائج، قم بتوفير صورة واحدة واضحة أو مسح ضوئي عالي الجودة لكل مستند.

  • تنسيقات الملفات المعتمدة:

    النموذج PDF الصورة:
    JPEG/JPG، PNG، BMP، TIFF، HEIF
    Microsoft Office:
    Word (DOCX) وExcel (XLSX) وPowerPoint (PPTX) وHTML
    قراءة
    Layout ✔ (معاينة 2024-02-29، 2023-10-31-preview)
    مستند عام
    منشأ مسبقًا
    استخراج مخصص
    تصنيف مخصص ✔ (2024-02-29-preview)
  • بالنسبة لملفات PDF وTIFF، يمكن معالجة ما يصل إلى 2000 صفحة (بالنسببة للاشتراك المجاني، تتم معالجة أول صفحتين فقط).

  • حجم الملف لتحليل المستندات هو 500 ميغابايت للطبقة المدفوعة (S0) و4 ميغابايت للمستوى المجاني (F0).

  • يجب أن تتراوح أبعاد الصورة بين 50 × 50 بكسل و 10000 بكسل × 10000 بكسل.

  • إذا كانت ملفات PDF الخاصة بك مؤمنة بكلمة مرور، فيجب عليك إزالة القفل قبل الإرسال.

  • الحد الأدنى لارتفاع النص المراد استخراجه هو 12 بكسل لصورة 1024 × 768 بكسل. يتوافق هذا البعد مع نص نقطة تقريبا 8عند 150 نقطة لكل بوصة (DPI).

  • بالنسبة للتدريب على النموذج المخصص، الحد الأقصى لعدد صفحات بيانات التدريب هو 500 لنموذج القالب المخصص و50000 للنموذج العصبي المخصص.

    • لتدريب نموذج الاستخراج المخصص، يبلغ الحجم الإجمالي لبيانات التدريب 50 ميغابايت لنموذج القالب و1G-MB للنموذج العصبي.

    • بالنسبة لتدريب نموذج التصنيف المخصص، يكون الحجم الإجمالي لبيانات 1GB التدريب بحد أقصى 10000 صفحة.

إشعار

لا تدعم أداة Sample Labeling تنسيق ملف BMP. هذا قيد على الأداة وليس خدمة معلومات المستند.

ترحيل الإصدار

تعرف على كيفية استخدام Document Intelligence v3.0 في تطبيقاتك باتباع دليل ترحيل Document Intelligence v3.1

النموذج الوصف
تحليل المستند
تخطيط استخراج معلومات النص والتخطيط من المستندات.
معده مسبقا
فاتورة استخراج المعلومات الرئيسية من الفواتير الإنجليزية والإسبانية.
استلام استخراج المعلومات الرئيسية من الإيصالات الإنجليزية.
مستند المعرف استخراج المعلومات الرئيسية من رخص القيادة الأمريكية وجوازات السفر الدولية.
بطاقة العمل استخراج المعلومات الرئيسية من بطاقات العمل المُحررة باللغة الإنجليزية.
مخصص
مخصص استخراج البيانات من النماذج والمستندات الخاصة بعملك. يتم تدريب النماذج المخصصة على بياناتك المميزة وحالات الاستخدام الخاصة بك.
تتالف أنشئ مجموعة من النماذج المخصصة وعينها إلى نموذج واحد مُعد من أنواع نماذجك.

Layout

تتولى واجهة برمجة تطبيقات التخطيط تحليل النص، والجداول، والعناوين، وعلامات التحديد، ومعلومات البنية واستخراجها من المستندات.

نموذج مستند تمت معالجته باستخدام أداة تسمية العينة:

لقطة شاشة لتحليل

الفاتورة

يتولى نموذج الفاتورة تحليل المعلومات الرئيسية واستخراجها من فواتير المبيعات. تتولى واجهة برمجة التطبيقات تحليل الفواتير ذات التنسيقات المختلفة واستخراج المعلومات الرئيسية مثل: اسم العميل، وعنوان الفاتورة، وتاريخ الاستحقاق، والمبلغ المستحق.

نموذج فاتورة تمت معالجته باستخدام أداة تسمية العينة:

لقطة شاشة لتحليل فاتورة نموذجي باستخدام أداة تسمية العينة.

الإيصال

  • يتولى نموذج الإيصال تحليل المعلومات الرئيسية واستخراجها من إيصالات المبيعات المطبوعة والمكتوبة بخط اليد.

تمت معالجة إيصال العينة باستخدام أداة تسمية العينة:

لقطة شاشة لعينة الايصال

مستند معرف

يتولى نموذج مستند المعرف تحليل المعلومات الرئيسية واستخراجها من المستندات الآتية:

  • رخصة القيادة الأمريكية (جميع الولايات الخمسين ومقاطعة كولومبيا)

  • صفحات السيرة الذاتية من جوازات السفر الدولية (باستثناء التأشيرة ووثائق السفر الأخرى). تتولى واجهة برمجة التطبيقات تحليل مستندات الهوية واستخراجها

تمت معالجة نموذج رخصة القيادة الأمريكية باستخدام أداة تسمية العينة:

لقطة شاشة لنموذج بطاقة تعريف

بطاقة العمل

يتولى نموذج بطاقة العمل تحليل المعلومات الرئيسية واستخراجها من صور بطاقة العمل.

نموذج بطاقة العمل التي تمت معالجتها باستخدام أداة تسمية العينة:

لقطة شاشة لعينة بطاقة العمل

مخصص

  • تحلل النماذج المخصصة البيانات وتستخرجها من النماذج والمستندات الخاصة بعملك. واجهة برمجة التطبيقات هي برنامج تعلم آلي مدرب على التعرف على حقول النموذج ضمن محتواك المميز واستخراج أزواج قيم المفاتيح وبيانات الجدول. سوف تحتاج فقط إلى خمسة أمثلة من نفس نوع النموذج لبدء الاستخدام ويمكن تدريب نموذجك المخصص بمجموعات البيانات المسماة أو غير المسماة.

نموذج معالجة نموذج مخصص باستخدام أداة تسمية العينة:

لقطة شاشة لنافذة تحليل أداة تحليل المعلومات للمستندات بشكل مخصص.

نموذج مخصص مُنشأ

يُنشأ النموذج المُركب بتسجيل مجموعة من النماذج المخصصة وتعيينها إلى نموذج واحد مُعد من أنواع نماذجك. يمكنك تعيين نماذج مخصصة متعددة لنموذج مكون يسمى بمعرف نموذج واحد. يمكنك تعيين ما يصل إلى 100 نموذج مخصص مدرب لنموذج واحد مكون.

نافذة مربع حوار النموذج الذي تم إنشاؤه باستخدام أداة تسمية العينة:

لقطة شاشة لنافذة مربع حوار Document Intelligence Studio لإنشاء نموذج مخصص.

استخراج بيانات النموذج

النموذج استخراج النص اكتشاف اللغات علامات التحديد الجداول الفقرات أدوار الفقرات أزواج قيم المفاتيح الحقول
تخطيط
فاتورة
استلام
مستند المعرف
بطاقة العمل
نموذج مخصص

متطلبات الإدخال

  • للحصول على أفضل النتائج، قم بتوفير صورة واحدة واضحة أو مسح ضوئي عالي الجودة لكل مستند.

  • تنسيقات الملفات المعتمدة:

    النموذج PDF الصورة:
    JPEG/JPG، PNG، BMP، TIFF، HEIF
    Microsoft Office:
    Word (DOCX) وExcel (XLSX) وPowerPoint (PPTX) وHTML
    قراءة
    Layout ✔ (معاينة 2024-02-29، 2023-10-31-preview)
    مستند عام
    منشأ مسبقًا
    استخراج مخصص
    تصنيف مخصص ✔ (2024-02-29-preview)
  • بالنسبة لملفات PDF وTIFF، يمكن معالجة ما يصل إلى 2000 صفحة (بالنسببة للاشتراك المجاني، تتم معالجة أول صفحتين فقط).

  • حجم الملف لتحليل المستندات هو 500 ميغابايت للطبقة المدفوعة (S0) و4 ميغابايت للمستوى المجاني (F0).

  • يجب أن تتراوح أبعاد الصورة بين 50 × 50 بكسل و 10000 بكسل × 10000 بكسل.

  • إذا كانت ملفات PDF الخاصة بك مؤمنة بكلمة مرور، فيجب عليك إزالة القفل قبل الإرسال.

  • الحد الأدنى لارتفاع النص المراد استخراجه هو 12 بكسل لصورة 1024 × 768 بكسل. يتوافق هذا البعد مع نص نقطة تقريبا 8عند 150 نقطة لكل بوصة (DPI).

  • بالنسبة للتدريب على النموذج المخصص، الحد الأقصى لعدد صفحات بيانات التدريب هو 500 لنموذج القالب المخصص و50000 للنموذج العصبي المخصص.

    • لتدريب نموذج الاستخراج المخصص، يبلغ الحجم الإجمالي لبيانات التدريب 50 ميغابايت لنموذج القالب و1G-MB للنموذج العصبي.

    • بالنسبة لتدريب نموذج التصنيف المخصص، يكون الحجم الإجمالي لبيانات 1GB التدريب بحد أقصى 10000 صفحة.

إشعار

لا تدعم أداة Sample Labeling تنسيق ملف BMP. هذا قيد على الأداة وليس خدمة معلومات المستند.

ترحيل الإصدار

يمكنك معرفة كيفية استخدام Document Intelligence v3.0 في تطبيقاتك باتباع دليل الترحيل Document Intelligence v3.1

الخطوات التالية

  • حاول معالجة النماذج والمستندات الخاصة بك باستخدام Document Intelligence Studio.

  • أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.

  • حاول معالجة النماذج والمستندات الخاصة بك باستخدام أداة تسمية نموذج تحليل معلومات المستند.

  • أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.