نماذج معالجة المستندات
هام
- توفر إصدارات المعاينة العامة ل Document Intelligence وصولا مبكرا إلى الميزات قيد التطوير النشط.
- قد تتغير الميزات والنهج والعمليات، قبل التوفر العام (GA)، استنادا إلى ملاحظات المستخدم.
- إصدار المعاينة العامة لمكتبات عميل Document Intelligence افتراضيا إلى إصدار REST API 2024-02-29-preview.
- يتوفر إصدار المعاينة العامة 2024-02-29-preview حاليا فقط في مناطق Azure التالية:
- شرق الولايات المتحدة
- غرب الولايات المتحدة 2
- غرب أوروبا
ينطبق هذا المحتوى على:v4.0 (معاينة) | الإصدارات السابقة:v3.1 (GA)v3.0 (GA)v2.1 (GA)
ينطبق هذا المحتوى على:v3.1 (GA) | أحدث إصدار:v4.0 (معاينة) | الإصدارات السابقة:v3.0v2.1
ينطبق هذا المحتوى على:v3.0 (GA) | أحدث الإصدارات:v4.0 (معاينة)v3.1 | الإصدار السابق:v2.1
ينطبق هذا المحتوى على:v2.1 | أحدث إصدار:v4.0 (معاينة)
يدعم Azure الذكاء الاصطناعي Document Intelligence مجموعة واسعة من النماذج التي تمكنك من إضافة معالجة مستندات ذكية إلى تطبيقاتك وتدفقاتك. يمكنك استخدام نموذج خاص بالمجال تم إنشاؤه مسبقا أو تدريب نموذج مخصص مصمم خصيصا لحاجة عملك وحالات الاستخدام المحددة. يمكن استخدام ذكاء المستند مع مكتبة عميل REST API أو Python وC# وJava وJavaScript.
نظرة عامة على النموذج
يعرض الجدول التالي النماذج المتوفرة لكل معاينة حالية وواجهة برمجة تطبيقات مستقرة:
نوع النموذج | النموذج | • معاينة 2024-02-29 رمز نقطي 2023-10-31-معاينة |
2023-07-31 (GA) | 2022-08-31 (GA) | الإصدار 2.1 (GA) |
---|---|---|---|---|---|
نماذج تحليل المستندات | مقروء | ✔️ | ✔️ | ✔️ | غير متوفر |
نماذج تحليل المستندات | تخطيط | ✔️ | ✔️ | ✔️ | ✔️ |
نماذج تحليل المستندات | المستند العام | تم نقله إلى التخطيط** | ✔️ | ✔️ | غير متوفر |
النماذج المُنشأة مسبقًا | عقد | ✔️ | ✔️ | غير متوفر | غير متوفر |
النماذج المُنشأة مسبقًا | بطاقة التأمين الصحي | ✔️ | ✔️ | ✔️ | غير متوفر |
النماذج المُنشأة مسبقًا | مستند المعرف | ✔️ | ✔️ | ✔️ | ✔️ |
النماذج المُنشأة مسبقًا | فاتورة | ✔️ | ✔️ | ✔️ | ✔️ |
النماذج المُنشأة مسبقًا | استلام | ✔️ | ✔️ | ✔️ | ✔️ |
النماذج المُنشأة مسبقًا | ضريبة الولايات المتحدة 1040* | ✔️ | ✔️ | غير متوفر | غير متوفر |
النماذج المُنشأة مسبقًا | ضريبة الولايات المتحدة الأمريكية 1098* | ✔️ | غير متوفر | غير متوفر | غير متوفر |
النماذج المُنشأة مسبقًا | ضريبة الولايات المتحدة الأمريكية 1099* | ✔️ | غير متوفر | غير متوفر | غير متوفر |
النماذج المُنشأة مسبقًا | ضريبة W2 الأمريكية | ✔️ | ✔️ | ✔️ | غير متوفر |
النماذج المُنشأة مسبقًا | عنوان URL للرهن العقاري الأمريكي 1003 | ✔️ | غير متوفر | غير متوفر | غير متوفر |
النماذج المُنشأة مسبقًا | ملخص الرهن العقاري الأمريكي 1008 | ✔️ | غير متوفر | غير متوفر | غير متوفر |
النماذج المُنشأة مسبقًا | الإفصاح عن إغلاق الرهن العقاري في الولايات المتحدة | ✔️ | غير متوفر | غير متوفر | غير متوفر |
النماذج المُنشأة مسبقًا | شهادة زواج | ✔️ | غير متوفر | غير متوفر | غير متوفر |
النماذج المُنشأة مسبقًا | بطاقة الائتمان | ✔️ | غير متوفر | غير متوفر | غير متوفر |
النماذج المُنشأة مسبقًا | بطاقة العمل | مهملة | ✔️ | ✔️ | ✔️ |
نموذج تصنيف مخصص | مصنف مخصص | ✔️ | ✔️ | غير متوفر | غير متوفر |
نموذج استخراج مخصص | عصبي مخصص. | ✔️ | ✔️ | ✔️ | غير متوفر |
نموذج الطرح المخصص | قالب مخصص | ✔️ | ✔️ | ✔️ | ✔️ |
نموذج استخراج مخصص | مخصص مكون | ✔️ | ✔️ | ✔️ | ✔️ |
جميع النماذج | إمكانات الوظيفة الإضافية | ✔️ | ✔️ | غير متوفر | غير متوفر |
* - يحتوي على نماذج فرعية. راجع معلومات النموذج المحددة للتباينات والأنواع الفرعية المدعومة.
إمكانية الوظيفة الإضافية | وظيفة إضافية/مجانية | • معاينة 2024-02-29 &رمز نقطي [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-2024-02-29-preview&preserve-view=true |
2023-07-31 (GA) |
2022-08-31 (GA) |
الإصدار 2.1 (GA) |
---|---|---|---|---|---|
استخراج خاصية الخط | الوظيفة الإضافية | ✔️ | ✔️ | غير متوفر | غير متوفر |
استخراج الصيغة | الوظيفة الإضافية | ✔️ | ✔️ | غير متوفر | غير متوفر |
استخراج عالي الدقة | الوظيفة الإضافية | ✔️ | ✔️ | غير متوفر | غير متوفر |
استخراج الرمز الشريطي | مجاني | ✔️ | ✔️ | غير متوفر | غير متوفر |
اكتشاف اللغات | مجاني | ✔️ | ✔️ | غير متوفر | غير متوفر |
أزواج القيمة الرئيسية | مجاني | ✔️ | غير متوفر | غير متوفر | غير متوفر |
حقول الاستعلام | الوظيفة الإضافية* | ✔️ | غير متوفر | غير متوفر | غير متوفر |
ميزات تحليل النموذج
معرف النموذج | استخراج المحتوى | حقول الاستعلام | الفقرات | أدوار الفقرة | علامات التحديد | الجداول | أزواج قيم المفاتيح | اللغات | الباركود | تحليل المستندات | الصيغ* | نمط الخط* | دقة عالية* |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read | √ | O | O | O | O | O | |||||||
prebuilt-layout | √ | √ | √ | √ | √ | √ | O | O | O | O | O | ||
prebuilt-document | √ | √ | √ | √ | √ | √ | √ | O | O | O | O | O | |
prebuilt-businessCard | √ | √ | √ | ||||||||||
عقد مسبق الإنشاء | √ | √ | √ | √ | O | O | √ | O | O | O | |||
prebuilt-healthInsuranceCard.us | √ | √ | O | O | √ | O | O | O | |||||
prebuilt-idDocument | √ | √ | O | O | √ | O | O | O | |||||
prebuilt-invoice | √ | √ | √ | √ | O | O | O | √ | O | O | O | ||
prebuilt-receipt | √ | √ | O | O | √ | O | O | O | |||||
prebuilt-marriageCertificate.us | √ | √ | O | O | √ | O | O | O | |||||
بطاقة ائتمان مسبقة الإنشاء | √ | √ | O | O | √ | O | O | O | |||||
prebuilt-mortgage.us.1003 | √ | √ | O | O | √ | O | O | O | |||||
prebuilt-mortgage.us.1008 | √ | √ | O | O | √ | O | O | O | |||||
prebuilt-mortgage.us.closeDisclosure | √ | √ | O | O | √ | O | O | O | |||||
prebuilt-tax.us.w2 | √ | √ | √ | O | O | √ | O | O | O | ||||
prebuilt-tax.us.1098 | √ | √ | √ | O | O | √ | O | O | O | ||||
prebuilt-tax.us.1098E | √ | √ | √ | O | O | √ | O | O | O | ||||
prebuilt-tax.us.1098T | √ | √ | √ | O | O | √ | O | O | O | ||||
prebuilt-tax.us.1099(variations) | √ | √ | √ | O | O | √ | O | O | O | ||||
prebuilt-tax.us.1040(variations) | √ | √ | O | O | √ | O | O | O | |||||
{ customModelName } | √ | √ | √ | √ | √ | √ | O | O | √ | O | O | O |
✓ - تمكين
O - اختياري
* - ميزات Premium تتحمل تكاليف إضافية
الوظيفة الإضافية* - يتم تسعير حقول الاستعلام بشكل مختلف عن ميزات الوظيفة الإضافية الأخرى. للحصول على تفاصيل؛ تأكد من مراجعة الأسعار.
النموذج | الوصف |
---|---|
نماذج تحليل المستندات | |
قراءة التعرف البصري على الحروف | استخراج النص المطبوع والمكتوب بخط اليد بما في ذلك الكلمات والمواقع واللغات المكتشفة. |
تحليل التخطيط | استخراج عناصر تخطيط النص والمستند مثل الجداول وعلامات التحديد والعناوين وعناوين المقاطع والمزيد. |
نماذج تم إنشاؤها مسبقا | |
بطاقة التأمين الصحي | أتمتة عمليات الرعاية الصحية عن طريق استخراج شركة التأمين والعضو والوصفات الطبية ورقم المجموعة ومعلومات رئيسية أخرى من بطاقات التأمين الصحي الأمريكية. |
نماذج المستندات الضريبية في الولايات المتحدة | معالجة النماذج الضريبية الأمريكية لاستخراج الموظف وصاحب العمل والأجر ومعلومات أخرى. |
نماذج مستندات الرهن العقاري في الولايات المتحدة | معالجة نماذج الرهن العقاري في الولايات المتحدة لاستخراج قرض المقترض ومعلومات الممتلكات. |
عقد | استخراج تفاصيل الاتفاقية والطرفاة. |
فاتورة | أتمتة الفواتير. |
استلام | استخراج بيانات الإيصال من الإيصالات. |
مستند الهوية (المعرف) | استخراج حقول الهوية (المعرف) من رخصة القيادة الأمريكية وجوازات السفر الدولية. |
بطاقة العمل | امسح بطاقات العمل ضوئيا لاستخراج الحقول والبيانات الرئيسية في تطبيقاتك. |
نماذج مخصصة | |
نموذج مخصص (نظرة عامة) | استخراج البيانات من النماذج والمستندات الخاصة بعملك. يتم تدريب النماذج المخصصة على بياناتك المميزة وحالات الاستخدام الخاصة بك. |
نماذج استخراج مخصصة | ● تستخدم نماذج القوالب المخصصة الإشارات التخطيطية لاستخراج القيم من المستندات وهي مناسبة لاستخراج الحقول من المستندات ذات البنية العالية باستخدام قوالب مرئية محددة. ● يتم تدريب النماذج العصبية المخصصة على أنواع المستندات المختلفة لاستخراج الحقول من المستندات المنظمة وشبه المنظمة وغير المنظمة. |
نموذج تصنيف مخصص | يمكن لنموذج التصنيف المخصص تصنيف كل صفحة في ملف إدخال لتحديد المستندات داخل ويمكنه أيضا تحديد مستندات متعددة أو مثيلات متعددة لمستند واحد داخل ملف إدخال. |
نماذج مكونة | ادمج العديد من النماذج المخصصة في نموذج واحد لأتمتة معالجة أنواع المستندات المتنوعة مع نموذج واحد مكون. |
بالنسبة لجميع النماذج، باستثناء نموذج بطاقة العمل، يدعم Document Intelligence الآن قدرات الوظيفة الإضافية للسماح بتحليل أكثر تعقيدا. يمكن تمكين هذه الإمكانات الاختيارية وتعطيلها اعتمادا على سيناريو استخراج المستند. هناك سبع إمكانات إضافية متاحة 2023-07-31
لإصدار واجهة برمجة التطبيقات (GA) والإصدارات الأحدث من واجهة برمجة التطبيقات:
ocrHighResolution
formulas
styleFont
barcodes
languages
keyValuePairs
(معاينة 2024-02-29، 2023-10-31-preview)queryFields
(معاينة 2024-02-29، 2023-10-31-preview)Not available with the US.Tax models
تفاصيل النموذج
يصف هذا القسم الإخراج الذي يمكنك توقعه من كل نموذج. يرجى ملاحظة أنه يمكنك توسيع إخراج معظم النماذج باستخدام ميزات الوظيفة الإضافية.
قراءة OCR
تقوم واجهة برمجة تطبيقات القراءة بتحليل واستخراج الأسطر والكلمات ومواقعها واللغات المكتشفة والنمط المكتوب بخط اليد إذا تم اكتشافها.
نموذج مستند تمت معالجته باستخدام Document Intelligence Studio:
تحليل التخطيط
يقوم نموذج تحليل التخطيط بتحليل واستخراج النص والجداول وعلامات التحديد وعناصر البنية الأخرى مثل العناوين وعناوين المقاطع ورؤوس الصفحات وتذييلات الصفحات والمزيد.
نموذج مستند تمت معالجته باستخدام Document Intelligence Studio:
بطاقة التأمين الصحي
يجمع نموذج بطاقة التأمين الصحي بين قدرات التعرف البصري على الحروف (OCR) القوية ونماذج التعلم العميق لتحليل واستخراج المعلومات الرئيسية من بطاقات التأمين الصحي الأمريكية.
عينة من بطاقة التأمين الصحي الأمريكية التي تمت معالجتها باستخدام Document Intelligence Studio:
وثائق الضرائب الأمريكية
تقوم نماذج المستندات الضريبية الأمريكية بتحليل واستخراج الحقول الرئيسية وعناصر السطر من مجموعة محددة من المستندات الضريبية. تدعم واجهة برمجة التطبيقات تحليل المستندات الضريبية باللغة الإنجليزية الأمريكية ذات التنسيقات والجودة المختلفة بما في ذلك الصور الملتقطة بالهاتف والمستندات الممسوحة ضوئيا وملفات PDF الرقمية. النماذج التالية مدعومة حاليا:
النموذج | الوصف | معرف النموذج |
---|---|---|
ضريبة الولايات المتحدة W-2 | استخراج تفاصيل التعويض الخاضعة للضريبة. | prebuilt-tax.us.W-2 |
ضريبة الولايات المتحدة 1040 | استخراج تفاصيل فوائد الرهن العقاري. | prebuilt-tax.us.1040(variations) |
ضريبة الولايات المتحدة 1098 | استخراج تفاصيل فوائد الرهن العقاري. | prebuilt-tax.us.1098(variations) |
ضريبة الولايات المتحدة 1099 | استخراج الدخل المتلقاة من مصادر أخرى غير صاحب العمل. | prebuilt-tax.us.1099(variations) |
نموذج مستند W-2 تمت معالجته باستخدام Document Intelligence Studio:
وثائق الرهن العقاري في الولايات المتحدة
تقوم نماذج وثيقة الرهن العقاري الأمريكية بتحليل واستخراج الحقول الرئيسية بما في ذلك المقترض والقرض ومعلومات الممتلكات من مجموعة مختارة من وثائق الرهن العقاري. تدعم واجهة برمجة التطبيقات تحليل وثائق رهن الولايات المتحدة باللغة الإنجليزية من مختلف الأشكال والجودة بما في ذلك الصور التي تم التقاطها عبر الهاتف والمستندات الممسوحة ضوئيا وملفات PDF الرقمية. النماذج التالية مدعومة حاليا:
النموذج | الوصف | معرف النموذج |
---|---|---|
اتفاقية ترخيص المستخدم النهائي (EULA) 1003 | استخراج القرض، المقترض، تفاصيل الملكية. | prebuilt-mortgage.us.1003 |
مستند ملخص 1008 | استخراج تفاصيل المقترض والبائع والعقارات والرهن العقاري والكتابة. | prebuilt-mortgage.us.1008 |
إغلاق الكشف | استخراج الإغلاق وتكاليف المعاملات وتفاصيل القرض. | prebuilt-mortgage.us.closeDisclosure |
شهادة زواج | استخراج تفاصيل معلومات الزواج لمقدمي القروض المشتركة. | Prebuilt-marriageCertificate |
ضريبة الولايات المتحدة W-2 | استخراج تفاصيل التعويض الخاضعة للضريبة للتحقق من الدخل. | prebuilt-tax.us.W-2 |
نموذج مستند كشف الإغلاق الذي تمت معالجته باستخدام Document Intelligence Studio:
Contract
يقوم نموذج العقد بتحليل واستخراج الحقول الرئيسية والبنود الأساسية من الاتفاقيات التعاقدية بما في ذلك الأطراف والولاية القضائية ومعرف العقد والمسمى الوظيفي. يدعم النموذج حاليا مستندات العقد باللغة الإنجليزية.
نموذج العقد الذي تمت معالجته باستخدام Document Intelligence Studio:
الفاتورة
يقوم نموذج الفاتورة بأتمتة معالجة الفواتير لاستخراج اسم العميل وعنوان الفوترة وتاريخ الاستحقاق والمبلغ المستحق وعناصر السطر والبيانات الرئيسية الأخرى. حالياً، يدعم النموذج الفواتير المُحررة باللغة الإنجليزية، والإسبانية، والألمانية، والفرنسية، والإيطالية، والبرتغالية، والهولندية.
نموذج فاتورة تمت معالجته باستخدام Document Intelligence Studio:
الإيصال
استخدم نموذج الإيصال لفحص إيصالات المبيعات بحثا عن اسم التاجر والتواريخ وعناصر الأسطر والكميات والإجماليات من الإيصالات المطبوعة والمكتوبة بخط اليد. يدعم الإصدار v3.0 أيضا معالجة إيصالات الفندق من صفحة واحدة.
نموذج إيصال تمت معالجته باستخدام Document Intelligence Studio:
مستند الهوية (المعرف)
استخدم نموذج وثيقة الهوية (ID) لمعالجة تراخيص القيادة الأمريكية (جميع الولايات الخمسين ومقاطعة كولومبيا) وصفحات السيرة الذاتية من جوازات السفر الدولية (باستثناء التأشيرة ووثائق السفر الأخرى) لاستخراج الحقول الرئيسية.
نموذج رخصة القيادة الأمريكية التي تمت معالجتها باستخدام Document Intelligence Studio:
شهادة زواج
استخدم نموذج شهادة الزواج لمعالجة شهادات الزواج الأمريكية لاستخراج الحقول الرئيسية بما في ذلك الأفراد والتاريخ والموقع.
نموذج شهادة زواج أمريكية تمت معالجتها باستخدام Document Intelligence Studio:
بطاقة الائتمان
استخدم نموذج بطاقة الائتمان لمعالجة بطاقات الائتمان والخصم لاستخراج الحقول الرئيسية.
نموذج بطاقة الائتمان التي تمت معالجتها باستخدام Document Intelligence Studio:
النماذج المخصصة
يمكن تصنيف النماذج المخصصة على نطاق واسع إلى نوعين. نماذج التصنيف المخصصة التي تدعم تصنيف "نوع المستند" ونماذج الاستخراج المخصصة التي يمكنها استخراج مخطط محدد من نوع مستند معين.
تقوم نماذج المستندات المخصصة بتحليل واستخراج البيانات من النماذج والمستندات الخاصة بعملك. يتم تدريبهم على التعرف على حقول النموذج داخل المحتوى المميز واستخراج أزواج قيم المفاتيح وبيانات الجدول. تحتاج فقط إلى مثال واحد لنوع النموذج للبدء.
يدعم الإصدار v3.0 النموذج المخصص الكشف عن التوقيع في قالب مخصص (نموذج) وجداول عبر الصفحات في كل من القالب والنماذج العصبية.
نموذج قالب مخصص تمت معالجته باستخدام Document Intelligence Studio:
استخراج مخصص
يمكن أن يكون نموذج الاستخراج المخصص واحدا من نوعين، قالب مخصص أو عصبي مخصص. لإنشاء نموذج استخراج مخصص، قم بتسمية مجموعة بيانات من المستندات بالقيم التي تريد استخراجها وتدريب النموذج على مجموعة البيانات المسماة. تحتاج فقط إلى خمسة أمثلة من نفس نوع النموذج أو المستند للبدء.
نموذج استخراج مخصص تمت معالجته باستخدام Document Intelligence Studio:
مصنف مخصص
يمكنك نموذج التصنيف المخصص من تحديد نوع المستند قبل استدعاء نموذج الاستخراج. يتوفر نموذج التصنيف بدءا من 2023-07-31 (GA)
واجهة برمجة التطبيقات. يتطلب تدريب نموذج تصنيف مخصص فئتين متميزتين على الأقل وخمس عينات كحد أدنى لكل فئة.
نماذج مكونة
يُنشأ النموذج المُركب بتسجيل مجموعة من النماذج المخصصة وتعيينها إلى نموذج واحد مُعد من أنواع نماذجك. يمكنك تعيين نماذج مخصصة متعددة لنموذج مكون يسمى بمعرف نموذج واحد. يمكنك تعيين ما يصل إلى 200 نموذج مخصص مدرب لنموذج واحد مكون.
نافذة مربع الحوار "نموذج مكون" في Document Intelligence Studio:
متطلبات الإدخال
للحصول على أفضل النتائج، قم بتوفير صورة واحدة واضحة أو مسح ضوئي عالي الجودة لكل مستند.
تنسيقات الملفات المعتمدة:
النموذج PDF الصورة:
JPEG/JPG، PNG، BMP، TIFF، HEIFMicrosoft Office:
Word (DOCX) وExcel (XLSX) وPowerPoint (PPTX) وHTMLقراءة ✔ ✔ ✔ Layout ✔ ✔ ✔ (معاينة 2024-02-29، 2023-10-31-preview) مستند عام ✔ ✔ منشأ مسبقًا ✔ ✔ استخراج مخصص ✔ ✔ تصنيف مخصص ✔ ✔ ✔ (2024-02-29-preview) بالنسبة لملفات PDF وTIFF، يمكن معالجة ما يصل إلى 2000 صفحة (بالنسببة للاشتراك المجاني، تتم معالجة أول صفحتين فقط).
حجم الملف لتحليل المستندات هو 500 ميغابايت للطبقة المدفوعة (S0) و4 ميغابايت للمستوى المجاني (F0).
يجب أن تتراوح أبعاد الصورة بين 50 × 50 بكسل و 10000 بكسل × 10000 بكسل.
إذا كانت ملفات PDF الخاصة بك مؤمنة بكلمة مرور، فيجب عليك إزالة القفل قبل الإرسال.
الحد الأدنى لارتفاع النص المراد استخراجه هو 12 بكسل لصورة 1024 × 768 بكسل. يتوافق هذا البعد مع نص نقطة تقريبا
8
عند 150 نقطة لكل بوصة (DPI).بالنسبة للتدريب على النموذج المخصص، الحد الأقصى لعدد صفحات بيانات التدريب هو 500 لنموذج القالب المخصص و50000 للنموذج العصبي المخصص.
لتدريب نموذج الاستخراج المخصص، يبلغ الحجم الإجمالي لبيانات التدريب 50 ميغابايت لنموذج القالب و1G-MB للنموذج العصبي.
بالنسبة لتدريب نموذج التصنيف المخصص، يكون الحجم الإجمالي لبيانات
1GB
التدريب بحد أقصى 10000 صفحة.
إشعار
لا تدعم أداة Sample Labeling تنسيق ملف BMP. هذا قيد على الأداة وليس خدمة معلومات المستند.
ترحيل الإصدار
تعرف على كيفية استخدام Document Intelligence v3.0 في تطبيقاتك باتباع دليل ترحيل Document Intelligence v3.1
النموذج | الوصف |
---|---|
تحليل المستند | |
تخطيط | استخراج معلومات النص والتخطيط من المستندات. |
معده مسبقا | |
فاتورة | استخراج المعلومات الرئيسية من الفواتير الإنجليزية والإسبانية. |
استلام | استخراج المعلومات الرئيسية من الإيصالات الإنجليزية. |
مستند المعرف | استخراج المعلومات الرئيسية من رخص القيادة الأمريكية وجوازات السفر الدولية. |
بطاقة العمل | استخراج المعلومات الرئيسية من بطاقات العمل المُحررة باللغة الإنجليزية. |
مخصص | |
مخصص | استخراج البيانات من النماذج والمستندات الخاصة بعملك. يتم تدريب النماذج المخصصة على بياناتك المميزة وحالات الاستخدام الخاصة بك. |
تتالف | أنشئ مجموعة من النماذج المخصصة وعينها إلى نموذج واحد مُعد من أنواع نماذجك. |
Layout
تتولى واجهة برمجة تطبيقات التخطيط تحليل النص، والجداول، والعناوين، وعلامات التحديد، ومعلومات البنية واستخراجها من المستندات.
نموذج مستند تمت معالجته باستخدام أداة تسمية العينة:
الفاتورة
يتولى نموذج الفاتورة تحليل المعلومات الرئيسية واستخراجها من فواتير المبيعات. تتولى واجهة برمجة التطبيقات تحليل الفواتير ذات التنسيقات المختلفة واستخراج المعلومات الرئيسية مثل: اسم العميل، وعنوان الفاتورة، وتاريخ الاستحقاق، والمبلغ المستحق.
نموذج فاتورة تمت معالجته باستخدام أداة تسمية العينة:
الإيصال
- يتولى نموذج الإيصال تحليل المعلومات الرئيسية واستخراجها من إيصالات المبيعات المطبوعة والمكتوبة بخط اليد.
تمت معالجة إيصال العينة باستخدام أداة تسمية العينة:
مستند معرف
يتولى نموذج مستند المعرف تحليل المعلومات الرئيسية واستخراجها من المستندات الآتية:
رخصة القيادة الأمريكية (جميع الولايات الخمسين ومقاطعة كولومبيا)
صفحات السيرة الذاتية من جوازات السفر الدولية (باستثناء التأشيرة ووثائق السفر الأخرى). تتولى واجهة برمجة التطبيقات تحليل مستندات الهوية واستخراجها
تمت معالجة نموذج رخصة القيادة الأمريكية باستخدام أداة تسمية العينة:
بطاقة العمل
يتولى نموذج بطاقة العمل تحليل المعلومات الرئيسية واستخراجها من صور بطاقة العمل.
نموذج بطاقة العمل التي تمت معالجتها باستخدام أداة تسمية العينة:
مخصص
- تحلل النماذج المخصصة البيانات وتستخرجها من النماذج والمستندات الخاصة بعملك. واجهة برمجة التطبيقات هي برنامج تعلم آلي مدرب على التعرف على حقول النموذج ضمن محتواك المميز واستخراج أزواج قيم المفاتيح وبيانات الجدول. سوف تحتاج فقط إلى خمسة أمثلة من نفس نوع النموذج لبدء الاستخدام ويمكن تدريب نموذجك المخصص بمجموعات البيانات المسماة أو غير المسماة.
نموذج معالجة نموذج مخصص باستخدام أداة تسمية العينة:
نموذج مخصص مُنشأ
يُنشأ النموذج المُركب بتسجيل مجموعة من النماذج المخصصة وتعيينها إلى نموذج واحد مُعد من أنواع نماذجك. يمكنك تعيين نماذج مخصصة متعددة لنموذج مكون يسمى بمعرف نموذج واحد. يمكنك تعيين ما يصل إلى 100 نموذج مخصص مدرب لنموذج واحد مكون.
نافذة مربع حوار النموذج الذي تم إنشاؤه باستخدام أداة تسمية العينة:
استخراج بيانات النموذج
النموذج | استخراج النص | اكتشاف اللغات | علامات التحديد | الجداول | الفقرات | أدوار الفقرات | أزواج قيم المفاتيح | الحقول |
---|---|---|---|---|---|---|---|---|
تخطيط | √ | √ | √ | √ | √ | |||
فاتورة | √ | √ | √ | √ | √ | √ | ||
استلام | √ | √ | √ | |||||
مستند المعرف | √ | √ | √ | |||||
بطاقة العمل | √ | √ | √ | |||||
نموذج مخصص | √ | √ | √ | √ | √ |
متطلبات الإدخال
للحصول على أفضل النتائج، قم بتوفير صورة واحدة واضحة أو مسح ضوئي عالي الجودة لكل مستند.
تنسيقات الملفات المعتمدة:
النموذج PDF الصورة:
JPEG/JPG، PNG، BMP، TIFF، HEIFMicrosoft Office:
Word (DOCX) وExcel (XLSX) وPowerPoint (PPTX) وHTMLقراءة ✔ ✔ ✔ Layout ✔ ✔ ✔ (معاينة 2024-02-29، 2023-10-31-preview) مستند عام ✔ ✔ منشأ مسبقًا ✔ ✔ استخراج مخصص ✔ ✔ تصنيف مخصص ✔ ✔ ✔ (2024-02-29-preview) بالنسبة لملفات PDF وTIFF، يمكن معالجة ما يصل إلى 2000 صفحة (بالنسببة للاشتراك المجاني، تتم معالجة أول صفحتين فقط).
حجم الملف لتحليل المستندات هو 500 ميغابايت للطبقة المدفوعة (S0) و4 ميغابايت للمستوى المجاني (F0).
يجب أن تتراوح أبعاد الصورة بين 50 × 50 بكسل و 10000 بكسل × 10000 بكسل.
إذا كانت ملفات PDF الخاصة بك مؤمنة بكلمة مرور، فيجب عليك إزالة القفل قبل الإرسال.
الحد الأدنى لارتفاع النص المراد استخراجه هو 12 بكسل لصورة 1024 × 768 بكسل. يتوافق هذا البعد مع نص نقطة تقريبا
8
عند 150 نقطة لكل بوصة (DPI).بالنسبة للتدريب على النموذج المخصص، الحد الأقصى لعدد صفحات بيانات التدريب هو 500 لنموذج القالب المخصص و50000 للنموذج العصبي المخصص.
لتدريب نموذج الاستخراج المخصص، يبلغ الحجم الإجمالي لبيانات التدريب 50 ميغابايت لنموذج القالب و1G-MB للنموذج العصبي.
بالنسبة لتدريب نموذج التصنيف المخصص، يكون الحجم الإجمالي لبيانات
1GB
التدريب بحد أقصى 10000 صفحة.
إشعار
لا تدعم أداة Sample Labeling تنسيق ملف BMP. هذا قيد على الأداة وليس خدمة معلومات المستند.
ترحيل الإصدار
يمكنك معرفة كيفية استخدام Document Intelligence v3.0 في تطبيقاتك باتباع دليل الترحيل Document Intelligence v3.1
الخطوات التالية
حاول معالجة النماذج والمستندات الخاصة بك باستخدام Document Intelligence Studio.
أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.