نموذج مستند معرف معلومات المستند

هام

  • توفر إصدارات المعاينة العامة ل Document Intelligence وصولا مبكرا إلى الميزات قيد التطوير النشط.
  • قد تتغير الميزات والنهج والعمليات، قبل التوفر العام (GA)، استنادا إلى ملاحظات المستخدم.
  • إصدار المعاينة العامة لمكتبات عميل Document Intelligence افتراضيا إلى إصدار REST API 2024-02-29-preview.
  • يتوفر إصدار المعاينة العامة 2024-02-29-preview حاليا فقط في مناطق Azure التالية:
  • شرق الولايات المتحدة
  • غرب الولايات المتحدة 2
  • غرب أوروبا

ينطبق هذا المحتوى على:علامهv4.0 (معاينة) | الإصدارات السابقة:علامة اختيار زرقاءv3.1 (GA)علامة اختيار زرقاءv3.0 (GA)علامة اختيار زرقاءv2.1 (GA)

ينطبق هذا المحتوى على:علامهv3.1 (GA) | أحدث إصدار:علامة اختيار أرجوانيةv4.0 (معاينة) | الإصدارات السابقة:علامة اختيار زرقاءv3.0علامة اختيار زرقاءv2.1

ينطبق هذا المحتوى على:علامهv3.0 (GA) | أحدث الإصدارات:علامة اختيار أرجوانيةv4.0 (معاينة)علامة اختيار أرجوانيةv3.1 | الإصدار السابق:علامة اختيار زرقاءv2.1

ينطبق هذا المحتوى على:علامهv2.1 | أحدث إصدار:علامة اختيار زرقاءv4.0 (معاينة)

يجمع نموذج مستند Document Intelligence Identity (ID) بين التعرف البصري على الحروف (OCR) ونماذج التعلم العميق لتحليل المعلومات الرئيسية واستخراجها من مستندات الهوية. تقوم واجهة برمجة التطبيقات بتحليل مستندات الهوية (بما في ذلك ما يلي) وإرجاع تمثيل بيانات JSON منظم:

  • دفتر جوازات السفر، بطاقة جواز السفر في جميع أنحاء العالم
  • رخصة قيادة من الولايات المتحدة وأوروبا والهند وكندا وأستراليا
  • بطاقات هوية الولايات المتحدة، تصريح الإقامة (البطاقة الخضراء)، بطاقة الضمان الاجتماعي، المعرف العسكري
  • بطاقات الهوية الأوروبية وتصاريح الإقامة
  • بطاقة India PAN، بطاقة Aadhaar
  • بطاقات الهوية الكندية، تصريح الإقامة (بطاقة القيقب)
  • بطاقة الصورة في أستراليا، معرف تمرير المفتاح (بما في ذلك الإصدار الرقمي)

يمكن للتحليل الذكي للوثائق تحليل المعلومات واستخراجها من وثائق الهوية الصادرة عن الحكومة (المعرفات) باستخدام نموذج المعرفات الذي تم إنشاؤه مسبقا. فهو يجمع بين قدراتنا القوية للتعرف البصري على الحروف (OCR) مع قدرات التعرف على المعرف لاستخراج المعلومات الرئيسية من جوازات السفر العالمية وتراخيص القيادة الأمريكية (جميع الولايات الخمسين وD.C.). تستخرج واجهة برمجة تطبيقات المعرفات المعلومات الرئيسية من مستندات الهوية هذه، مثل الاسم الأول والقب وتاريخ الميلاد ورقم المستند والمزيد. تتوفر واجهة برمجة التطبيقات هذه في Document Intelligence v2.1 كخدمة سحابية.

معالجة مستندات الهوية

تتضمن معالجة مستندات الهوية استخراج البيانات من مستندات الهوية إما يدويا أو باستخدام تقنية قائمة على التعرف البصري على الحروف. تعد معالجة مستند المعرف خطوة مهمة في أي عملية تجارية تتطلب إثبات الهوية. وتشمل الأمثلة على ذلك التحقق من العملاء في البنوك والمؤسسات المالية الأخرى، وتطبيقات الرهن العقاري، والزيارات الطبية، ومعالجة المطالبات، وصناعة الضيافة، وأكثر من ذلك. يقدم الأفراد بعض الإثباتات على هويتهم من خلال تراخيص القيادة وجوازات السفر وغيرها من الوثائق المماثلة بحيث يمكن للأعمال التحقق منها بكفاءة قبل تقديم الخدمات والفوائد.

نموذج رخصة القيادة الأمريكية التي تمت معالجتها باستخدام Document Intelligence Studio

صورة لرخصة قيادة نموذجية.

استخراج البيانات

تستخرج خدمة المعرفات التي تم إنشاؤها مسبقا القيم الرئيسية من جوازات السفر العالمية وتراخيص القيادة الأمريكية وتعيدها في استجابة JSON منظمة منظمة.

مثال على رخصة القيادة

نموذج رخصة القيادة

مثال جواز السفر

نموذج جواز سفر

خيارات التطوير

يدعم Document Intelligence v4.0 (2024-02-29-preview، 2023-10-31-preview) الأدوات والتطبيقات والمكتبات التالية:

ميزة الموارد معرف النموذج
نموذج مستند المعرف Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

يدعم Document Intelligence v3.1 الأدوات والتطبيقات والمكتبات التالية:

ميزة الموارد معرف النموذج
نموذج مستند المعرف Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

يدعم Document Intelligence v3.0 الأدوات والتطبيقات والمكتبات التالية:

ميزة الموارد معرف النموذج
نموذج مستند المعرف Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

يدعم Document Intelligence v2.1 الأدوات والتطبيقات والمكتبات التالية:

ميزة الموارد
نموذج مستند المعرف أداة
تسمية ذكاء المستند• REST API
مكتبة العميل SDK
حاوية Docker لذكاء المستند

متطلبات الإدخال

  • للحصول على أفضل النتائج، قم بتوفير صورة واحدة واضحة أو مسح ضوئي عالي الجودة لكل مستند.

  • تنسيقات الملفات المعتمدة:

    النموذج PDF الصورة:
    JPEG/JPG، PNG، BMP، TIFF، HEIF
    Microsoft Office:
    Word (DOCX) وExcel (XLSX) وPowerPoint (PPTX) وHTML
    قراءة
    Layout ✔ (معاينة 2024-02-29، 2023-10-31-preview)
    مستند عام
    منشأ مسبقًا
    استخراج مخصص
    تصنيف مخصص ✔ (2024-02-29-preview)
  • بالنسبة لملفات PDF وTIFF، يمكن معالجة ما يصل إلى 2000 صفحة (بالنسببة للاشتراك المجاني، تتم معالجة أول صفحتين فقط).

  • حجم الملف لتحليل المستندات هو 500 ميغابايت للطبقة المدفوعة (S0) و4 ميغابايت للمستوى المجاني (F0).

  • يجب أن تتراوح أبعاد الصورة بين 50 × 50 بكسل و 10000 بكسل × 10000 بكسل.

  • إذا كانت ملفات PDF الخاصة بك مؤمنة بكلمة مرور، فيجب عليك إزالة القفل قبل الإرسال.

  • الحد الأدنى لارتفاع النص المراد استخراجه هو 12 بكسل لصورة 1024 × 768 بكسل. يتوافق هذا البعد مع نص نقطة تقريبا 8عند 150 نقطة لكل بوصة (DPI).

  • بالنسبة للتدريب على النموذج المخصص، الحد الأقصى لعدد صفحات بيانات التدريب هو 500 لنموذج القالب المخصص و50000 للنموذج العصبي المخصص.

    • لتدريب نموذج الاستخراج المخصص، يبلغ الحجم الإجمالي لبيانات التدريب 50 ميغابايت لنموذج القالب و1G-MB للنموذج العصبي.

    • بالنسبة لتدريب نموذج التصنيف المخصص، يكون الحجم الإجمالي لبيانات 1GB التدريب بحد أقصى 10000 صفحة.

  • تنسيقات الملفات المدعومة: JPEG وPNG وPDF وTIFF.

  • عدد الصفحات المعتمدة لملفات PDF وTIFF: ما يصل إلى 2000 صفحة أو أول صفحتين فقط لمشتركي المستوى المجاني.

  • حجم الملف المدعوم: أقل من 50 ميغابايت الإجمالي؛ الحد الأدنى للبكسل: 50 × 50 بكسل؛ الحد الأقصى للبكسل 10,000 × 10,000 بكسل.

استخراج بيانات نموذج مستند المعرف

استخراج البيانات، بما في ذلك الاسم وتاريخ الميلاد وتاريخ انتهاء الصلاحية، من مستندات المعرف. تحتاج إلى الموارد التالية:

  • اشتراك Azure - يمكنك إنشاء اشتراك مجانا.

  • مثيل Document Intelligence في مدخل Microsoft Azure. يمكنك استخدام طبقة التسعير المجانيةF0 () لتجربة الخدمة. بعد نشر المورد، حدد انتقال إلى المورد للحصول على المفتاح ونقطة النهاية.

لقطة شاشة للمفاتيح وموقع نقطة النهاية في مدخل Microsoft Azure.

إشعار

يتوفر Document Intelligence Studio مع واجهات برمجة التطبيقات v3.1 وv3.0 والإصدارات الأحدث.

  1. في الصفحة الرئيسية ل Document Intelligence Studio، حدد Identity documents.

  2. يمكنك تحليل نموذج الفاتورة أو تحميل ملفاتك الخاصة.

  3. حدد الزر Run analysis، وقم بتكوين خيارات Analyze، إذا لزم الأمر:

    لقطة شاشة لأزرار خيارات تحليل التشغيل والتحليل في Document Intelligence Studio.

أداة تسمية نموذج تحليل معلومات المستند

  1. انتقل إلى Document Intelligence Sample Tool.

  2. في الصفحة الرئيسية لأداة العينة، حدد لوحة استخدام النموذج الذي تم إنشاؤه مسبقا للحصول على البيانات .

    لقطة شاشة لنموذج التخطيط لتحليل عملية النتائج.

  3. حدد نوع النموذج لتحليله من القائمة المنسدلة.

  4. اختر عنوان URL للملف الذي ترغب في تحليله من الخيارات التالية:

  5. في مجال المصدر، حدد URL من القائمة المنسدلة، والصق عنوان URL المحدد، وحدد الزر إحضار.

    لقطة شاشة للقائمة المنسدلة لموقع المصدر.

  6. في حقل نقطة نهاية خدمة Document Intelligence، الصق نقطة النهاية التي حصلت عليها باستخدام اشتراك Document Intelligence.

  7. في حقل المفتاح ، الصق المفتاح الذي حصلت عليه من مورد Document Intelligence.

    لقطة شاشة للقائمة المنسدلة تحديد نوع المستند.

  8. حدد تشغيل التحليل. تستدعي أداة تسمية نموذج تحليل معلومات المستند واجهة برمجة التطبيقات التي تم إنشاؤها مسبقا وتحلل المستند.

  9. عرض النتائج - راجع أزواج قيم المفاتيح المستخرجة وعناصر السطر والنص المميز المستخرج والجداول المكتشفة.

    لقطة شاشة لنموذج الهوية لتحليل عملية النتائج.

  10. قم بتنزيل ملف إخراج JSON لعرض النتائج التفصيلية.

    • تحتوي عقدة "readResults" على كل سطر من النص مع موضع مربع الإحاطة الخاص به على الصفحة.
    • تعرض عقدة "علامات التحديد" كل علامة تحديد (خانة اختيار، علامة اختيار) وما إذا كانت حالتها محددة أو غير محددة.
    • يتضمن قسم "pageResults" الجداول المستخرجة. لكل جدول، يستخرج Document Intelligence النص وفهرس الصف والعمود وامتداد الصف والعمود ومربع الإحاطة والمزيد.
    • يحتوي الحقل "documentResults" على معلومات أزواج المفاتيح/ القيم ومعلومات عناصر البند للأجزاء الأكثر صلة من المستند.

إشعار

لا تدعم أداة Sample Labeling تنسيق ملف BMP. هذا قيد على الأداة وليس خدمة معلومات المستند.

أنواع المستندات التي تم دعمها

المنطقة أنواع المستندات
على مستوى العالم دفتر جوازات السفر، بطاقة جواز السفر
الولايات المتحدة رخصة القيادة، بطاقة الهوية، تصريح الإقامة (البطاقة الخضراء)، بطاقة الضمان الاجتماعي، المعرف العسكري
أوروبا رخصة القيادة، بطاقة الهوية، تصريح الإقامة
الهند رخصة القيادة، بطاقة PAN، بطاقة Aadhaar
كندا رخصة القيادة، بطاقة الهوية، تصريح الإقامة (بطاقة القيقب)
أستراليا رخصة القيادة، بطاقة الصورة، معرف مفتاح المرور (بما في ذلك الإصدار الرقمي)

عمليات استخراج الحقل

فيما يلي الحقول المستخرجة لكل نوع مستند. يستخرج نموذج prebuilt-idDocument Document Intelligence ID الحقول التالية في documents.*.fields. يتضمن إخراج json جميع النص المستخرج في المستندات والكلمات والخطوط والأنماط.

idDocument.driverLicense

الحقل نوع ‏‏الوصف مثال
CountryRegion countryRegion رمز البلد أو المنطقة الولايات المتحدة
Region string المحافظة أو المنطقة واشنطن‬
DocumentNumber string رقم رخصة القيادة WDLABCD456DG
DocumentDiscriminator string مستند رخصة القيادة تمييزي 12645646464554646456464544
FirstName string الاسم المعطا والحرف الأول الأوسط إن أمكن LIAM R.
LastName string اللقب تالبوت
Address address العنوان 123 عنوان الشارع مدينتك WA 99999-1234
DateOfBirth date تاريخ الميلاد 01/06/1958
DateOfExpiration date تاريخ انتهاء الصلاحية 08/12/2020
DateOfIssue date تاريخ الإصدار 08/12/2012
EyeColor string لون العينين أزرق
HairColor string لون الشعر ‏‏بني
Height string Height 5'11"
Weight string الوزن 185 رطل
Sex string النوع M
Endorsements string Endorsements L
Restrictions string القيود مضمن
VehicleClassifications string تصنيف المركبات D

idDocument.passport

الحقل نوع ‏‏الوصف مثال
DocumentNumber string رقم جواز السفر 340020013
FirstName string الاسم المعطا والحرف الأول الأوسط إن أمكن جنيفر
MiddleName string الاسم بين الاسم المحدد والقب رييس
LastName string اللقب بروكس
Aliases array
Aliases.* string المعروف أيضا باسم MAT LIN
DateOfBirth date تاريخ الميلاد 1980-01-01
DateOfExpiration date تاريخ انتهاء الصلاحية 2019-05-05
DateOfIssue date تاريخ الإصدار 2014-05-06
Sex string النوع F
CountryRegion countryRegion البلد أو المؤسسة المصدرة الولايات المتحدة
DocumentType string نوع المستند P
Nationality countryRegion الجنسية الولايات المتحدة
PlaceOfBirth string مكان الميلاد ماساتشوستس، الولايات المتحدة الأمريكية
PlaceOfIssue string مكان المشكلة لشبونه
IssuingAuthority string الجهة المصدرة وزارة الخارجية الأمريكية
PersonalNumber string المعرف الشخصي. ‏‏لا. A234567893
MachineReadableZone object منطقة قابلة للقراءة الآلية (MRZ) P<USABROOKS<<جنيفر<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816
MachineReadableZone.FirstName string الاسم المعطا والحرف الأول الأوسط إن أمكن جنيفر
MachineReadableZone.LastName string اللقب بروكس
MachineReadableZone.DocumentNumber string رقم جواز السفر 340020013
MachineReadableZone.CountryRegion countryRegion البلد أو المؤسسة المصدرة الولايات المتحدة
MachineReadableZone.Nationality countryRegion الجنسية الولايات المتحدة
MachineReadableZone.DateOfBirth date تاريخ الميلاد 1980-01-01
MachineReadableZone.DateOfExpiration date تاريخ انتهاء الصلاحية 2019-05-05
MachineReadableZone.Sex string النوع F

idDocument.nationalIdentityCard

الحقل نوع ‏‏الوصف مثال
CountryRegion countryRegion رمز البلد أو المنطقة الولايات المتحدة
Region string المحافظة أو المنطقة واشنطن‬
DocumentNumber string رقم بطاقة الهوية الوطنية WDLABCD456DG
DocumentDiscriminator string مستند بطاقة الهوية الوطنية تمييزي 12645646464554646456464544
FirstName string الاسم المعطا والحرف الأول الأوسط إن أمكن LIAM R.
LastName string اللقب تالبوت
Address address العنوان 123 عنوان الشارع مدينتك WA 99999-1234
DateOfBirth date تاريخ الميلاد 01/06/1958
DateOfExpiration date تاريخ انتهاء الصلاحية 08/12/2020
DateOfIssue date تاريخ الإصدار 08/12/2012
EyeColor string لون العينين الازرق
HairColor string لون الشعر براون
Height string Height 5'11"
Weight string الوزن 185 رطل
Sex string النوع M

idDocument.residencePermit

الحقل نوع ‏‏الوصف مثال
CountryRegion countryRegion رمز البلد أو المنطقة الولايات المتحدة
DocumentNumber string رقم تصريح الإقامة WDLABCD456DG
FirstName string الاسم المعطا والحرف الأول الأوسط إن أمكن LIAM R.
LastName string اللقب تالبوت
DateOfBirth date تاريخ الميلاد 01/06/1958
DateOfExpiration date تاريخ انتهاء الصلاحية 08/12/2020
DateOfIssue date تاريخ الإصدار 08/12/2012
Sex string النوع M
PlaceOfBirth string مكان الميلاد ألمانيا
Category string فئة التصريح DV2
Address string العنوان 123 عنوان الشارع مدينتك WA 99999-1234

idDocument.usSocialSecurityCard

الحقل نوع ‏‏الوصف مثال
DocumentNumber string رقم بطاقة الضمان الاجتماعي WDLABCD456DG
FirstName string الاسم المعطا والحرف الأول الأوسط إن أمكن LIAM R.
LastName string اللقب تالبوت
DateOfIssue date تاريخ الإصدار 08/12/2012

idDocument

الحقل نوع ‏‏الوصف مثال
Address address العنوان 123 عنوان الشارع مدينتك WA 99999-1234
DocumentNumber string رقم رخصة القيادة WDLABCD456DG
FirstName string الاسم المعطا والحرف الأول الأوسط إن أمكن LIAM R.
LastName string اللقب تالبوت
DateOfBirth date تاريخ الميلاد 01/06/1958
DateOfExpiration date تاريخ انتهاء الصلاحية 08/12/2020

أنواع المستندات التي تم دعمها

يدعم نموذج وثيقة المعرف حاليا تراخيص القيادة الأمريكية وصفحة السيرة الذاتية من جوازات السفر الدولية (باستثناء التأشيرة وغيرها من وثائق السفر).

الحقول المستخرجة

Name كتابة ‏‏الوصف القيمة‬
البلد البلد رمز البلد المتوافق مع معيار ISO 3166 "الولايات المتحدة الأمريكية"
تاريخ الميلاد date DOB بتنسيق YYYY-MM-DD "1980-01-01"
DateOfExpiration date تاريخ انتهاء الصلاحية بتنسيق YYYY-MM-DD "2019-05-05"
DocumentNumber سلسلة رقم جواز السفر ذي الصلة ورقم رخصة القيادة وما إلى ذلك. "340020013"
FirstName سلسلة استخراج الاسم الأول والحرف الأول الأوسط إن أمكن "جينيفر"
LastName سلسلة اللقب المستخرج "بروكس"
الجنسية البلد رمز البلد المتوافق مع معيار ISO 3166 "الولايات المتحدة الأمريكية"
النوع النوع تتضمن القيم المستخرجة المحتملة "M" "F" "X" "F"
MachineReadableZone كائن تم استخراج جواز السفر MRZ بما في ذلك سطرين من 44 حرفاً لكل منهما "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType سلسلة نوع الوثيقة، على سبيل المثال، جواز السفر، رخصة القيادة "جواز سفر"
العنوان سلسلة العنوان المستخرج (رخصة القيادة فقط) "عنوان الشارع 123 مدينتك WA 99999-1234"
المنطقة سلسلة المنطقة أو الولاية أو المقاطعة المستخرجة وما إلى ذلك (رخصة القيادة فقط) "واشنطن"

دليل الترحيل

  • اتبع دليل ترحيل Document Intelligence v3.1 لمعرفة كيفية استخدام إصدار v3.0 في التطبيقات وسير العمل.

الخطوات التالية

  • حاول معالجة النماذج والمستندات الخاصة بك باستخدام Document Intelligence Studio.

  • أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.

  • حاول معالجة النماذج والمستندات الخاصة بك باستخدام أداة تسمية نموذج تحليل معلومات المستند.

  • أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.