نموذج مستند معرف معلومات المستند
هام
- توفر إصدارات المعاينة العامة ل Document Intelligence وصولا مبكرا إلى الميزات قيد التطوير النشط.
- قد تتغير الميزات والنهج والعمليات، قبل التوفر العام (GA)، استنادا إلى ملاحظات المستخدم.
- إصدار المعاينة العامة لمكتبات عميل Document Intelligence افتراضيا إلى إصدار REST API 2024-02-29-preview.
- يتوفر إصدار المعاينة العامة 2024-02-29-preview حاليا فقط في مناطق Azure التالية:
- شرق الولايات المتحدة
- غرب الولايات المتحدة 2
- غرب أوروبا
ينطبق هذا المحتوى على:v4.0 (معاينة) | الإصدارات السابقة:v3.1 (GA)v3.0 (GA)v2.1 (GA)
ينطبق هذا المحتوى على:v3.1 (GA) | أحدث إصدار:v4.0 (معاينة) | الإصدارات السابقة:v3.0v2.1
ينطبق هذا المحتوى على:v3.0 (GA) | أحدث الإصدارات:v4.0 (معاينة)v3.1 | الإصدار السابق:v2.1
ينطبق هذا المحتوى على:v2.1 | أحدث إصدار:v4.0 (معاينة)
يجمع نموذج مستند Document Intelligence Identity (ID) بين التعرف البصري على الحروف (OCR) ونماذج التعلم العميق لتحليل المعلومات الرئيسية واستخراجها من مستندات الهوية. تقوم واجهة برمجة التطبيقات بتحليل مستندات الهوية (بما في ذلك ما يلي) وإرجاع تمثيل بيانات JSON منظم:
- دفتر جوازات السفر، بطاقة جواز السفر في جميع أنحاء العالم
- رخصة قيادة من الولايات المتحدة وأوروبا والهند وكندا وأستراليا
- بطاقات هوية الولايات المتحدة، تصريح الإقامة (البطاقة الخضراء)، بطاقة الضمان الاجتماعي، المعرف العسكري
- بطاقات الهوية الأوروبية وتصاريح الإقامة
- بطاقة India PAN، بطاقة Aadhaar
- بطاقات الهوية الكندية، تصريح الإقامة (بطاقة القيقب)
- بطاقة الصورة في أستراليا، معرف تمرير المفتاح (بما في ذلك الإصدار الرقمي)
يمكن للتحليل الذكي للوثائق تحليل المعلومات واستخراجها من وثائق الهوية الصادرة عن الحكومة (المعرفات) باستخدام نموذج المعرفات الذي تم إنشاؤه مسبقا. فهو يجمع بين قدراتنا القوية للتعرف البصري على الحروف (OCR) مع قدرات التعرف على المعرف لاستخراج المعلومات الرئيسية من جوازات السفر العالمية وتراخيص القيادة الأمريكية (جميع الولايات الخمسين وD.C.). تستخرج واجهة برمجة تطبيقات المعرفات المعلومات الرئيسية من مستندات الهوية هذه، مثل الاسم الأول والقب وتاريخ الميلاد ورقم المستند والمزيد. تتوفر واجهة برمجة التطبيقات هذه في Document Intelligence v2.1 كخدمة سحابية.
معالجة مستندات الهوية
تتضمن معالجة مستندات الهوية استخراج البيانات من مستندات الهوية إما يدويا أو باستخدام تقنية قائمة على التعرف البصري على الحروف. تعد معالجة مستند المعرف خطوة مهمة في أي عملية تجارية تتطلب إثبات الهوية. وتشمل الأمثلة على ذلك التحقق من العملاء في البنوك والمؤسسات المالية الأخرى، وتطبيقات الرهن العقاري، والزيارات الطبية، ومعالجة المطالبات، وصناعة الضيافة، وأكثر من ذلك. يقدم الأفراد بعض الإثباتات على هويتهم من خلال تراخيص القيادة وجوازات السفر وغيرها من الوثائق المماثلة بحيث يمكن للأعمال التحقق منها بكفاءة قبل تقديم الخدمات والفوائد.
نموذج رخصة القيادة الأمريكية التي تمت معالجتها باستخدام Document Intelligence Studio
استخراج البيانات
تستخرج خدمة المعرفات التي تم إنشاؤها مسبقا القيم الرئيسية من جوازات السفر العالمية وتراخيص القيادة الأمريكية وتعيدها في استجابة JSON منظمة منظمة.
مثال على رخصة القيادة
مثال جواز السفر
خيارات التطوير
يدعم Document Intelligence v4.0 (2024-02-29-preview، 2023-10-31-preview) الأدوات والتطبيقات والمكتبات التالية:
ميزة | الموارد | معرف النموذج |
---|---|---|
نموذج مستند المعرف | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
يدعم Document Intelligence v3.1 الأدوات والتطبيقات والمكتبات التالية:
ميزة | الموارد | معرف النموذج |
---|---|---|
نموذج مستند المعرف | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
يدعم Document Intelligence v3.0 الأدوات والتطبيقات والمكتبات التالية:
ميزة | الموارد | معرف النموذج |
---|---|---|
نموذج مستند المعرف | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
يدعم Document Intelligence v2.1 الأدوات والتطبيقات والمكتبات التالية:
ميزة | الموارد |
---|---|
نموذج مستند المعرف | • أداة تسمية ذكاء المستند• REST API • مكتبة العميل SDK • حاوية Docker لذكاء المستند |
متطلبات الإدخال
للحصول على أفضل النتائج، قم بتوفير صورة واحدة واضحة أو مسح ضوئي عالي الجودة لكل مستند.
تنسيقات الملفات المعتمدة:
النموذج PDF الصورة:
JPEG/JPG، PNG، BMP، TIFF، HEIFMicrosoft Office:
Word (DOCX) وExcel (XLSX) وPowerPoint (PPTX) وHTMLقراءة ✔ ✔ ✔ Layout ✔ ✔ ✔ (معاينة 2024-02-29، 2023-10-31-preview) مستند عام ✔ ✔ منشأ مسبقًا ✔ ✔ استخراج مخصص ✔ ✔ تصنيف مخصص ✔ ✔ ✔ (2024-02-29-preview) بالنسبة لملفات PDF وTIFF، يمكن معالجة ما يصل إلى 2000 صفحة (بالنسببة للاشتراك المجاني، تتم معالجة أول صفحتين فقط).
حجم الملف لتحليل المستندات هو 500 ميغابايت للطبقة المدفوعة (S0) و4 ميغابايت للمستوى المجاني (F0).
يجب أن تتراوح أبعاد الصورة بين 50 × 50 بكسل و 10000 بكسل × 10000 بكسل.
إذا كانت ملفات PDF الخاصة بك مؤمنة بكلمة مرور، فيجب عليك إزالة القفل قبل الإرسال.
الحد الأدنى لارتفاع النص المراد استخراجه هو 12 بكسل لصورة 1024 × 768 بكسل. يتوافق هذا البعد مع نص نقطة تقريبا
8
عند 150 نقطة لكل بوصة (DPI).بالنسبة للتدريب على النموذج المخصص، الحد الأقصى لعدد صفحات بيانات التدريب هو 500 لنموذج القالب المخصص و50000 للنموذج العصبي المخصص.
لتدريب نموذج الاستخراج المخصص، يبلغ الحجم الإجمالي لبيانات التدريب 50 ميغابايت لنموذج القالب و1G-MB للنموذج العصبي.
بالنسبة لتدريب نموذج التصنيف المخصص، يكون الحجم الإجمالي لبيانات
1GB
التدريب بحد أقصى 10000 صفحة.
تنسيقات الملفات المدعومة: JPEG وPNG وPDF وTIFF.
عدد الصفحات المعتمدة لملفات PDF وTIFF: ما يصل إلى 2000 صفحة أو أول صفحتين فقط لمشتركي المستوى المجاني.
حجم الملف المدعوم: أقل من 50 ميغابايت الإجمالي؛ الحد الأدنى للبكسل: 50 × 50 بكسل؛ الحد الأقصى للبكسل 10,000 × 10,000 بكسل.
استخراج بيانات نموذج مستند المعرف
استخراج البيانات، بما في ذلك الاسم وتاريخ الميلاد وتاريخ انتهاء الصلاحية، من مستندات المعرف. تحتاج إلى الموارد التالية:
اشتراك Azure - يمكنك إنشاء اشتراك مجانا.
مثيل Document Intelligence في مدخل Microsoft Azure. يمكنك استخدام طبقة التسعير المجانية
F0
() لتجربة الخدمة. بعد نشر المورد، حدد انتقال إلى المورد للحصول على المفتاح ونقطة النهاية.
إشعار
يتوفر Document Intelligence Studio مع واجهات برمجة التطبيقات v3.1 وv3.0 والإصدارات الأحدث.
في الصفحة الرئيسية ل Document Intelligence Studio، حدد Identity documents.
يمكنك تحليل نموذج الفاتورة أو تحميل ملفاتك الخاصة.
حدد الزر Run analysis، وقم بتكوين خيارات Analyze، إذا لزم الأمر:
أداة تسمية نموذج تحليل معلومات المستند
انتقل إلى Document Intelligence Sample Tool.
في الصفحة الرئيسية لأداة العينة، حدد لوحة استخدام النموذج الذي تم إنشاؤه مسبقا للحصول على البيانات .
حدد نوع النموذج لتحليله من القائمة المنسدلة.
اختر عنوان URL للملف الذي ترغب في تحليله من الخيارات التالية:
في مجال المصدر، حدد URL من القائمة المنسدلة، والصق عنوان URL المحدد، وحدد الزر إحضار.
في حقل نقطة نهاية خدمة Document Intelligence، الصق نقطة النهاية التي حصلت عليها باستخدام اشتراك Document Intelligence.
في حقل المفتاح ، الصق المفتاح الذي حصلت عليه من مورد Document Intelligence.
حدد تشغيل التحليل. تستدعي أداة تسمية نموذج تحليل معلومات المستند واجهة برمجة التطبيقات التي تم إنشاؤها مسبقا وتحلل المستند.
عرض النتائج - راجع أزواج قيم المفاتيح المستخرجة وعناصر السطر والنص المميز المستخرج والجداول المكتشفة.
قم بتنزيل ملف إخراج JSON لعرض النتائج التفصيلية.
- تحتوي عقدة "readResults" على كل سطر من النص مع موضع مربع الإحاطة الخاص به على الصفحة.
- تعرض عقدة "علامات التحديد" كل علامة تحديد (خانة اختيار، علامة اختيار) وما إذا كانت حالتها محددة أو غير محددة.
- يتضمن قسم "pageResults" الجداول المستخرجة. لكل جدول، يستخرج Document Intelligence النص وفهرس الصف والعمود وامتداد الصف والعمود ومربع الإحاطة والمزيد.
- يحتوي الحقل "documentResults" على معلومات أزواج المفاتيح/ القيم ومعلومات عناصر البند للأجزاء الأكثر صلة من المستند.
إشعار
لا تدعم أداة Sample Labeling تنسيق ملف BMP. هذا قيد على الأداة وليس خدمة معلومات المستند.
أنواع المستندات التي تم دعمها
المنطقة | أنواع المستندات |
---|---|
على مستوى العالم | دفتر جوازات السفر، بطاقة جواز السفر |
الولايات المتحدة | رخصة القيادة، بطاقة الهوية، تصريح الإقامة (البطاقة الخضراء)، بطاقة الضمان الاجتماعي، المعرف العسكري |
أوروبا | رخصة القيادة، بطاقة الهوية، تصريح الإقامة |
الهند | رخصة القيادة، بطاقة PAN، بطاقة Aadhaar |
كندا | رخصة القيادة، بطاقة الهوية، تصريح الإقامة (بطاقة القيقب) |
أستراليا | رخصة القيادة، بطاقة الصورة، معرف مفتاح المرور (بما في ذلك الإصدار الرقمي) |
عمليات استخراج الحقل
فيما يلي الحقول المستخرجة لكل نوع مستند. يستخرج نموذج prebuilt-idDocument
Document Intelligence ID الحقول التالية في documents.*.fields
. يتضمن إخراج json جميع النص المستخرج في المستندات والكلمات والخطوط والأنماط.
idDocument.driverLicense
الحقل | نوع | الوصف | مثال |
---|---|---|---|
CountryRegion |
countryRegion |
رمز البلد أو المنطقة | الولايات المتحدة |
Region |
string |
المحافظة أو المنطقة | واشنطن |
DocumentNumber |
string |
رقم رخصة القيادة | WDLABCD456DG |
DocumentDiscriminator |
string |
مستند رخصة القيادة تمييزي | 12645646464554646456464544 |
FirstName |
string |
الاسم المعطا والحرف الأول الأوسط إن أمكن | LIAM R. |
LastName |
string |
اللقب | تالبوت |
Address |
address |
العنوان | 123 عنوان الشارع مدينتك WA 99999-1234 |
DateOfBirth |
date |
تاريخ الميلاد | 01/06/1958 |
DateOfExpiration |
date |
تاريخ انتهاء الصلاحية | 08/12/2020 |
DateOfIssue |
date |
تاريخ الإصدار | 08/12/2012 |
EyeColor |
string |
لون العينين | أزرق |
HairColor |
string |
لون الشعر | بني |
Height |
string |
Height | 5'11" |
Weight |
string |
الوزن | 185 رطل |
Sex |
string |
النوع | M |
Endorsements |
string |
Endorsements | L |
Restrictions |
string |
القيود | مضمن |
VehicleClassifications |
string |
تصنيف المركبات | D |
idDocument.passport
الحقل | نوع | الوصف | مثال |
---|---|---|---|
DocumentNumber |
string |
رقم جواز السفر | 340020013 |
FirstName |
string |
الاسم المعطا والحرف الأول الأوسط إن أمكن | جنيفر |
MiddleName |
string |
الاسم بين الاسم المحدد والقب | رييس |
LastName |
string |
اللقب | بروكس |
Aliases |
array |
||
Aliases.* |
string |
المعروف أيضا باسم | MAT LIN |
DateOfBirth |
date |
تاريخ الميلاد | 1980-01-01 |
DateOfExpiration |
date |
تاريخ انتهاء الصلاحية | 2019-05-05 |
DateOfIssue |
date |
تاريخ الإصدار | 2014-05-06 |
Sex |
string |
النوع | F |
CountryRegion |
countryRegion |
البلد أو المؤسسة المصدرة | الولايات المتحدة |
DocumentType |
string |
نوع المستند | P |
Nationality |
countryRegion |
الجنسية | الولايات المتحدة |
PlaceOfBirth |
string |
مكان الميلاد | ماساتشوستس، الولايات المتحدة الأمريكية |
PlaceOfIssue |
string |
مكان المشكلة | لشبونه |
IssuingAuthority |
string |
الجهة المصدرة | وزارة الخارجية الأمريكية |
PersonalNumber |
string |
المعرف الشخصي. لا. | A234567893 |
MachineReadableZone |
object |
منطقة قابلة للقراءة الآلية (MRZ) | P<USABROOKS<<جنيفر<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816 |
MachineReadableZone.FirstName |
string |
الاسم المعطا والحرف الأول الأوسط إن أمكن | جنيفر |
MachineReadableZone.LastName |
string |
اللقب | بروكس |
MachineReadableZone.DocumentNumber |
string |
رقم جواز السفر | 340020013 |
MachineReadableZone.CountryRegion |
countryRegion |
البلد أو المؤسسة المصدرة | الولايات المتحدة |
MachineReadableZone.Nationality |
countryRegion |
الجنسية | الولايات المتحدة |
MachineReadableZone.DateOfBirth |
date |
تاريخ الميلاد | 1980-01-01 |
MachineReadableZone.DateOfExpiration |
date |
تاريخ انتهاء الصلاحية | 2019-05-05 |
MachineReadableZone.Sex |
string |
النوع | F |
idDocument.nationalIdentityCard
الحقل | نوع | الوصف | مثال |
---|---|---|---|
CountryRegion |
countryRegion |
رمز البلد أو المنطقة | الولايات المتحدة |
Region |
string |
المحافظة أو المنطقة | واشنطن |
DocumentNumber |
string |
رقم بطاقة الهوية الوطنية | WDLABCD456DG |
DocumentDiscriminator |
string |
مستند بطاقة الهوية الوطنية تمييزي | 12645646464554646456464544 |
FirstName |
string |
الاسم المعطا والحرف الأول الأوسط إن أمكن | LIAM R. |
LastName |
string |
اللقب | تالبوت |
Address |
address |
العنوان | 123 عنوان الشارع مدينتك WA 99999-1234 |
DateOfBirth |
date |
تاريخ الميلاد | 01/06/1958 |
DateOfExpiration |
date |
تاريخ انتهاء الصلاحية | 08/12/2020 |
DateOfIssue |
date |
تاريخ الإصدار | 08/12/2012 |
EyeColor |
string |
لون العينين | الازرق |
HairColor |
string |
لون الشعر | براون |
Height |
string |
Height | 5'11" |
Weight |
string |
الوزن | 185 رطل |
Sex |
string |
النوع | M |
idDocument.residencePermit
الحقل | نوع | الوصف | مثال |
---|---|---|---|
CountryRegion |
countryRegion |
رمز البلد أو المنطقة | الولايات المتحدة |
DocumentNumber |
string |
رقم تصريح الإقامة | WDLABCD456DG |
FirstName |
string |
الاسم المعطا والحرف الأول الأوسط إن أمكن | LIAM R. |
LastName |
string |
اللقب | تالبوت |
DateOfBirth |
date |
تاريخ الميلاد | 01/06/1958 |
DateOfExpiration |
date |
تاريخ انتهاء الصلاحية | 08/12/2020 |
DateOfIssue |
date |
تاريخ الإصدار | 08/12/2012 |
Sex |
string |
النوع | M |
PlaceOfBirth |
string |
مكان الميلاد | ألمانيا |
Category |
string |
فئة التصريح | DV2 |
Address |
string |
العنوان | 123 عنوان الشارع مدينتك WA 99999-1234 |
idDocument.usSocialSecurityCard
الحقل | نوع | الوصف | مثال |
---|---|---|---|
DocumentNumber |
string |
رقم بطاقة الضمان الاجتماعي | WDLABCD456DG |
FirstName |
string |
الاسم المعطا والحرف الأول الأوسط إن أمكن | LIAM R. |
LastName |
string |
اللقب | تالبوت |
DateOfIssue |
date |
تاريخ الإصدار | 08/12/2012 |
idDocument
الحقل | نوع | الوصف | مثال |
---|---|---|---|
Address |
address |
العنوان | 123 عنوان الشارع مدينتك WA 99999-1234 |
DocumentNumber |
string |
رقم رخصة القيادة | WDLABCD456DG |
FirstName |
string |
الاسم المعطا والحرف الأول الأوسط إن أمكن | LIAM R. |
LastName |
string |
اللقب | تالبوت |
DateOfBirth |
date |
تاريخ الميلاد | 01/06/1958 |
DateOfExpiration |
date |
تاريخ انتهاء الصلاحية | 08/12/2020 |
أنواع المستندات التي تم دعمها
يدعم نموذج وثيقة المعرف حاليا تراخيص القيادة الأمريكية وصفحة السيرة الذاتية من جوازات السفر الدولية (باستثناء التأشيرة وغيرها من وثائق السفر).
الحقول المستخرجة
Name | كتابة | الوصف | القيمة |
---|---|---|---|
البلد | البلد | رمز البلد المتوافق مع معيار ISO 3166 | "الولايات المتحدة الأمريكية" |
تاريخ الميلاد | date | DOB بتنسيق YYYY-MM-DD | "1980-01-01" |
DateOfExpiration | date | تاريخ انتهاء الصلاحية بتنسيق YYYY-MM-DD | "2019-05-05" |
DocumentNumber | سلسلة | رقم جواز السفر ذي الصلة ورقم رخصة القيادة وما إلى ذلك. | "340020013" |
FirstName | سلسلة | استخراج الاسم الأول والحرف الأول الأوسط إن أمكن | "جينيفر" |
LastName | سلسلة | اللقب المستخرج | "بروكس" |
الجنسية | البلد | رمز البلد المتوافق مع معيار ISO 3166 | "الولايات المتحدة الأمريكية" |
النوع | النوع | تتضمن القيم المستخرجة المحتملة "M" "F" "X" | "F" |
MachineReadableZone | كائن | تم استخراج جواز السفر MRZ بما في ذلك سطرين من 44 حرفاً لكل منهما | "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
DocumentType | سلسلة | نوع الوثيقة، على سبيل المثال، جواز السفر، رخصة القيادة | "جواز سفر" |
العنوان | سلسلة | العنوان المستخرج (رخصة القيادة فقط) | "عنوان الشارع 123 مدينتك WA 99999-1234" |
المنطقة | سلسلة | المنطقة أو الولاية أو المقاطعة المستخرجة وما إلى ذلك (رخصة القيادة فقط) | "واشنطن" |
دليل الترحيل
- اتبع دليل ترحيل Document Intelligence v3.1 لمعرفة كيفية استخدام إصدار v3.0 في التطبيقات وسير العمل.
الخطوات التالية
حاول معالجة النماذج والمستندات الخاصة بك باستخدام Document Intelligence Studio.
أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.
الملاحظات
https://aka.ms/ContentUserFeedback.
قريبًا: خلال عام 2024، سنتخلص تدريجيًا من GitHub Issues بوصفها آلية إرسال ملاحظات للمحتوى ونستبدلها بنظام ملاحظات جديد. لمزيد من المعلومات، راجعإرسال الملاحظات وعرضها المتعلقة بـ