نموذج إيصال ذكاء المستند
هام
- توفر إصدارات المعاينة العامة ل Document Intelligence وصولا مبكرا إلى الميزات قيد التطوير النشط.
- قد تتغير الميزات والنهج والعمليات، قبل التوفر العام (GA)، استنادا إلى ملاحظات المستخدم.
- إصدار المعاينة العامة لمكتبات عميل Document Intelligence افتراضيا إلى إصدار REST API 2024-02-29-preview.
- يتوفر إصدار المعاينة العامة 2024-02-29-preview حاليا فقط في مناطق Azure التالية:
- شرق الولايات المتحدة
- غرب الولايات المتحدة 2
- غرب أوروبا
ينطبق هذا المحتوى على: v4.0 (معاينة) | الإصدارات السابقة: v3.1 (GA) v3.0 (GA) v2.1 (GA)
ينطبق هذا المحتوى على: v3.1 (GA) | أحدث إصدار: v4.0 (معاينة) | الإصدارات السابقة: v3.0 v2.1
ينطبق هذا المحتوى على: v3.0 (GA) | أحدث الإصدارات: v4.0 (معاينة) v3.1 | الإصدار السابق: v2.1
ينطبق هذا المحتوى على: الإصدار 2.1 | الأحدث: v4.0 (معاينة)
يجمع نموذج إيصال ذكاء المستند بين قدرات التعرف البصري على الحروف (OCR) القوية ونماذج التعلم العميق لتحليل واستخراج المعلومات الرئيسية من إيصالات المبيعات. يمكن أن تكون الإيصالات من مختلف التنسيقات والجودة بما في ذلك الإيصالات المطبوعة والمكتوبة بخط اليد. تستخرج واجهة برمجة التطبيقات المعلومات الرئيسية مثل اسم التاجر ورقم هاتف التاجر وتاريخ المعاملة والضريبة وإجمالي العملية، وتُرجع بيانات JSON المنظمة.
أنواع الإيصالات المدعومة:
- حراري
- بطاقة الائتمان
- غاز
- الموقف
- فندق
- النقل والمواصلات
- الاتصالات
- الترفيه
- طيران
- التدريب
- صيدلية/طبية
استخراج بيانات الإيصال
يشمل رقمنة الإيصالات تحويل أنواع مختلفة من الإيصالات، بما في ذلك النسخ الممسوحة ضوئيا والتصوير الفوتوغرافي والمطبوعة، إلى تنسيق رقمي للمعالجة المبسطة للمصب. تتضمن الأمثلة إدارة النفقات، وتحليل سلوك المستهلك، والأتمتة الضريبية، وما إلى ذلك. يمكن لاستخدام تقنية Document Intelligence مع OCR (التعرف البصري على الحروف) استخراج البيانات وتفسيرها من تنسيقات الإيصالات المتنوعة هذه. تعمل معالجة ذكاء المستندات على تبسيط عملية التحويل ولكنها تقلل أيضا بشكل كبير من الوقت والجهد المطلوبين، مما يسهل إدارة البيانات بكفاءة واستردادها.
نموذج إيصال تمت معالجته باستخدام Document Intelligence Studio:
تمت معالجة إيصال العينة باستخدام أداة تسمية نموذج ذكاء المستند:
خيارات التطوير
يدعم Document Intelligence v4.0 (2024-02-29-preview، 2023-10-31-preview) الأدوات والتطبيقات والمكتبات التالية:
ميزة | الموارد | معرف النموذج |
---|---|---|
نموذج الإيصال | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-receipt |
يدعم Document Intelligence v3.1 الأدوات والتطبيقات والمكتبات التالية:
ميزة | الموارد | معرف النموذج |
---|---|---|
نموذج الإيصال | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-receipt |
يدعم Document Intelligence v3.0 الأدوات والتطبيقات والمكتبات التالية:
ميزة | الموارد | معرف النموذج |
---|---|---|
نموذج الإيصال | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-receipt |
يدعم Document Intelligence v2.1 الأدوات والتطبيقات والمكتبات التالية:
ميزة | الموارد |
---|---|
نموذج الإيصال | • أداة تسمية ذكاء المستند• REST API • مكتبة العميل SDK • حاوية Docker لذكاء المستند |
متطلبات الإدخال
للحصول على أفضل النتائج، قم بتوفير صورة واحدة واضحة أو مسح ضوئي عالي الجودة لكل مستند.
تنسيقات الملفات المعتمدة:
النموذج PDF الصورة:
JPEG/JPG، PNG، BMP، TIFF، HEIFMicrosoft Office:
Word (DOCX) وExcel (XLSX) وPowerPoint (PPTX) وHTMLقراءة ✔ ✔ ✔ Layout ✔ ✔ ✔ (معاينة 2024-02-29، 2023-10-31-preview) مستند عام ✔ ✔ منشأ مسبقًا ✔ ✔ استخراج مخصص ✔ ✔ تصنيف مخصص ✔ ✔ ✔ (2024-02-29-preview) بالنسبة لملفات PDF وTIFF، يمكن معالجة ما يصل إلى 2000 صفحة (بالنسببة للاشتراك المجاني، تتم معالجة أول صفحتين فقط).
حجم الملف لتحليل المستندات هو 500 ميغابايت للطبقة المدفوعة (S0) و4 ميغابايت للمستوى المجاني (F0).
يجب أن تتراوح أبعاد الصورة بين 50 × 50 بكسل و 10000 بكسل × 10000 بكسل.
إذا كانت ملفات PDF الخاصة بك مؤمنة بكلمة مرور، فيجب عليك إزالة القفل قبل الإرسال.
الحد الأدنى لارتفاع النص المراد استخراجه هو 12 بكسل لصورة 1024 × 768 بكسل. يتوافق هذا البعد مع نص نقطة تقريبا
8
عند 150 نقطة لكل بوصة (DPI).بالنسبة للتدريب على النموذج المخصص، الحد الأقصى لعدد صفحات بيانات التدريب هو 500 لنموذج القالب المخصص و50000 للنموذج العصبي المخصص.
لتدريب نموذج الاستخراج المخصص، يبلغ الحجم الإجمالي لبيانات التدريب 50 ميغابايت لنموذج القالب و1G-MB للنموذج العصبي.
بالنسبة لتدريب نموذج التصنيف المخصص، يكون الحجم الإجمالي لبيانات
1GB
التدريب بحد أقصى 10000 صفحة.
- تنسيقات الملفات المدعومة: JPEG وPNG وPDF وTIFF.
- بدل الصفحة المدعوم لمشتركي PDF وTIFF: يمكن ل Document Intelligence معالجة ما يصل إلى 2000 صفحة لمشتركي المستوى القياسي أو أول صفحتين فقط لمشتركي الطبقة الحرة.
- حجم الملف المدعوم: أقل من 50 ميغابايت؛ الحد الأدنى للبكسل 50 × 50 بكسل؛ الحد الأقصى للبكسل 10,000 × 10,000 بكسل.
استخراج بيانات نموذج الإيصال
راجع كيفية استخراج ذكاء المستند للبيانات، بما في ذلك وقت وتاريخ المعاملات ومعلومات التاجر وإجماليات المقدار من الإيصالات. تحتاج إلى الموارد التالية:
اشتراك Azure - يمكنك إنشاء اشتراك مجانا.
مثيل Document Intelligence في مدخل Microsoft Azure. يمكنك استخدام طبقة التسعير المجانية
F0
() لتجربة الخدمة. بعد نشر المورد، حدد انتقال إلى المورد للحصول على المفتاح ونقطة النهاية.
إشعار
يتوفر Document Intelligence Studio مع واجهات برمجة التطبيقات v3.1 وv3.0 والإصدارات الأحدث.
في الصفحة الرئيسية ل Document Intelligence Studio، حدد الإيصالات.
يمكنك تحليل إيصال العينة أو تحميل ملفاتك الخاصة.
حدد الزر Run analysis، وقم بتكوين خيارات Analyze، إذا لزم الأمر:
أداة تسمية نموذج تحليل معلومات المستند
انتقل إلى Document Intelligence Sample Tool.
في الصفحة الرئيسية لأداة العينة، حدد لوحة استخدام النموذج الذي تم إنشاؤه مسبقا للحصول على البيانات .
حدد نوع النموذج لتحليله من القائمة المنسدلة.
اختر عنوان URL للملف الذي ترغب في تحليله من الخيارات التالية:
في مجال المصدر، حدد URL من القائمة المنسدلة، والصق عنوان URL المحدد، وحدد الزر إحضار.
في حقل نقطة نهاية خدمة Document Intelligence، الصق نقطة النهاية التي حصلت عليها باستخدام اشتراك Document Intelligence.
في حقل المفتاح ، الصق المفتاح الذي حصلت عليه من مورد Document Intelligence.
حدد تشغيل التحليل. تستدعي أداة تسمية نموذج تحليل معلومات المستند واجهة برمجة التطبيقات التي تم إنشاؤها مسبقا وتحليل المستند.
عرض النتائج - راجع أزواج قيم المفاتيح المستخرجة وعناصر السطر والنص المميز المستخرج والجداول المكتشفة.
إشعار
لا تدعم أداة Sample Labeling تنسيق ملف BMP. هذا قيد على الأداة وليس خدمة معلومات المستند.
اللغات والإعدادات المحلية المدعومة
راجع صفحة دعم اللغة - النماذج التي تم إنشاؤها مسبقا للحصول على قائمة كاملة باللغات المدعومة.
استخراج ميداني
Name | كتابة | الوصف | الإخراج القياسي |
---|---|---|---|
ReceiptType | السلسلة | نوع إيصال المبيعات | تفصيلي |
MerchantName | السلسلة | اسم التاجر الذي يصدر الإيصال | |
رقم هاتف التاجر | phoneNumber | رقم هاتف التاجر المدرج | +1 xxx xxx xxxx |
MerchantAddress | السلسلة | عنوان التاجر المدرج | |
TransactionDate | التاريخ | تاريخ إصدار الإيصال | يوم-شهر-سنة |
TransactionTime | الوقت | وقت إصدار الإيصال | ساعة-دقيقة-ثانية (24 ساعة) |
الإجمالي | الرقم (دولار أمريكي) | إجمالي العملية الكاملة للإيصال | عائم ثنائي عشري |
الإجمالي الفرعي | الرقم (دولار أمريكي) | الإجمالي الفرعي للإيصال، غالباً قبل تطبيق الضرائب | عائم ثنائي عشري |
ضريبة | الرقم (دولار أمريكي) | إجمالي الضريبة على الإيصال (غالبا ما تكون ضريبة المبيعات أو ما يعادلها). أُعيد تسميته إلى "TotalTax" في الإصدار 2022-06-30. | عائم ثنائي عشري |
تلميح | الرقم (دولار أمريكي) | تلميح مضمن من المشتري | عائم ثنائي عشري |
Items | مصفوفة الكائنات | أصناف الخط المستخرج، مع الاسم، والكمية، وسعر الوحدة، والسعر الإجمالي المستخرج | |
الاسم | السلسلة | وصف العنصر. أعيدت تسميته إلى "Description" في الإصدار 2022-06-30. | |
الكمية | الرقم | كمية كل عنصر على حدة | عائم ثنائي عشري |
السعر | الرقم | السعر الفردي لكل وحدة عنصر على حدة | عائم ثنائي عشري |
السعر الإجمالي | الرقم | السعر الإجمالي لعنصر الخط | عائم ثنائي عشري |
يقدم Document Intelligence v3.0 والإصدارات الأحدث العديد من الميزات والقدرات الجديدة. بالإضافة إلى الإيصالات الحرارية، يدعم نموذج الإيصال معالجة إيصالات الفنادق أحادية الصفحة واستخراج التفاصيل الضريبية لجميع أنواع الإيصالات.
يقدم Document Intelligence v4.0 والإصدارات الأحدث دعما للعملة لجميع الحقول المتعلقة بالسعر للإيصالات الحرارية والفندقية.
الإيصال
الحقل | نوع | الوصف | مثال |
---|---|---|---|
MerchantName |
string |
اسم التاجر الذي يصدر الإيصال | Contoso |
MerchantPhoneNumber |
phoneNumber |
رقم هاتف التاجر المدرج | 987-654-3210 |
MerchantAddress |
address |
عنوان التاجر المدرج | 123 شارع ريدموند الرئيسي، واشنطن 98052 |
Total |
number |
إجمالي العملية الكاملة للإيصال | 14.34 دولار |
TransactionDate |
date |
تاريخ إصدار الإيصال | 06 يونيو 2019 |
TransactionTime |
time |
وقت إصدار الإيصال | 4:49 مساء |
Subtotal |
number |
الإجمالي الفرعي للإيصال، غالباً قبل تطبيق الضرائب | 12.34 دولار |
TotalTax |
number |
الضريبة على الاستلام، وغالبا ما تكون ضريبة المبيعات، أو ما يعادلها | 2.00 دولار |
Tip |
number |
تلميح مضمن من المشتري | 1.00 دولار |
Items |
array |
||
Items.* |
object |
عنصر السطر المستخرج | 1 Surface Pro 6 999.00 دولار 999.00 دولار |
Items.*.TotalPrice |
number |
السعر الإجمالي لعنصر الخط | 999.00 دولار |
Items.*.Description |
string |
وصف الصنف | Surface Pro 6 |
Items.*.Quantity |
number |
كمية كل عنصر على حدة | 1 |
Items.*.Price |
number |
السعر الفردي لكل وحدة عنصر على حدة | 999.00 دولار |
Items.*.ProductCode |
string |
رمز المنتج أو رقم المنتج أو SKU المرتبط ببند معين | A123 |
Items.*.QuantityUnit |
string |
وحدة الكمية لكل عنصر | |
TaxDetails |
array |
||
TaxDetails.* |
object |
عنصر السطر المستخرج | 1 Surface Pro 6 999.00 دولار 999.00 دولار |
TaxDetails.*.Amount |
currency |
مبلغ تفاصيل الضريبة | 999.00 دولار |
receipt.retailMeal
الحقل | نوع | الوصف | مثال |
---|---|---|---|
MerchantName |
string |
اسم التاجر الذي يصدر الإيصال | Contoso |
MerchantPhoneNumber |
phoneNumber |
رقم هاتف التاجر المدرج | 987-654-3210 |
MerchantAddress |
address |
عنوان التاجر المدرج | 123 شارع ريدموند الرئيسي، واشنطن 98052 |
Total |
number |
إجمالي العملية الكاملة للإيصال | 14.34 دولار |
TransactionDate |
date |
تاريخ إصدار الإيصال | 06 يونيو 2019 |
TransactionTime |
time |
وقت إصدار الإيصال | 4:49 مساء |
Subtotal |
number |
الإجمالي الفرعي للإيصال، غالباً قبل تطبيق الضرائب | 12.34 دولار |
TotalTax |
number |
الضريبة على الاستلام، وغالبا ما تكون ضريبة المبيعات، أو ما يعادلها | 2.00 دولار |
Tip |
number |
تلميح مضمن من المشتري | 1.00 دولار |
Items |
array |
||
Items.* |
object |
عنصر السطر المستخرج | 1 Surface Pro 6 999.00 دولار 999.00 دولار |
Items.*.TotalPrice |
number |
السعر الإجمالي لعنصر الخط | 999.00 دولار |
Items.*.Description |
string |
وصف الصنف | Surface Pro 6 |
Items.*.Quantity |
number |
كمية كل عنصر على حدة | 1 |
Items.*.Price |
number |
السعر الفردي لكل وحدة عنصر على حدة | 999.00 دولار |
Items.*.ProductCode |
string |
رمز المنتج أو رقم المنتج أو SKU المرتبط ببند معين | A123 |
Items.*.QuantityUnit |
string |
وحدة الكمية لكل عنصر | |
TaxDetails |
array |
||
TaxDetails.* |
object |
عنصر السطر المستخرج | 1 Surface Pro 6 999.00 دولار 999.00 دولار |
TaxDetails.*.Amount |
currency |
مبلغ تفاصيل الضريبة | 999.00 دولار |
إيصال.بطاقة ائتمان
الحقل | نوع | الوصف | مثال |
---|---|---|---|
MerchantName |
string |
اسم التاجر الذي يصدر الإيصال | Contoso |
MerchantPhoneNumber |
phoneNumber |
رقم هاتف التاجر المدرج | 987-654-3210 |
MerchantAddress |
address |
عنوان التاجر المدرج | 123 شارع ريدموند الرئيسي، واشنطن 98052 |
Total |
number |
إجمالي العملية الكاملة للإيصال | 14.34 دولار |
TransactionDate |
date |
تاريخ إصدار الإيصال | 06 يونيو 2019 |
TransactionTime |
time |
وقت إصدار الإيصال | 4:49 مساء |
Subtotal |
number |
الإجمالي الفرعي للإيصال، غالباً قبل تطبيق الضرائب | 12.34 دولار |
TotalTax |
number |
الضريبة على الاستلام، وغالبا ما تكون ضريبة المبيعات، أو ما يعادلها | 2.00 دولار |
Tip |
number |
تلميح مضمن من المشتري | 1.00 دولار |
Items |
array |
||
Items.* |
object |
عنصر السطر المستخرج | 1 Surface Pro 6 999.00 دولار 999.00 دولار |
Items.*.TotalPrice |
number |
السعر الإجمالي لعنصر الخط | 999.00 دولار |
Items.*.Description |
string |
وصف الصنف | Surface Pro 6 |
Items.*.Quantity |
number |
كمية كل عنصر على حدة | 1 |
Items.*.Price |
number |
السعر الفردي لكل وحدة عنصر على حدة | 999.00 دولار |
Items.*.ProductCode |
string |
رمز المنتج أو رقم المنتج أو SKU المرتبط ببند معين | A123 |
Items.*.QuantityUnit |
string |
وحدة الكمية لكل عنصر | |
TaxDetails |
array |
||
TaxDetails.* |
object |
عنصر السطر المستخرج | 1 Surface Pro 6 999.00 دولار 999.00 دولار |
TaxDetails.*.Amount |
currency |
مبلغ تفاصيل الضريبة | 999.00 دولار |
إيصال.غاز
الحقل | نوع | الوصف | مثال |
---|---|---|---|
MerchantName |
string |
اسم التاجر الذي يصدر الإيصال | Contoso |
MerchantPhoneNumber |
phoneNumber |
رقم هاتف التاجر المدرج | 987-654-3210 |
MerchantAddress |
address |
عنوان التاجر المدرج | 123 شارع ريدموند الرئيسي، واشنطن 98052 |
Total |
number |
إجمالي العملية الكاملة للإيصال | 14.34 دولار |
TransactionDate |
date |
تاريخ إصدار الإيصال | 06 يونيو 2019 |
TransactionTime |
time |
وقت إصدار الإيصال | 4:49 مساء |
Subtotal |
number |
الإجمالي الفرعي للإيصال، غالباً قبل تطبيق الضرائب | 12.34 دولار |
TotalTax |
number |
الضريبة على الاستلام، وغالبا ما تكون ضريبة المبيعات، أو ما يعادلها | 2.00 دولار |
Tip |
number |
تلميح مضمن من المشتري | 1.00 دولار |
Items |
array |
||
Items.* |
object |
عنصر السطر المستخرج | 1 Surface Pro 6 999.00 دولار 999.00 دولار |
Items.*.TotalPrice |
number |
السعر الإجمالي لعنصر الخط | 999.00 دولار |
Items.*.Description |
string |
وصف الصنف | Surface Pro 6 |
Items.*.Quantity |
number |
كمية كل عنصر على حدة | 1 |
Items.*.Price |
number |
السعر الفردي لكل وحدة عنصر على حدة | 999.00 دولار |
Items.*.ProductCode |
string |
رمز المنتج أو رقم المنتج أو SKU المرتبط ببند معين | A123 |
Items.*.QuantityUnit |
string |
وحدة الكمية لكل عنصر | |
TaxDetails |
array |
||
TaxDetails.* |
object |
عنصر السطر المستخرج | 1 Surface Pro 6 999.00 دولار 999.00 دولار |
TaxDetails.*.Amount |
currency |
مبلغ تفاصيل الضريبة | 999.00 دولار |
الإيصال.موقف السيارات
الحقل | نوع | الوصف | مثال |
---|---|---|---|
MerchantName |
string |
اسم التاجر الذي يصدر الإيصال | Contoso |
MerchantPhoneNumber |
phoneNumber |
رقم هاتف التاجر المدرج | 987-654-3210 |
MerchantAddress |
address |
عنوان التاجر المدرج | 123 شارع ريدموند الرئيسي، واشنطن 98052 |
Total |
number |
إجمالي العملية الكاملة للإيصال | 14.34 دولار |
TransactionDate |
date |
تاريخ إصدار الإيصال | 06 يونيو 2019 |
TransactionTime |
time |
وقت إصدار الإيصال | 4:49 مساء |
Subtotal |
number |
الإجمالي الفرعي للإيصال، غالباً قبل تطبيق الضرائب | 12.34 دولار |
TotalTax |
number |
الضريبة على الاستلام، وغالبا ما تكون ضريبة المبيعات، أو ما يعادلها | 2.00 دولار |
Tip |
number |
تلميح مضمن من المشتري | 1.00 دولار |
Items |
array |
||
Items.* |
object |
عنصر السطر المستخرج | 1 Surface Pro 6 999.00 دولار 999.00 دولار |
Items.*.TotalPrice |
number |
السعر الإجمالي لعنصر الخط | 999.00 دولار |
Items.*.Description |
string |
وصف الصنف | Surface Pro 6 |
Items.*.Quantity |
number |
كمية كل عنصر على حدة | 1 |
Items.*.Price |
number |
السعر الفردي لكل وحدة عنصر على حدة | 999.00 دولار |
Items.*.ProductCode |
string |
رمز المنتج أو رقم المنتج أو SKU المرتبط ببند معين | A123 |
Items.*.QuantityUnit |
string |
وحدة الكمية لكل عنصر | |
TaxDetails |
array |
||
TaxDetails.* |
object |
عنصر السطر المستخرج | 1 Surface Pro 6 999.00 دولار 999.00 دولار |
TaxDetails.*.Amount |
currency |
مبلغ تفاصيل الضريبة | 999.00 دولار |
receipt.hotel
الحقل | نوع | الوصف | مثال |
---|---|---|---|
MerchantName |
string |
اسم التاجر الذي يصدر الإيصال | Contoso |
MerchantPhoneNumber |
phoneNumber |
رقم هاتف التاجر المدرج | 987-654-310 |
MerchantAddress |
address |
عنوان التاجر المدرج | 123 شارع ريدموند الرئيسي، واشنطن 98052 |
Total |
number |
إجمالي العملية الكاملة للإيصال | 14.34 دولار |
ArrivalDate |
date |
تاريخ الوصول | 27Mar21 |
DepartureDate |
date |
تاريخ المغادرة | 28Mar21 |
Currency |
string |
وحدة العملة لمبالغ الإيصال (ISO 4217)، أو "MIXED" إذا تم العثور على قيم متعددة | دولار أمريكي |
MerchantAliases |
array |
||
MerchantAliases.* |
string |
الاسم البديل للتاجر | Contoso (R) |
Items |
array |
||
Items.* |
object |
عنصر السطر المستخرج | 1 Surface Pro 6 999.00 دولار 999.00 دولار |
Items.*.TotalPrice |
number |
السعر الإجمالي لعنصر الخط | 999.00 دولار |
Items.*.Description |
string |
وصف الصنف | رسوم الغرفة |
Items.*.Date |
date |
تاريخ العنصر | 27Mar21 |
Items.*.Category |
string |
فئة العنصر | غرفة |
دليل الترحيل وواجهة برمجة تطبيقات REST الإصدار 3.1
- اتبع دليل ترحيل Document Intelligence v3.1 لمعرفة كيفية استخدام إصدار v3.1 في التطبيقات وسير العمل.
الخطوات التالية
حاول معالجة النماذج والمستندات الخاصة بك باستخدام Document Intelligence Studio.
أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.
الملاحظات
https://aka.ms/ContentUserFeedback.
قريبًا: خلال عام 2024، سنتخلص تدريجيًا من GitHub Issues بوصفها آلية إرسال ملاحظات للمحتوى ونستبدلها بنظام ملاحظات جديد. لمزيد من المعلومات، راجعإرسال الملاحظات وعرضها المتعلقة بـ