نموذج بطاقة عمل ذكاء المستند

هام

بدءا من Document Intelligence v4.0 (معاينة)، والمضي قدما، يتم إهمال نموذج بطاقة العمل (prebuilt-businessCard). لاستخراج البيانات من تنسيقات بطاقات العمل، استخدم ما يلي:

ميزة إصدار معرف النموذج
نموذج بطاقة العمل • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-businessCard

ينطبق هذا المحتوى على:علامهv3.1 (GA) | الإصدارات السابقة:علامة اختيار زرقاءv3.0علامة اختيار زرقاءv2.1

ينطبق هذا المحتوى على:علامهv3.0 (GA) | أحدث الإصدارات:علامة اختيار أرجوانيةv4.0 (معاينة)علامة اختيار أرجوانيةv3.1 | الإصدار السابق:علامة اختيار زرقاءv2.1

ينطبق هذا المحتوى على:علامهv2.1 | أحدث إصدار:علامة اختيار زرقاءv4.0 (معاينة)

يجمع نموذج بطاقة عمل Document Intelligence بين قدرات التعرف البصري على الحروف (OCR) القوية ونماذج التعلم العميق لتحليل البيانات واستخراجها من صور بطاقة العمل. تحلل واجهة برمجة التطبيقات بطاقات العمل المطبوعة؛ وتستخرج المعلومات الرئيسية مثل: الاسم الأول، واسم العائلة، واسم الشركة، وعنوان البريد الإلكتروني، ورقم الهاتف؛ وترجع تمثيل بيانات "JavaScript Object Notation" مهيكل.

استخراج بيانات بطاقة العمل

بطاقات العمل هي طريقة رائعة لتمثيل الأعمال التجارية أو المهنية. يساعد شعار الشركة والخطوط وصور الخلفية الموجودة في بطاقات العمل في الترويج للعلامة التجارية للشركة وتمييزها عن غيرها. يعد تطبيق تقنيات التعرف البصري على الحروف والتعلم الآلي لأتمتة مسح بطاقات العمل سيناريو شائعا لمعالجة الصور. عادة ما يكون لدى أنظمة المؤسسات المستخدمة من قبل فرق المبيعات والتسويق تكامل إمكانية استخراج بيانات بطاقة العمل لصالح مستخدميها.

نموذج بطاقة عمل تمت معالجتها باستخدام Document Intelligence Studio

لقطة شاشة لبطاقة عمل نموذجية تم تحليلها في Document Intelligence Studio.

نموذج الأعمال التي تمت معالجتها باستخدام أداة تسمية نموذج ذكاء المستند

لقطة شاشة لبطاقة عمل نموذجية تم تحليلها باستخدام أداة تسمية نموذج ذكاء المستند.

خيارات التطوير

يدعم Document Intelligence v3.1:2023-07-31 (GA) الأدوات والتطبيقات والمكتبات التالية:

ميزة الموارد معرف النموذج
نموذج بطاقة العمل Document Intelligence Studio
واجهة برمجة تطبيقات REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

يدعم Document Intelligence v3.0:2022-08-31 (GA) الأدوات والتطبيقات والمكتبات التالية:

ميزة الموارد معرف النموذج
نموذج بطاقة العمل Document Intelligence Studio
واجهة برمجة تطبيقات REST
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

يدعم Document Intelligence v2.1 (GA) الأدوات والتطبيقات والمكتبات التالية:

ميزة الموارد
نموذج بطاقة العمل أداة تسمية ذكاء المستند
واجهة برمجة تطبيقات REST
مكتبة العميل SDK
حاوية Docker للاستخبارات المستند

تجربة استخراج بيانات بطاقة العمل

تعرف على كيفية استخراج البيانات، بما في ذلك الاسم والمسمى الوظيفي والعنوان والبريد الإلكتروني واسم الشركة، من بطاقات العمل. تحتاج إلى الموارد التالية:

  • اشتراك Azure - يمكنك إنشاء اشتراك مجانًا.

  • مثيل Document Intelligence في مدخل Microsoft Azure. يمكنك استخدام طبقة التسعير المجانيةF0 () لتجربة الخدمة. بعد نشر المورد، حدد انتقال إلى المورد للحصول على المفتاح ونقطة النهاية.

لقطة شاشة للمفاتيح وموقع نقطة النهاية في مدخل Microsoft Azure.

Document Intelligence Studio

إشعار

يتوفر Document Intelligence Studio مع واجهات برمجة التطبيقات v3.1 وv3.0.

  1. في الصفحة الرئيسية ل Document Intelligence Studio، حدد بطاقات العمل.

  2. يمكنك تحليل نموذج بطاقة العمل أو تحميل ملفاتك الخاصة.

  3. حدد الزر Run analysis، وإذا لزم الأمر، قم بتكوين خيارات Analyze :

    لقطة شاشة لأزرار خيارات تحليل التشغيل والتحليل في Document Intelligence Studio.

أداة تسمية نموذج تحليل معلومات المستند

  1. انتقل إلى Document Intelligence Sample Tool.

  2. في الصفحة الرئيسية لأداة العينة، حدد لوحة استخدام النموذج الذي تم إنشاؤه مسبقا للحصول على البيانات .

    لقطة شاشة لنموذج التخطيط لتحليل عملية النتائج.

  3. حدد نوع النموذج لتحليله من القائمة المنسدلة.

  4. اختر عنوان URL للملف الذي ترغب في تحليله من الخيارات التالية:

  5. في مجال المصدر، حدد URL من القائمة المنسدلة، والصق عنوان URL المحدد، وحدد الزر إحضار.

    لقطة شاشة للقائمة المنسدلة لموقع المصدر.

  6. في حقل نقطة نهاية خدمة Document Intelligence، الصق نقطة النهاية التي حصلت عليها باستخدام اشتراك Document Intelligence.

  7. في حقل المفتاح ، الصق المفتاح الذي حصلت عليه من مورد Document Intelligence.

    لقطة شاشة للقائمة المنسدلة select-form-type.

  8. حدد تشغيل التحليل. تستدعي أداة تسمية نموذج تحليل معلومات المستند واجهة برمجة التطبيقات التي تم إنشاؤها مسبقا وتحليل المستند.

  9. عرض النتائج - راجع أزواج القيم الرئيسية المستخرجة، وعناصر السطر، والنص المميز المستخرج، والجداول التي تم اكتشافها.

    لقطة شاشة لنموذج بطاقة العمل لتحليل عملية النتائج.

إشعار

لا تدعم أداة Sample Labeling تنسيق ملف BMP. هذا قيد على الأداة وليس خدمة معلومات المستند.

متطلبات الإدخال

  • للحصول على أفضل النتائج، قم بتوفير صورة واحدة واضحة أو مسح ضوئي عالي الجودة لكل مستند.

  • تنسيقات الملفات المعتمدة:

    النموذج PDF الصورة:
    JPEG/JPG، PNG، BMP، TIFF، HEIF
    Microsoft Office:
    Word (DOCX) وExcel (XLSX) وPowerPoint (PPTX) وHTML
    قراءة
    Layout ✔ (معاينة 2024-02-29، 2023-10-31-preview)
    مستند عام
    منشأ مسبقًا
    استخراج مخصص
    تصنيف مخصص ✔ (2024-02-29-preview)
  • بالنسبة لملفات PDF وTIFF، يمكن معالجة ما يصل إلى 2000 صفحة (بالنسببة للاشتراك المجاني، تتم معالجة أول صفحتين فقط).

  • حجم الملف لتحليل المستندات هو 500 ميغابايت للطبقة المدفوعة (S0) و4 ميغابايت للمستوى المجاني (F0).

  • يجب أن تتراوح أبعاد الصورة بين 50 × 50 بكسل و 10000 بكسل × 10000 بكسل.

  • إذا كانت ملفات PDF الخاصة بك مؤمنة بكلمة مرور، فيجب عليك إزالة القفل قبل الإرسال.

  • الحد الأدنى لارتفاع النص المراد استخراجه هو 12 بكسل لصورة 1024 × 768 بكسل. يتوافق هذا البعد مع نص نقطة تقريبا 8عند 150 نقطة لكل بوصة (DPI).

  • بالنسبة للتدريب على النموذج المخصص، الحد الأقصى لعدد صفحات بيانات التدريب هو 500 لنموذج القالب المخصص و50000 للنموذج العصبي المخصص.

    • لتدريب نموذج الاستخراج المخصص، يبلغ الحجم الإجمالي لبيانات التدريب 50 ميغابايت لنموذج القالب و1G-MB للنموذج العصبي.

    • بالنسبة لتدريب نموذج التصنيف المخصص، يكون الحجم الإجمالي لبيانات 1GB التدريب بحد أقصى 10000 صفحة.

  • تنسيقات الملفات المدعومة: JPEG وPNG وPDF وTIFF
  • بالنسبة إلى PDF وTIFF، تتم معالجة ما يصل إلى 2000 صفحة. لمشتركي المستوى المجاني، تتم معالجة أول صفحتين فقط.
  • يجب أن يكون حجم الملف أقل من 50 ميغابايت وأبعاد 50 × 50 بكسل على الأقل و10000 × 10000 بكسل على الأكثر.

اللغات والإعدادات المحلية المدعومة

راجع صفحة دعم اللغة للحصول على قائمة كاملة باللغات المدعومة.

عمليات استخراج الحقل

Name كتابة ‏‏الوصف الإخراج القياسي
أسماء جهات الاتصال مصفوفة الكائنات اسم جهة الاتصال
FirstName السلسلة‬ الاسم الأول (المحدد) لجهة الاتصال
LastName السلسلة‬ الاسم الأخير (العائلة) لجهة الاتصال
أسماء الشركات مصفوفة السلاسل اسم (أسماء) الشركة
الأقسام مصفوفة السلاسل قسم (أقسام) أو مؤسسة (مؤسسات) جهة الاتصال
عناوين الوظيفة مصفوفة السلاسل المسمى الوظيفي (المسميات الوظيفية) المدرج لجهة الاتصال
الرسائل الإلكترونية مصفوفة السلاسل عنوان (عناوين) البريد الإلكتروني لجهة الاتصال
مواقع ويب مصفوفة السلاسل موقع (مواقع) الشركة
العناوين مصفوفة السلاسل العنوان (العناوين) المستخرجة من بطاقة العمل
أرقام الهاتف المحمول صفيف أرقام الهواتف رقم (أرقام) الهاتف الجوال من بطاقة العمل +1 xxx xxx xxxx
الفاكسات صفيف أرقام الهواتف رقم (أرقام) هاتف الفاكس من بطاقة العمل +1 xxx xxx xxxx
أرقام هاتف العمل صفيف أرقام الهواتف رقم (أرقام) هاتف العمل من بطاقة العمل +1 xxx xxx xxxx
أرقام هواتف أخرى صفيف أرقام الهواتف رقم (أرقام) هاتف آخر من بطاقة العمل +1 xxx xxx xxxx

الحقول المستخرجة

Name كتابة الوصف نص
أسماء جهات الاتصال صفيف من الكائنات اسم جهة الاتصال المستخرج من بطاقة العمل [{ "FirstName": "John", "LastName": "Doe" }]
FirstName سلسلة الاسم الأول (المحدد) لجهة الاتصال "جون"
LastName سلسلة الاسم الأخير (العائلة) لجهة الاتصال "Doe"
أسماء الشركات صفيف سلاسل اسم الشركة المستخرج من بطاقة العمل ["Contoso"]
الأقسام صفيف سلاسل إدارة جهات الاتصال أو تنظيمها ["R&D"]
عناوين الوظيفة صفيف سلاسل المسمى الوظيفي المدرج لجهة الاتصال ["مهندس البرمجيات"]
الرسائل الإلكترونية صفيف سلاسل البريد الإلكتروني لجهة الاتصال المستخرج من بطاقة العمل [""johndoe@contoso.com]
مواقع ويب صفيف سلاسل موقع ويب مستخرج من بطاقة العمل ["https://www.contoso.com"]
العناوين صفيف سلاسل العنوان المستخرج من بطاقة العمل ["123 الشارع الرئيسي، ريدموند، WA 98052"]
أرقام الهاتف المحمول صفيف من أرقام الهواتف رقم الهاتف الجوال المستخرج من بطاقة العمل ["+19876543210"]
الفاكسات صفيف من أرقام الهواتف رقم هاتف الفاكس المستخرج من بطاقة العمل ["+19876543211"]
أرقام هاتف العمل صفيف من أرقام الهواتف رقم هاتف العمل المستخرج من بطاقة العمل ["+19876543231"]
أرقام هواتف أخرى صفيف من أرقام الهواتف رقم هاتف آخر تم استخراجه من بطاقة العمل ["+19876543233"]

لغة معتمدة

تدعم بطاقات العمل التي تم إنشاؤها مسبقا v2.1 الإعدادات المحلية التالية:

  • en-us
  • en-au
  • en-ca
  • en-gb
  • تسجيل الدخول

دليل الترحيل وواجهة برمجة تطبيقات REST الإصدار 3.1

  • اتبع دليل ترحيل Document Intelligence v3.1 لمعرفة كيفية استخدام إصدار v3.0 في التطبيقات وسير العمل.

الخطوات التالية

  • حاول معالجة النماذج والمستندات الخاصة بك باستخدام Document Intelligence Studio

  • أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.

  • حاول معالجة النماذج والمستندات الخاصة بك باستخدام أداة تسمية نموذج ذكاء المستند

  • أكمل التشغيل السريع ل Document Intelligence وابدأ في إنشاء تطبيق لمعالجة المستندات بلغة التطوير التي تختارها.