إمكانات الوظيفة الإضافية "تحليل معلومات المستند"

هام

  • توفر إصدارات المعاينة العامة ل Document Intelligence وصولا مبكرا إلى الميزات قيد التطوير النشط.
  • قد تتغير الميزات والنهج والعمليات، قبل التوفر العام (GA)، استنادا إلى ملاحظات المستخدم.
  • إصدار المعاينة العامة لمكتبات عميل Document Intelligence افتراضيا إلى إصدار REST API 2024-02-29-preview.
  • يتوفر إصدار المعاينة العامة 2024-02-29-preview حاليا فقط في مناطق Azure التالية:
  • شرق الولايات المتحدة
  • غرب الولايات المتحدة 2
  • غرب أوروبا

ينطبق هذا المحتوى على:علامهv4.0 (معاينة) | الإصدارات السابقة:علامة اختيار زرقاءv3.1 (GA)

ينطبق هذا المحتوى على:علامهv3.1 (GA) | أحدث إصدار:علامة اختيار أرجوانيةv4.0 (معاينة)

إشعار

تتوفر قدرات الوظيفة الإضافية داخل جميع النماذج باستثناء نموذج بطاقة العمل.

يدعم Document Intelligence قدرات تحليل أكثر تعقيدا ونمطية. استخدم ميزات الوظيفة الإضافية لتوسيع النتائج لتضمين المزيد من الميزات المستخرجة من مستنداتك. تتحمل بعض ميزات الوظيفة الإضافية تكلفة إضافية. يمكن تمكين هذه الميزات الاختيارية وتعطيلها استنادا إلى سيناريو استخراج المستند. لتمكين ميزة، أضف اسم الميزة المقترنة features إلى خاصية سلسلة الاستعلام. يمكنك تمكين أكثر من ميزة إضافية واحدة على طلب من خلال توفير قائمة ميزات مفصولة بفواصل. تتوفر إمكانيات الوظيفة الإضافية التالية للإصدارات 2023-07-31 (GA) اللاحقة.

إشعار

لا تدعم جميع النماذج جميع قدرات الوظائف الإضافية. لمزيد من المعلومات، راجعاستخراج بيانات النموذج.

تتوفر إمكانات الوظيفة الإضافية التالية للإصدارات2024-02-29-preview2024-02-29-preview اللاحقة و و:

إشعار

يختلف تنفيذ حقول الاستعلام في واجهة برمجة التطبيقات 2023-10-30-preview عن إصدار المعاينة الأخير. والتنفيذ الجديد أقل تكلفة ويعمل بشكل جيد مع الوثائق المنظمة.

إمكانية الوظيفة الإضافية وظيفة إضافية/مجانية معاينة 2024-02-29 2023-07-31 (GA) 2022-08-31 (GA) الإصدار 2.1 (GA)
استخراج خاصية الخط الوظيفة الإضافية ✔️ ✔️ غير متوفر غير متوفر
استخراج الصيغة الوظيفة الإضافية ✔️ ✔️ غير متوفر غير متوفر
استخراج عالي الدقة الوظيفة الإضافية ✔️ ✔️ غير متوفر غير متوفر
استخراج الرمز الشريطي مجاني ✔️ ✔️ غير متوفر غير متوفر
اكتشاف اللغات مجاني ✔️ ✔️ غير متوفر غير متوفر
أزواج القيمة الرئيسية مجاني ✔️ غير متوفر غير متوفر غير متوفر
حقول الاستعلام الوظيفة الإضافية* ✔️ غير متوفر غير متوفر غير متوفر

الوظيفة الإضافية* - يتم تسعير حقول الاستعلام بشكل مختلف عن ميزات الوظيفة الإضافية الأخرى. للحصول على تفاصيل؛ تأكد من مراجعة الأسعار.

استخراج عالي الدقة

تمثل مهمة التعرف على النص الصغير من مستندات كبيرة الحجم، مثل الرسومات الهندسية، تحديا. غالبا ما يكون النص مختلطا بعناصر رسومية أخرى ويحتوي على خطوط وأحجام واتجاهات مختلفة. علاوة على ذلك، يمكن تقسيم النص إلى أجزاء منفصلة أو توصيله بالرموز الأخرى. يدعم Document Intelligence الآن استخراج المحتوى من هذه الأنواع من المستندات بالقدرة ocr.highResolution . يمكنك الحصول على جودة محسنة لاستخراج المحتوى من مستندات A1/A2/A3 عن طريق تمكين إمكانية الوظيفة الإضافية هذه.

واجهة برمجة تطبيقات REST

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=ocrHighResolution
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=ocrHighResolution

استخراج الصيغة

تستخرج ocr.formula القدرة كافة الصيغ المحددة، مثل المعادلات الرياضية، في formulas المجموعة ككائن المستوى الأعلى ضمن content. داخل content، يتم تمثيل الصيغ المكتشفة ك :formula:. يمثل كل إدخال في هذه المجموعة صيغة تتضمن نوع الصيغة ك inline أو display، وتمثيل LaTeX الخاص بها جنبا value إلى جنب مع إحداثياتها polygon . في البداية، تظهر الصيغ في نهاية كل صفحة.

إشعار

confidence النتيجة مضمنة.

"content": ":formula:",
  "pages": [
    {
      "pageNumber": 1,
      "formulas": [
        {
          "kind": "inline",
          "value": "\\frac { \\partial a } { \\partial b }",
          "polygon": [...],
          "span": {...},
          "confidence": 0.99
        },
        {
          "kind": "display",
          "value": "y = a \\times b + a \\times c",
          "polygon": [...],
          "span": {...},
          "confidence": 0.99
        }
      ]
    }
  ]

واجهة برمجة تطبيقات REST

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=formulas
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=formulas

استخراج خاصية الخط

تستخرج ocr.font الإمكانية كافة خصائص الخط للنص المستخرج في styles المجموعة ككائن من المستوى الأعلى ضمن content. يحدد كل كائن نمط خاصية خط واحد، والنص الذي ينطبق عليه، ودرجة الثقة المقابلة له. يتم توسيع خاصية النمط الموجودة مع المزيد من خصائص الخط مثل similarFontFamily خط النص، fontStyle للأنماط مثل المائل والعادي، fontWeight للغامق أو العادي، color ولون النص، ولون backgroundColor مربع إحاطة النص.

"content": "Foo bar",
"styles": [
    {
      "similarFontFamily": "Arial, sans-serif",
      "spans": [ { "offset": 0, "length": 3 } ],
      "confidence": 0.98
    },
    {
      "similarFontFamily": "Times New Roman, serif",
      "spans": [ { "offset": 4, "length": 3 } ],
      "confidence": 0.98
    },
    {
      "fontStyle": "italic",
      "spans": [ { "offset": 1, "length": 2 } ],
      "confidence": 0.98
    },
    {
      "fontWeight": "bold",
      "spans": [ { "offset": 2, "length": 3 } ],
      "confidence": 0.98
    },
    {
      "color": "#FF0000",
      "spans": [ { "offset": 4, "length": 2 } ],
      "confidence": 0.98
    },
    {
      "backgroundColor": "#00FF00",
      "spans": [ { "offset": 5, "length": 2 } ],
      "confidence": 0.98
    }
  ]

واجهة برمجة تطبيقات REST

  {your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=styleFont
  {your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=styleFont

استخراج خاصية الرمز الشريطي

تستخرج ocr.barcode القدرة جميع الرموز الشريطية المحددة في barcodes المجموعة ككائن المستوى الأعلى ضمن content. contentداخل ، يتم تمثيل الرموز الشريطية المكتشفة ك :barcode:. يمثل كل إدخال في هذه المجموعة رمزا شريطيا ويتضمن نوع الرمز الشريطي ك kind ومحتوى الرمز الشريطي المضمن جنبا value إلى جنب مع إحداثياته polygon . في البداية، تظهر الرموز الشريطية في نهاية كل صفحة. هو confidence تعليمات برمجية مضمنة ل ك 1.

أنواع الرموز الشريطية المدعومة

نوع الرمز الشريطي مثال
QR Code لقطة شاشة لرمز الاستجابة السريعة.
Code 39 لقطة شاشة للتعليمة البرمجية 39.
Code 93 لقطة شاشة للتعليمة البرمجية 93.
Code 128 لقطة شاشة للتعليمة البرمجية 128.
UPC (UPC-A & UPC-E) لقطة شاشة ل UPC.
PDF417 لقطة شاشة ل PDF417.
EAN-8 لقطة شاشة للرمز الشريطي European-article-number ean-8.
EAN-13 لقطة شاشة للرمز الشريطي ean-13 للمقالة الأوروبية.
Codabar لقطة شاشة ل Codabar.
Databar لقطة شاشة لشريط البيانات.
Databar توسيع لقطة شاشة لشريط البيانات موسع.
ITF لقطة شاشة للرمز الشريطي interleaved-two-of-5 (ITF).
Data Matrix لقطة شاشة لمصفوفة البيانات.

واجهة برمجة تطبيقات REST

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=barcodes
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=barcodes

اكتشاف اللغات

تؤدي إضافة الميزة languages إلى الطلب إلى analyzeResult توقع اللغة الأساسية المكتشفة لكل سطر نص مع confidence في languages المجموعة ضمن analyzeResult.

"languages": [
    {
        "spans": [
            {
                "offset": 0,
                "length": 131
            }
        ],
        "locale": "en",
        "confidence": 0.7
    },
]

واجهة برمجة تطبيقات REST

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=languages
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=languages

أزواج قيم المفاتيح

في إصدارات واجهة برمجة التطبيقات السابقة، استخرج نموذج المستند الذي تم إنشاؤه مسبقا أزواج قيم المفاتيح من النماذج والمستندات. مع إضافة الميزة keyValuePairs إلى تخطيط مسبق الإنشاء، ينتج الآن نموذج التخطيط نفس النتائج.

أزواج قيم المفتاح هي امتدادات محددة داخل المستند تحدد التسمية أو المفتاح والاستجابة أو القيمة المرتبطة به. في شكل منظم، يمكن أن تكون هذه الأزواج هي التسمية والقيمة التي أدخلها المستخدم لهذا الحقل. في مستند غير منظم، يمكن أن يكون هذا هو التاريخ الذي تم فيه تنفيذ العقد بناءً على النص الموجود في فقرة. يتم تدريب نموذج الذكاء الاصطناعي على استخراج مفاتيح وقيم قابلة للتعريف استنادًا إلى مجموعة متنوعة من أنواع المستندات والتنسيقات والهياكل.

يمكن أيضًا أن توجد المفاتيح بشكل منفصل عندما يكتشف النموذج وجود مفتاح، بدون قيمة مرتبطة أو عند معالجة الحقول الاختيارية. على سبيل المثال، يمكن ترك حقل الاسم الأوسط فارغا في نموذج في بعض الحالات. تكون أزواج قيم المفاتيح عبارة عن امتداد للنص الموجود في المستند. بالنسبة للمستندات التي يتم وصف نفس القيمة فيها بطرق مختلفة، على سبيل المثال، العميل/المستخدم، يكون المفتاح المقترن إما عميلا أو مستخدما (استنادا إلى السياق).

واجهة برمجة تطبيقات REST

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=keyValuePairs

حقول الاستعلام

حقول الاستعلام هي إمكانية إضافية لتوسيع المخطط المستخرج من أي نموذج تم إنشاؤه مسبقا أو تحديد اسم مفتاح معين عندما يكون اسم المفتاح متغيرا. لاستخدام حقول الاستعلام، قم بتعيين الميزات إلى queryFields وتوفير قائمة مفصولة بفواصل بأسماء الحقول في الخاصية queryFields .

  • يدعم Document Intelligence الآن عمليات استخراج حقل الاستعلام. باستخدام استخراج حقل الاستعلام، يمكنك إضافة حقول إلى عملية الاستخراج باستخدام طلب استعلام دون الحاجة إلى تدريب إضافي.

  • استخدم حقول الاستعلام عندما تحتاج إلى توسيع مخطط نموذج تم إنشاؤه مسبقا أو مخصص أو تحتاج إلى استخراج بعض الحقول باستخدام إخراج التخطيط.

  • حقول الاستعلام هي إمكانية إضافية متميزة. للحصول على أفضل النتائج، حدد الحقول التي تريد استخراجها باستخدام حالة الجمل أو أسماء حقول حالة باسكال لأسماء الحقول متعددة الكلمات.

  • تدعم حقول الاستعلام 20 حقلا كحد أقصى لكل طلب. إذا احتوى المستند على قيمة للحقل، فسيتم إرجاع الحقل والقيمة.

  • يحتوي هذا الإصدار على تنفيذ جديد لقدرة حقول الاستعلام التي يتم تسعيرها أقل من التنفيذ السابق ويجب التحقق من صحتها.

إشعار

يتوفر استخراج حقل استعلام Document Intelligence Studio حاليا مع واجهة برمجة تطبيقات التخطيط والنماذج 2024-02-29-preview2023-10-31-preview التي تم إنشاؤها مسبقا والإصدارات الأحدث باستثناء US tax النماذج (نماذج W2 و1098s و1099s).

استخراج حقل الاستعلام

لاستخراج حقل الاستعلام، حدد الحقول التي تريد استخراجها وتحلل ذكاء المستند المستند وفقا لذلك. إليك مثال:

  • إذا كنت تعالج عقدا في Document Intelligence Studio، فاستخدم 2024-02-29-preview الإصدارين أو 2023-10-31-preview :

    لقطة شاشة لزر حقول الاستعلام في Document Intelligence Studio.

  • يمكنك تمرير قائمة تسميات الحقول مثل Party1و PaymentTermsTermsOfUsePaymentDateParty2TermEndDate كجزء من analyze document الطلب.

    لقطة شاشة لنافذة تحديد حقول الاستعلام في Document Intelligence Studio.

  • يمكن ل Document Intelligence تحليل بيانات الحقل واستخراجها وإرجاع القيم في إخراج JSON منظم.

  • بالإضافة إلى حقول الاستعلام، تتضمن الاستجابة النص والجداول وعلامات التحديد والبيانات الأخرى ذات الصلة.

واجهة برمجة تطبيقات REST

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=queryFields&queryFields=TERMS

الخطوات التالية

تعرف على المزيد: قراءة نموذج تخطيط النموذج

عينات SDK: python