نموذج التصنيف المخصص لذكاء المستند

هام

  • توفر إصدارات المعاينة العامة ل Document Intelligence وصولا مبكرا إلى الميزات قيد التطوير النشط.
  • قد تتغير الميزات والنهج والعمليات، قبل التوفر العام (GA)، استنادا إلى ملاحظات المستخدم.
  • إصدار المعاينة العامة لمكتبات عميل Document Intelligence افتراضيا إلى إصدار REST API 2024-02-29-preview.
  • يتوفر إصدار المعاينة العامة 2024-02-29-preview حاليا فقط في مناطق Azure التالية:
  • شرق الولايات المتحدة
  • غرب الولايات المتحدة 2
  • غرب أوروبا

ينطبق هذا المحتوى على:علامهv4.0 (معاينة) | الإصدار السابق:علامة اختيار زرقاءv3.1 (GA)

ينطبق هذا المحتوى على:علامهv3.1 (GA) | أحدث إصدار:علامة اختيار أرجوانيةv4.0 (معاينة)

هام

  • لن يقوم 2024-02-29-preview API، نموذج التصنيف المخصص بتقسيم المستندات بشكل افتراضي أثناء عملية التحليل.
  • تحتاج إلى تعيين الخاصية splitMode بشكل صريح إلى تلقائي للحفاظ على السلوك من الإصدارات السابقة. الافتراضي لـsplitMode هو none.
  • إذا كان ملف الإدخال يحتوي على مستندات متعددة، فستحتاج إلى تمكين التقسيم عن طريق تعيين splitMode إلى auto.

Azure الذكاء الاصطناعي Document Intelligence هي خدمة Azure الذكاء الاصطناعي مستندة إلى السحابة تمكنك من إنشاء حلول ذكية لمعالجة المستندات. تحلل واجهات برمجة التطبيقات الخاصة بذكاء المستند الصور وملفات PDF وملفات المستندات الأخرى لاستخراج المحتوى والتخطيط والنمط والعناصر الدلالية المختلفة واكتشافها.

نماذج التصنيف المخصصة هي أنواع نماذج التعلم العميق التي تجمع بين ميزات التخطيط واللغة للكشف بدقة عن المستندات التي تعالجها داخل التطبيق الخاص بك وتحديدها. تقوم نماذج التصنيف المخصصة بتصنيف ملف إدخال صفحة واحدة في كل مرة لتحديد المستندات داخل ويمكنها أيضا تحديد مستندات متعددة أو مثيلات متعددة لمستند واحد داخل ملف إدخال.

إمكانات النموذج

إشعار

  • بدءا من 2024-02-29-preview واجهة برمجة التطبيقات، تدعم نماذج التصغير المخصصة التدريب المتزايد. يمكنك إضافة نماذج جديدة إلى الفئات الموجودة أو إضافة فئات جديدة عن طريق الرجوع إلى مصنف موجود.

يمكن لنماذج التصنيف المخصصة تحليل مستندات أحادية أو متعددة الملفات لتحديد ما إذا كان أي من أنواع المستندات المدربة مضمنا في ملف إدخال. فيما يلي السيناريوهات المدعومة حاليا:

  • ملف واحد يحتوي على مستند واحد. على سبيل المثال، نموذج طلب قرض.

  • ملف واحد يحتوي على مستندات متعددة. على سبيل المثال، حزمة طلب قرض تحتوي على نموذج طلب قرض و payslip و كشف حساب بنكي.

  • ملف واحد يحتوي على مثيلات متعددة لنفس المستند. على سبيل المثال، مجموعة من الفواتير الممسوحة ضوئيا.

✔️ يتطلب تدريب مصنف مخصص فئات مميزة على الأقل two والحد الأدنى من five عينات المستند لكل فئة. تحتوي استجابة النموذج على نطاقات الصفحات لكل فئة من فئات المستندات المحددة.

✔️ الحد الأقصى المسموح به لعدد الفئات هو 500. الحد الأقصى المسموح به لعدد نماذج المستندات لكل فئة هو 100.

يصنف النموذج كل صفحة من مستند الإدخال إلى إحدى الفئات في مجموعة البيانات المسماة. لتعيين حد التطبيق الخاص بك، استخدم درجة الثقة من الاستجابة.

تدريب تزايدي

باستخدام النماذج المخصصة، تحتاج إلى الحفاظ على الوصول إلى مجموعة بيانات التدريب لتحديث المصنف الخاص بك بنماذج جديدة لفئة موجودة، أو إضافة فئات جديدة. تدعم نماذج المصنف الآن التدريب المتزايد حيث يمكنك الرجوع إلى مصنف موجود وإلحاق نماذج جديدة لفئة موجودة أو إضافة فئات جديدة مع عينات. يتيح التدريب التزايدي السيناريوهات التي يمثل فيها استبقاء البيانات تحديا ويحتاج المصنف إلى التحديث ليتوافق مع احتياجات الأعمال المتغيرة. يتم دعم التدريب المتزايد مع النماذج المدربة مع إصدار 2024-02-29-preview واجهة برمجة التطبيقات والإصدارات الأحدث.

هام

يتم دعم التدريب المتزايد فقط مع النماذج المدربة بنفس إصدار واجهة برمجة التطبيقات. إذا كنت تحاول توسيع نموذج، فاستخدم إصدار واجهة برمجة التطبيقات الذي تم تدريب النموذج الأصلي عليه لتوسيع النموذج. يتم دعم التدريب المتزايد فقط مع إصدار واجهة برمجة التطبيقات 2024-02-29-preview أو أحدث.

يتطلب التدريب المتزايد توفير معرف النموذج الأصلي ك baseClassifierId. راجع التدريب المتزايد لمعرفة المزيد حول كيفية استخدام التدريب التزايدي.

دعم نوع مستند Office

يمكنك الآن تدريب المصنفات للتعرف على أنواع المستندات بتنسيقات مختلفة بما في ذلك PDF والصور وWord وPowerPoint وExcel. عند تجميع مجموعة بيانات التدريب الخاصة بك، يمكنك إضافة مستندات لأي من الأنواع المدعومة. لا يتطلب المصنف منك تسمية أنواع معينة بشكل صريح. كأفضل ممارسة، تأكد من أن مجموعة بيانات التدريب الخاصة بك تحتوي على عينة واحدة على الأقل من كل تنسيق لتحسين الدقة الإجمالية للنموذج.

مقارنة التصنيف المخصص والنماذج المركبة

يمكن لنموذج التصنيف المخصص استبدال نموذج مكون في بعض السيناريوهات ولكن هناك بعض الاختلافات التي يجب أن تكون على دراية بها:

الإمكانية عملية المصنف المخصص عملية النموذج المكون
تحليل مستند واحد من نوع غير معروف ينتمي إلى أحد الأنواع المدربة لمعالجة نموذج الاستخراج. ● يتطلب مكالمات متعددة.
● استدعاء نموذج التصنيف استنادا إلى فئة المستند. تسمح هذه الخطوة بإجراء فحص قائم على الثقة قبل استدعاء تحليل نموذج الاستخراج.
● استدعاء نموذج الاستخراج.
● يتطلب استدعاء واحد لنموذج مكون يحتوي على النموذج المقابل لنوع مستند الإدخال.
تحليل مستند واحد من نوع غير معروف ينتمي إلى عدة أنواع مدربة لمعالجة نموذج الاستخراج. ● يتطلب مكالمات متعددة.
● قم بإجراء استدعاء للمصنف الذي يتجاهل المستندات التي لا تطابق نوعا معينا للاستخراج.
● استدعاء نموذج الاستخراج.
● يتطلب استدعاء واحد لنموذج مكون. تحدد الخدمة نموذجا مخصصا داخل النموذج المكون بأعلى تطابق.
● لا يمكن لنموذج مكون تجاهل المستندات.
تحليل ملف يحتوي على مستندات متعددة من نوع معروف أو غير معروف ينتمي إلى أحد الأنواع المدربة على معالجة نموذج الاستخراج. ● يتطلب مكالمات متعددة.
● استدعاء نموذج الاستخراج لكل مستند معرف في ملف الإدخال.
● استدعاء نموذج الاستخراج.
● يتطلب استدعاء واحد لنموذج مكون.
● يستدعي النموذج المكون نموذج المكون مرة واحدة على المثيل الأول للمستند.
● يتم تجاهل المستندات المتبقية.

الدعم اللغوي

تدعم نماذج التصنيف حاليا مستندات اللغة الإنجليزية فقط.

ويمكن الآن تدريب نماذج التصنيف على وثائق بلغات مختلفة. راجع اللغات المعتمدة للحصول على قائمة كاملة.

متطلبات الإدخال

تنسيقات الملفات المعتمدة:

النموذج PDF الصوره:
jpeg/jpg، png، bmp، tiff، heif
Microsoft Office:
Word (docx) وExcel (xlxs) وPowerPoint (pptx)
قراءة
Layout ✔ (معاينة 2024-02-29، معاينة 2023-10-31، والإحدث)
مستند عام
منشأ مسبقًا
استخراج مخصص
تصنيف مخصص
  • للحصول على أفضل النتائج، قم بتوفير خمس صور واضحة أو عمليات فحص عالية الجودة لكل نوع مستند.

  • بالنسبة إلى PDF وTIFF، يمكن معالجة ما يصل إلى 2000 صفحة (مع اشتراك الطبقة المجانية، تتم معالجة أول صفحتين فقط).

  • حجم الملف لتحليل المستندات هو 500 ميغابايت للطبقة المدفوعة (S0) و4 ميغابايت للمستوى المجاني (F0).

  • يجب أن تتراوح أبعاد الصورة بين 50 × 50 بكسل و 10000 بكسل × 10000 بكسل.

  • إذا كانت ملفات PDF الخاصة بك مؤمنة بكلمة مرور، فيجب عليك إزالة القفل قبل الإرسال.

  • الحد الأدنى لارتفاع النص المراد استخراجه هو 12 بكسل لصورة 1024 × 768 بكسل. يتوافق هذا البعد مع نص نقطة تقريبا 8عند 150 نقطة في البوصة (DPI).

  • بالنسبة للتدريب على النموذج المخصص، الحد الأقصى لعدد صفحات بيانات التدريب هو 500 لنموذج القالب المخصص و50000 للنموذج العصبي المخصص.

  • لتدريب نموذج الاستخراج المخصص، يبلغ الحجم الإجمالي لبيانات التدريب 50 ميغابايت لنموذج القالب و1G-MB للنموذج العصبي.

  • بالنسبة لتدريب نموذج التصنيف المخصص، يبلغ الحجم الإجمالي لبيانات التدريب 1 غيغابايت بحد أقصى 10000 صفحة.

تقسيم المستند

عندما يكون لديك أكثر من مستند واحد في ملف، يمكن للمصنف تحديد أنواع المستندات المختلفة المضمنة في ملف الإدخال. تحتوي استجابة المصنف على نطاقات الصفحات لكل نوع من أنواع المستندات المحددة المضمنة في ملف. يمكن أن تتضمن هذه الاستجابة مثيلات متعددة من نفس نوع المستند.

تتضمن عملية التحليل الآن خاصية تمنحك تحكما دقيقا splitMode في سلوك التقسيم.

  • لمعالجة ملف الإدخال بأكمله كمستند واحد للتصنيف، قم بتعيين splitMode إلى none. عند القيام بذلك، تقوم الخدمة بإرجاع فئة واحدة فقط لملف الإدخال بأكمله.
  • لتصنيف كل صفحة من ملف الإدخال، قم بتعيين splitMode إلى perPage. تحاول الخدمة تصنيف كل صفحة كمستند فردي.
  • قم بتعيين splitMode إلى auto وتحدد الخدمة المستندات ونطاقات الصفحات المقترنة.

أفضل الممارسات

تتطلب نماذج التصنيف المخصصة ما لا يقل عن خمس عينات لكل فئة للتدريب. إذا كانت الفصول متشابهة، فإن إضافة نماذج تدريب إضافية يحسن دقة النموذج.

يحاول المصنف تعيين كل مستند إلى إحدى الفئات، إذا كنت تتوقع أن يرى النموذج أنواع المستندات غير الموجودة في الفئات التي تشكل جزءا من مجموعة بيانات التدريب، فيجب عليك التخطيط لتعيين حد على درجة التصنيف أو إضافة بعض العينات التمثيلية من أنواع المستندات إلى "other" فئة. "other" تضمن إضافة فئة عدم تأثير المستندات غير الضرورية على جودة المصنف.

تدريب نموذج

يتم دعم نماذج التصنيف المخصصة من قبل v4.0:2024-02-29-preview و v3.1:2023-07-31 (GA) APIs. يوفر Document Intelligence Studio واجهة مستخدم بدون تعليمات برمجية لتدريب مصنف مخصص بشكل تفاعلي. اتبع دليل كيفية البدء.

عند استخدام واجهة برمجة تطبيقات REST، إذا قمت بتنظيم مستنداتك حسب المجلدات، يمكنك استخدام azureBlobSource خاصية الطلب لتدريب نموذج تصنيف.


https://{endpoint}/documentintelligence/documentClassifiers:build?api-version=2024-02-29-preview

{
  "classifierId": "demo2.1",
  "description": "",
  "docTypes": {
    "car-maint": {
        "azureBlobSource": {
            "containerUrl": "SAS URL to container",
            "prefix": "sample1/car-maint/"
            }
    },
    "cc-auth": {
        "azureBlobSource": {
            "containerUrl": "SAS URL to container",
            "prefix": "sample1/cc-auth/"
            }
    },
    "deed-of-trust": {
        "azureBlobSource": {
            "containerUrl": "SAS URL to container",
            "prefix": "sample1/deed-of-trust/"
            }
    }
  }
}

https://{endpoint}/formrecognizer/documentClassifiers:build?api-version=2023-07-31

{
  "classifierId": "demo2.1",
  "description": "",
  "docTypes": {
    "car-maint": {
        "azureBlobSource": {
            "containerUrl": "SAS URL to container",
            "prefix": "{path to dataset root}/car-maint/"
            }
    },
    "cc-auth": {
        "azureBlobSource": {
            "containerUrl": "SAS URL to container",
            "prefix": "{path to dataset root}/cc-auth/"
            }
    },
    "deed-of-trust": {
        "azureBlobSource": {
            "containerUrl": "SAS URL to container",
            "prefix": "{path to dataset root}/deed-of-trust/"
            }
    }
  }
}

بدلا من ذلك، إذا كان لديك قائمة مسطحة من الملفات أو تخطط فقط لاستخدام عدد قليل من الملفات المحددة داخل كل مجلد لتدريب النموذج، يمكنك استخدام الخاصية azureBlobFileListSource لتدريب النموذج. تتطلب file listهذه الخطوة تنسيق خطوط JSON . لكل فئة، أضف ملفا جديدا مع قائمة بالملفات التي سيتم إرسالها للتدريب.

{
  "classifierId": "demo2",
  "description": "",
  "docTypes": {
    "car-maint": {
      "azureBlobFileListSource": {
        "containerUrl": "SAS URL to container",
        "fileList": "{path to dataset root}/car-maint.jsonl"
      }
    },
    "cc-auth": {
      "azureBlobFileListSource": {
        "containerUrl": "SAS URL to container",
        "fileList": "{path to dataset root}/cc-auth.jsonl"
      }
    },
    "deed-of-trust": {
      "azureBlobFileListSource": {
        "containerUrl": "SAS URL to container",
        "fileList": "{path to dataset root}/deed-of-trust.jsonl"
      }
    }
  }
}

على سبيل المثال، تحتوي قائمة car-maint.jsonl الملفات على الملفات التالية.

{"file":"classifier/car-maint/Commercial Motor Vehicle - Adatum.pdf"}
{"file":"classifier/car-maint/Commercial Motor Vehicle - Fincher.pdf"}
{"file":"classifier/car-maint/Commercial Motor Vehicle - Lamna.pdf"}
{"file":"classifier/car-maint/Commercial Motor Vehicle - Liberty.pdf"}
{"file":"classifier/car-maint/Commercial Motor Vehicle - Trey.pdf"}

استجابة النموذج

تحليل ملف إدخال باستخدام نموذج تصنيف المستند.

https://{endpoint}/documentintelligence/documentClassifiers/{classifier}:analyze?api-version=2024-02-29-preview
https://{service-endpoint}/formrecognizer/documentClassifiers/{classifier}:analyze?api-version=2023-07-31

تحتوي الاستجابة على المستندات المحددة مع نطاقات الصفحات المقترنة في قسم المستندات في الاستجابة.

{
  ...

    "documents": [
      {
        "docType": "formA",
        "boundingRegions": [
          { "pageNumber": 1, "polygon": [...] },
          { "pageNumber": 2, "polygon": [...] }
        ],
        "confidence": 0.97,
        "spans": []
      },
      {
        "docType": "formB",
        "boundingRegions": [
          { "pageNumber": 3, "polygon": [...] }
        ],
        "confidence": 0.97,
        "spans": []
      }, ...
    ]
  }

الخطوات التالية

تعلم كيفية إنشاء نماذج تصنيف مخصصة: