نماذج مخصصة من Document Intelligence

ينطبق هذا المحتوى على:checkmarkv4.0 (GA) | الإصدارات السابقة:blue-checkmarkv3.1 (GA)blue-checkmarkv3.0 (GA)blue-checkmarkv2.1 (GA)

::: نهاية اللقب

ينطبق هذا المحتوى على:checkmarkv3.1 (GA) | أحدث إصدار:أرجواني-علامة اختيارv4.0 (GA) | الإصدارات السابقة:blue-checkmarkv3.0blue-checkmarkv2.1

ينطبق هذا المحتوى على:checkmarkv3.0 (GA) | أحدث الإصدارات:أرجوانية-checkmarkv4.0 (GA)أرجوانية-checkmarkv3.1 | الإصدار السابق:blue-checkmarkv2.1

ينطبق هذا المحتوى على:checkmarkv2.1 | أحدث إصدار:blue-checkmarkv4.0 (GA)

هام

تضيف عملية v4.0 2024-11-30 (GA) model compose مصنفا مدربا صراحة بدلا من مصنف ضمني للتحليل. لإصدار النموذج المؤلف السابق، انظر نماذج مخصصة مركبة v3.1. إذا كنت تستخدم حاليا نماذج مركبة، فكر في الترقية إلى أحدث تطبيق.

ما هو النموذج المؤلف؟

مع النماذج المركبة، يمكنك تجميع عدة نماذج مخصصة في نموذج مركب يسمى بمعرف نموذج واحد. على سبيل المثال، قد يتضمن النموذج المكون نماذج مخصصة مدربة لتحليل أوامر شراء الإمدادات والمعدات والأثاث. بدلا من محاولة تحديد النموذج المناسب يدويا، يمكنك استخدام نموذج مكون لتحديد النموذج المخصص المناسب لكل تحليل واستخراج.

بعض السيناريوهات تتطلب تصنيف المستند أولا ثم تحليل المستند باستخدام النموذج الأنسب لاستخراج الحقول من النموذج. قد تشمل هذه السيناريوهات حالات يقوم فيها المستخدم برفع مستند لكن نوع المستند غير معروف صراحة. سيناريو آخر هو عندما يتم مسح عدة مستندات معا في ملف واحد ويتم تقديم الملف للمعالجة. بعد ذلك، يحتاج تطبيقك إلى تحديد المستندات المكونة واختيار أفضل نموذج لكل مستند.

في الإصدارات السابقة، كانت العملية model compose تجري تصنيفا ضمنيا لتحديد أي نموذج مخصص يمثل الوثيقة المقدمة بشكل أفضل. يستبدل تنفيذ model composeالعملية في 2024-11-30 (GA) التصنيف الضمني من الإصدارات السابقة بخطوة تصنيف صريحة ويضيف التوجيه الشرطي.

فوائد تشغيل تركيب النموذج الجديد

تتطلب العملية الجديدة model compose منك تدريب مصنف صريح وتوفر عدة فوائد.

  • تحسين مستمر تدريجي. يمكنك تحسين جودة المصنف باستمرار من خلال إضافة المزيد من العينات وتحسين التصنيف تدريجيا. هذا الضبط الدقيق يضمن توجيه مستنداتك دائما إلى النموذج الصحيح للاستخراج.

  • تحكم كامل في التوجيه. بإضافة التوجيه القائم على الثقة، توفر عتبة ثقة لنوع المستند واستجابة التصنيف.

  • تجاهل أنواع المستندات الخاصة بالمستندات أثناء العملية. اختارت التطبيقات السابقة للعملية model compose أفضل نموذج تحليل للاستخراج بناء على درجة الثقة حتى لو كانت أعلى درجات الثقة منخفضة نسبيا. من خلال توفير عتبة ثقة أو عدم تعيين نوع مستند معروف من التصنيف إلى نموذج الاستخلاص بشكل صريح، يمكنك تجاهل أنواع المستندات المحددة.

  • حلل عدة نسخ من نفس نوع المستند. عند اقترانها splitMode مع خيار المصنف، يمكن للعملية model compose اكتشاف عدة نسخ من نفس المستند في ملف وتقسيم الملف لمعالجة كل مستند بشكل مستقل. يتيح استخدام splitMode معالجة عدة نسخ من المستند في طلب واحد.

  • دعم الميزات الإضافية. يمكن أيضا تحديد ميزات إضافية مثل حقول الاستعلام أو الرموز الشريطية كجزء من معلمات نموذج التحليل.

  • تم توسيع الحد الأقصى المخصص للنموذج إلى 500. التطبيق الجديد model compose للعملية يسمح لك بتعيين ما يصل إلى 500 نموذج مخصص مدرب لنموذج مركب واحد.

كيفية استخدام تركيب النماذج

  • ابدأ بجمع عينات من جميع المستندات التي تحتاجها، بما في ذلك عينات تحتوي على معلومات يجب استخراجها أو تجاهلها.

  • درب المصنف عن طريق تنظيم المستندات في مجلدات حيث تكون أسماء المجلدات هي نوع المستند الذي تنوي استخدامه في تعريف النموذج المكون.

  • وأخيرا، درب نموذج استخراج لكل نوع من أنواع المستندات التي تنوي استخدامها.

  • بمجرد تدريب نماذج التصنيف والاستخراج، استخدم Document Intelligence Studio، مكتبات العملاء، أو واجهة برمجة تطبيقات REST لتكوين نماذج التصنيف والاستخراج في نموذج مركب.

استخدم المعامل splitMode للتحكم في سلوك تقسيم الملفات:

  • لا يوجد. يعامل الملف بأكمله كوثيقة واحدة.
  • لكل صفحة. كل صفحة في الملف تعامل كوثيقة منفصلة.
  • أوتو. يتم تقسيم الملف تلقائيا إلى مستندات.

الفوترة والتسعير

يتم تسمية النماذج المكونة بنفس الشكل مثل النماذج المخصصة الفردية. يعتمد التسعير على عدد الصفحات التي تم تحليلها بواسطة نموذج التحليل اللاحق. تعتمد الفوترة على سعر الاستخراج للصفحات التي يتم توجيهها إلى نموذج الاستخراج. مع إضافة التصنيف الصريح، تفرض رسوم على تصنيف جميع الصفحات في ملف الإدخال. لمزيد من المعلومات، راجع صفحة تسعير Document Intelligence.

استخدم عملية تركيب النموذج

  • ابدأ بإنشاء قائمة بجميع معرفات النماذج التي تريد تأليفها في نموذج واحد.

  • قم بتركيب النماذج في معرف نموذج واحد باستخدام مكتبات Studio أو REST API أو مكتبات العملاء.

  • استخدم معرف النموذج المكون لتحليل المستندات.

الفوترة

يتم تسمية النماذج المكونة بنفس الشكل مثل النماذج المخصصة الفردية. يعتمد التسعير على عدد الصفحات التي تم تحليلها. تعتمد الفوترة على سعر الاستخراج للصفحات التي يتم توجيهها إلى نموذج الاستخراج. لمزيد من المعلومات، راجع صفحة تسعير Document Intelligence.

  • لا يوجد تغيير في تسعير تحليل المستند باستخدام نموذج مخصص فردي أو نموذج مخصص مكتوب.

ميزات النماذج المكونة

  • Custom template ويمكن custom neural تركيب النماذج معا في نموذج مركب واحد عبر عدة إصدارات API متعددة.

  • تتضمن الاستجابة خاصية docType تشير إلى أي من النماذج المكونة تم استخدامها لتحليل المستند.

  • بالنسبة custom template للنماذج، يمكن إنشاء النموذج المركب باستخدام تنويعات من قالب مخصص أو أنواع أشكال مختلفة. تكون هذه العملية مفيدة عندما تنتمي النماذج الواردة إلى أحد عدة قوالب.

  • بالنسبة custom neural للنماذج، أفضل ممارسة هي إضافة جميع الاختلافات المختلفة لنوع مستند واحد في مجموعة بيانات تدريبية واحدة والتدريب على نموذج عصبي مخصص. تكون العملية model compose الأنسب للسيناريوهات التي يتم فيها تقديم مستندات من أنواع مختلفة للتحليل.

حدود النماذج المؤلفة

  • مع هذه model compose العملية، يمكنك تعيين ما يصل إلى 500 نموذج لمعرف نموذج واحد. إذا تجاوز عدد النماذج التي أريد تأليفها الحد الأعلى للنموذج المؤلف، يمكنك استخدام أحد هذه البدائل:

  • تحليل مستند باستخدام نماذج مركبة هو مطابق لتحليل مستند باستخدام نموذج واحد. Analyze Document تعطي docType النتيجة خاصية تشير إلى أي من نماذج المكونات اخترتها لتحليل المستند.

  • model compose هذه العملية متاحة حاليا فقط للنماذج المخصصة المدربة على الملصقات.

توافق النماذج المركب

نوع الطراز المخصص النماذج المدربة على الإصدارات 2.1 و2.0 قوالب مخصصة ونماذج عصبية v3.1 و v3.0 القوالب المخصصة والنماذج العصبية v4.0 2024-11-30 (GA)
نماذج مدربة على الإصدارين 2.1 و v2.0 غير معتمد غير معتمد غير معتمد
قوالب مخصصة ونماذج عصبية v3.0 و v3.1 غير معتمد Supported Supported
القوالب المخصصة والنماذج العصبية v4.0 غير معتمد Supported Supported
  • لتكوين نموذج مدرب باستخدام نسخة سابقة من واجهة برمجة التطبيقات (v2.1 أو قبل)، درب نموذجا باستخدام واجهة v3.0 باستخدام نفس مجموعة البيانات المسماة. تضمن هذه الإضافة إمكانية تركيب نموذج v2.1 مع نماذج أخرى.

  • مع النماذج المكونة باستخدام الإصدار 2.1 من واجهة برمجة التطبيقات لا تزال مدعومة، دون الحاجة إلى تحديثات.

خيارات التطوير

يدعم Document Intelligence الإصدار 4.0:2024-11-30 (GA) الأدوات والتطبيقات والمكتبات التالية:

الميزة Resources
النموذج المخصص Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK•
Python SDK
النموذج المركب Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK•
Python SDK

يدعم ذكاء المستندات v3.1:2023-07-31 (GA) الأدوات والتطبيقات والمكتبات التالية:

الميزة Resources
النموذج المخصص Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK•
Python SDK
النموذج المركب Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK•
Python SDK

يدعم ذكاء المستندات v3.0:2022-08-31 (GA) الأدوات والتطبيقات والمكتبات التالية:

الميزة Resources
النموذج المخصص Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK•
Python SDK
النموذج المركب Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK•
Python SDK

يدعم Document Intelligence v2.1 الموارد التالية:

الميزة Resources
النموذج المخصص • أداة
واجهة برمجة تطبيقات
REST • SDK
لمكتبة العميل • حاوية Docker للذكاء المستندي
النموذج المركب • أداة
تصنيف ذكاء المستنداتواجهة برمجة تطبيقات
REST• واجهة
برمجة تطبيقات C# • حزمة تطوير
جافا باية• مجموعة تطوير جافا سكريبت
مجموعة تطوير بايثون

الخطوات التالية

تعلم كيفية إنشاء وتركيب نماذج مخصصة: