بدء الاستخدام: Document Intelligence Studio

ينطبق هذا المحتوى على:علامهv4.0 (معاينة) | الإصدارات السابقة:علامة اختيار زرقاءv3.1 (GA)علامة اختيار زرقاءv3.0 (GA)

يعد Document Intelligence Studio أداة عبر الإنترنت لاستكشاف الميزات وفهمها ودمجها بصريا من خدمة Document Intelligence في تطبيقاتك. يمكنك البدء باستكشاف النماذج المدربة مسبقا باستخدام نموذج أو مستنداتك الخاصة. كما يمكنك إنشاء مشروعات لبناء نماذج قوالب مخصصة، والرجوع إلى النماذج الموجودة في تطبيقاتك باستخدام الإصدار الأولي من عدة تطوير برامج Python وعمليات التشغيل السريع الأخرى.

المتطلبات الأساسية للمستخدمين الجدد

تلميح

إنشاء مورد خدمات Azure الذكاء الاصطناعي إذا كنت تخطط للوصول إلى خدمات Azure الذكاء الاصطناعي المتعددة ضمن نقطة نهاية/مفتاح واحد. للوصول إلى Document Intelligence فقط، قم بإنشاء مورد Document Intelligence. يرجى ملاحظة أنك ستحتاج إلى مورد خدمة واحدة إذا كنت تنوي استخدام مصادقة Microsoft Entra.

يدعم Document Intelligence الآن مصادقة رمز AAD (دليل Azure النشط) الإضافية للمصادقة المحلية (المستندة إلى المفتاح) عند الوصول إلى موارد ذكاء المستند وحسابات التخزين. تأكد من اتباع الإرشادات أدناه لإعداد أدوار الوصول الصحيحة، خاصة إذا تم تطبيق الموارد الخاصة بك مع DisableLocalAuth النهج.

إدارة تعيينات أدوار Azure

لتحليل المستندات والنماذج التي تم إنشاؤها مسبقا، يلزم اتباع تعيينات الأدوار لسيناريوهات مختلفة.

  • أساسي
    • مستخدم الخدمات المعرفية: تحتاج إلى هذا الدور إلى Document Intelligence أو مورد خدمات Azure الذكاء الاصطناعي لإدخال صفحة التحليل.
  • متقدم
    • المساهم: تحتاج إلى هذا الدور لإنشاء مجموعة موارد أو خدمة Document Intelligence أو مورد خدمات Azure الذكاء الاصطناعي.

لمزيد من المعلومات حول التخويل، راجعنهج تخويل Document Intelligence Studio.

إشعار

إذا تم تعطيل المصادقة المحلية (المستندة إلى المفتاح) لمورد خدمة Document Intelligence، فتأكد من الحصول على دور مستخدم الخدمات المعرفية وسيتم استخدام رمز AAD المميز لمصادقة الطلبات على Document Intelligence Studio. يسمح لك دور المساهم فقط بسرد المفاتيح ولكنه لا يمنحك الإذن لاستخدام المورد عند تعطيل الوصول إلى المفتاح.

النماذج

تساعدك النماذج التي تم إنشاؤها مسبقا على إضافة ميزات Document Intelligence إلى تطبيقاتك دون الحاجة إلى إنشاء النماذج الخاصة بك وتدريبها ونشرها. يمكنك الاختيار من بين العديد من النماذج المُنشأة مسبقًا، ولكلٍ منها مجموعة خاصة به من حقول البيانات المدعومة. يعتمد اختيار النموذج الذي سيتم استخدامه للعملية analyze على نوع المستند الذي سيتم تحليله. يدعم Document Intelligence حاليا النماذج التالية التي تم إنشاؤها مسبقا:

تحليل المستند

  • التخطيط: استخراج النص والجداول وعلامات التحديد ومعلومات البنية من المستندات (بصيغتيْ PDF وTIFF) والصور (بصيغ JPG وPNG وBMP).
  • القراءة: استخراج أسطر النص والكلمات ومواقعها واللغات المُكتشفة والنمط المكتوب بخط اليد في حال اكتشافها في المستندات (بصيغتيْ PDF وTIFF) والصور (بصيغ JPG وPNG وBMP).

منشأ مسبقًا

  • الفاتورة: استخراج النص وعلامات التحديد والجداول وأزواج قيم المفاتيح والمعلومات الأساسية من الفواتير.
  • الإيصال: استخراج النص والمعلومات الأساسية من الإيصالات.
  • بطاقة التأمين الصحي: استخراج شركة التأمين والعضو والوصفات الطبية ورقم المجموعة ومعلومات رئيسية أخرى من بطاقات التأمين الصحي الأمريكية.
  • W-2: استخراج النص والمعلومات الرئيسية من نماذج ضريبة W-2.
  • مستند الهوية: استخراج النص والمعلومات الأساسية من رخص القيادة وجوازات السفر الدولية.

مخصص

  • نماذج الاستخراج المخصصة: استخراج المعلومات من النماذج والمستندات باستخدام نماذج استخراج مخصصة. تدريب نموذج بسرعة عن طريق تسمية عدد قليل من نماذج المستندات الخمسة.
  • نموذج التصنيف المخصص: تدريب مصنف مخصص للتمييز بين أنواع المستندات المختلفة داخل تطبيقاتك. تدريب نموذج بسرعة مع عدد قليل من فئتين وخمس عينات لكل فئة.

بعد إكمال المتطلبات الأساسية، انتقل إلى Document Intelligence Studio.

  1. حدد ميزة خدمة Document Intelligence من الصفحة الرئيسية ل Studio. هذه الخطوة هي عملية لمرة واحدة إلا إذا قمت بالفعل بتحديد مورد الخدمة من الاستخدام السابق. حدد اشتراك Azure ومجموعة الموارد والموارد. (يمكنك تغيير الموارد في أي وقت في "الإعدادات" بالقائمة العلوية). راجع ما حددته ثم أكّده.

  2. حدد الزر "تحليل" لتشغيل التحليل على المستند العينة، أو جرّب مستندك الخاص عن طريق استخدام الأمر "إضافة".

  3. استخدم عناصر التحكم الموجودة أسفل الشاشة للتكبير والتصغير وتدوير طريقة عرض المستند.

  4. راقب المحتوى المُستخرَج المميز في طريقة عرض المستند. مرّر الماوس فوق المفاتيح والقيم للاطلاع على التفاصيل.

  5. حدد علامة التبويب Result في قسم الإخراج واستعرض إخراج JSON لفهم تنسيق استجابة الخدمة.

  6. حدد علامة التبويب Code واستعرض نموذج التعليمات البرمجية للتكامل. انسخها ثم نزّلها للبدء.

المتطلبات الأساسية المضافة للمشاريع المخصصة

بالإضافة إلى حساب Azure ومورد Document Intelligence أو Azure الذكاء الاصطناعي services، تحتاج إلى:

حاوية تخزين Azure Blob

أداء قياسي حساب Azure Blob Storage. يمكنك إنشاء حاويات لتخزين مستندات التدريب وتنظيمها داخل حساب التخزين الخاص بك. إذا كنت لا تعرف كيفية إنشاء حساب تخزين Azure مع حاوية، بعد هذه البدايات السريعة:

  • قم بإنشاء حساب تخزين. عند إنشاء حساب التخزين الخاص بك، تأكد من تحديد الأداء القياسي في حقل تفاصيل → الأداء.
  • إنشاء حاوية. عند إنشاء الحاوية الخاصة بك تعيين حقل مستوى الوصول العام إلى حاوية (وصول القراءة المجهولة لحاويات النقط) في إطار حاوية جديدة.

إدارة تعيينات أدوار Azure

بالنسبة للمشاريع المخصصة، تكون تعيينات الدور التالية مطلوبة لسيناريوهات مختلفة.

  • أساسي

    • مستخدم الخدمات المعرفية: تحتاج إلى هذا الدور ل Document Intelligence أو مورد خدمات Azure الذكاء الاصطناعي لتدريب النموذج المخصص أو إجراء تحليل مع نماذج مدربة.
    • Storage Blob Data Contributor: تحتاج إلى هذا الدور لحساب التخزين لإنشاء مشروع وتسمية البيانات.
  • خيارات متقدمة

    • مساهم حساب التخزين: تحتاج إلى هذا الدور لحساب التخزين لإعداد إعدادات CORS (هذا الإجراء هو جهد لمرة واحدة إذا تم إعادة استخدام نفس حساب التخزين).
    • المساهم: تحتاج إلى هذا الدور لإنشاء مجموعة موارد وموارد.

    إشعار

    إذا تم تعطيل المصادقة المحلية (المستندة إلى المفتاح) لمورد خدمة Document Intelligence وحساب التخزين، فتأكد من الحصول على أدوار Cognitive Services User وStorage Blob Data Contributor على التوالي، بحيث يكون لديك أذونات كافية لاستخدام Document Intelligence Studio. يسمح لك دورا مساهم حساب التخزين والمساهم فقط بسرد المفاتيح ولكن لا يمنحك الإذن لاستخدام الموارد عند تعطيل الوصول إلى المفتاح.

تكوين CORS

يجب تكوين CORS (مشاركة الموارد عبر المنشأ) على حساب تخزين Azure حتى يمكن الوصول إليه من Document Intelligence Studio. لتكوين CORS في مدخل Microsoft Azure، تحتاج إلى الوصول إلى علامة التبويب CORS لحساب التخزين الخاص بك.

  1. حدد علامة التبويب CORS لحساب التخزين.

    لقطة شاشة لقائمة إعدادات CORS في مدخل Azure.

  2. ابدأ بإنشاء إدخال CORS جديد في خدمة Blob.

  3. قم بتعيين الأصول المسموح بها إلى https://documentintelligence.ai.azure.com .

    لقطة شاشة تعرض تكوين CORS لحساب تخزين.

    تلميح

    يمكنك استخدام حرف البدل "*"، بدلاً من استخدام مجال محدد، للسماح لجميع مجالات الأصل بإجراء طلبات عبر CORS.

  4. حدد كافة الخيارات الثمانية المتوفرة للأساليب المسموح بها.

  5. الموافقة على كافة الرؤوس المسموح بها و الرؤوس المكشوفة عن طريق إدخال * في كل حقل.

  6. تعيين الحد الأقصى للعمر إلى 120 ثانية أو أي قيمة مقبولة.

  7. حدد الزر "حفظ" في أعلى الصفحة لحفظ التغييرات.

يجب الآن تكوين CORS لاستخدام حساب التخزين من Document Intelligence Studio.

عينة من مجموعة المستندات

  1. سجل الدخول إلى مدخل Microsoft Azure وانتقل إلى حاويات تخزين>البيانات لحساب>التخزين الخاص بك.

    لقطة شاشة لقائمة تخزين البيانات في مدخل Microsoft Azure.

  2. حدد حاوية من القائمة.

  3. حدد Upload من القائمة في أعلى الصفحة.

    لقطة شاشة لزر تحميل الحاوية في مدخل Microsoft Azure.

  4. تظهر نافذة تحميل الكائنات الثنائية كبيرة الحجم.

  5. حدد الملفات التي تريد تحميلها.

    لقطة شاشة لتحميل نافذة كائن ثنائي كبير الحجم في مدخل Microsoft Azure.

إشعار

بشكل افتراضي، سيستخدم Studio المستندات الموجودة في جذر الحاوية الخاصة بك. لكن يمكنك استخدام البيانات المُنظمة في المجلدات عن طريق تحديد مسار المجلد في خطوات إنشاء مشروع النموذج المخصص. راجعتنظيم بياناتك في مجلدات فرعية

النماذج المخصصة

لإنشاء نماذج مخصصة، ابدأ بتكوين المشروع:

  1. من الصفحة الرئيسية للاستوديو، حدد بطاقة "تخصيص النموذج" لفتح صفحة "النماذج المخصصة".

  2. استخدم الأمر "إنشاء مشروع" لبدء تشغيل معالج تكوين المشروع الجديد.

  3. أدخل تفاصيل المشروع، وحدد اشتراك Azure ومورده، وحاوية تخزين Azure Blob التي تحتوي على بياناتك.

  4. راجع الإعدادات الخاصة بك وأسلها لإنشاء المشروع.

  5. استخدم ميزة التسمية التلقائية للتسمية باستخدام نموذج مدرب بالفعل أو أحد نماذجنا التي تم إنشاؤها مسبقا.

  6. للتسمية اليدوية من البداية، حدد التسميات وأنواعها التي تهتم باستخراجها.

  7. حدد النص في المستند وحدد التسمية من القائمة المنسدلة أو جزء التسميات.

  8. تسمية أربعة مستندات أخرى للحصول على خمسة مستندات مسماة على الأقل .

  9. حدد الأمر تدريب وأدخل اسم النموذج، وحدد ما إذا كنت تريد أن يبدأ نموذج القالب العصبي (مستحسن) أو نموذج القالب بتدريب النموذج المخصص.

  10. بمجرد أن يكون الطراز جاهزًا، استخدم الأمر اختبار Test للتحقق من صحته مع مستندات الاختبار ومراقبة النتائج.

عرض توضيحي للنموذج المخصص لذكاء المستند

وضع العلامات كجداول

إشعار

  1. استخدم الأمر "حذف" لحذف النماذج غير المطلوبة.

  2. تحميل تفاصيل الطراز للعرض دون اتصال.

  3. حدد نماذج متعددة وإنشاءها في نموذج جديد لاستخدامه في التطبيقات الخاصة بك.

استخدام الجداول كنمط مرئي:

بالنسبة إلى نماذج النماذج المخصصة، قد تحتاج أثناء إنشاء نماذجك المخصصة إلى استخراج مجموعات البيانات من مستنداتك. قد تظهر مجموعات البيانات في تنسيقين. استخدام الجداول كنمط مرئي:

  • عدد قيم (الصفوف) الديناميكي أو المتغير لمجموعة معينة من الحقول (أعمدة)

  • مجموعة محددة من القيم لمجموعة معينة من الحقول (أعمدة و/أو صفوف)

التسمية كجدول ديناميكي

استخدم الجداول الديناميكية لاستخراج عدد المتغيرات من قيم (الصفوف) لمجموعة معينة من الحقول (أعمدة):

  1. قم بإضافة تسمية نوع "جدول" جديدة، وحدد نوع "الجدول الديناميكي"، واسم التسمية الخاصة بك.

  2. إضافة عدد الأعمدة (الحقول) والصفوف (للبيانات) التي تحتاج إليها.

  3. حدد النص في صفحتك ثم اختر الخلية لتعيينه إلى النص. كرر ذلك لجميع الصفوف والأعمدة في جميع الصفحات في كافة المستندات.

تسمية ذكاء المستند كمثال جدول ديناميكي

التسمية كجدول ثابت

استخدم جداول ثابتة لاستخراج مجموعة محددة من القيم لمجموعة معينة من الحقول (أعمدة و/أو صفوف):

  1. قم بإنشاء تسمية نوع "جدول" جديد، حدد نوع "جدول ثابت" وتسميته.

  2. إضافة عدد الأعمدة والصفوف التي تحتاجها المطابقة لمجموعتي الحقول.

  3. حدد النص في صفحتك ثم اختر الخلية لتعيينه إلى النص. كرر للمستندات الأخرى.

تسمية ذكاء المستند كمثال جدول ثابت

اكتشاف التوقيع

إشعار

في الوقت الحالي، حقول التوقيع مدعومة فقط لنماذج القوالب المخصصة. عند تدريب نموذج عصبي مخصص، يتم تجاهل حقول التوقيع المُسماة.

لوضع تسمية لاكتشاف التوقيع: (للنموذج المخصص فقط)

  1. في طريقة عرض وضع التسميات، قم بإنشاء تسمية نوع "توقيع" جديدة وتسميتها.

  2. استخدم الأمر Region لإنشاء منطقة مستطيلة في الموقع المتوقع للتوقيع.

  3. حدد المنطقة المرسومة واختر تسمية نوع التوقيع لتعيينها إلى منطقتك المرسومة. كرر للمستندات الأخرى.

تسمية ذكاء المستند لمثال الكشف عن التوقيع

الخطوات التالية

ابدأ باستخدام Document Intelligence Studio.