النموذج المُنشأ مسبقًا للتعرف على النص

يستخرج النموذج المنشأ مسبقاً للتعرف على النص الكلمات من المستندات والصور في تدفقات أحرف يمكن للآلة قراءتها. يستخدم هذا أحدث تقنية للتعرّف البصري على الحروف (OCR) لاكتشاف النص المطبوع والمكتوب بخط اليد في الصور.

هذا النموذج يعالج الصور وملفات المستندات لاستخراج أسطر من النص المطبوع أو المكتوب باليد.

الاستخدام في Power Apps

يتوفر النموذج المُنشأ مسبقًا للتعرف على النص في Power Apps باستخدام مكون أداة التعرف على النص. مزيد من المعلومات: استخدم مكون أداة التعرف على النص في Power Apps

الاستخدام في Power Automate

للحصول على معلومات حول كيفية استخدام هذا النموذج في Power Automate، راجع استخدام النموذج المُنشأ مسبقًا للتعرف على النص في Power Automate.

اللغة المدعومة والتنسيق والحجم

يجب أن تتضمن الملفات التي يمكنك فحصها باستخدام نموذج التعرف على النص هذه الخصائص:

  • لغة النص المطبوع: الإفريقية، الألبانية، الأنجيكا (ديفاناغيري)، العربية، الأستورية، الأودية-الهندية (الديفاناغيري)، الأذربيجانية (اللاتينية)، الباغيلية، الباسكية، البيلاروسية (السيريالية)، البيلاروسية (اللاتينية)، البوجبورية-الهندية (ديفاناغيري)، بيسلاما، بودو (ديفاناغيري)، البوسنية (اللاتينية)، براجبها، بريتون، البلغارية، البونديلية، بوريات (السيريالية)، الكاتالونية، السيبيونو، تشاملينغ، تشامورو، تشاتيسغارهي (ديفاناغيري)، الصينية (المبسطة)، الصينية (التقليدية)، الكورنيشية، الكورسيكانية، تتارية القرم (اللاتينية)، الكرواتية، التشيكية، الدنماركية، الدارية، الدايمالية (ديفاناغيري)، الدوغرية (ديفاناغيري)، الهولندية، الإنكليزية، الأرزية (السيريالية)، الإستونية، الفاروية، الفيجية، الفلبينية، الفنلندية، الفرنسية، الفريولية، الجاجوزية (اللاتينية)، الجاليكية، الألمانية، غيلبرت، الجوندية (ديفاناغيري)، الغرينلاندية، غورونغ (ديفاناغيري)، الكريولية الهايتية، هلبي (ديفاناغيري)، هاني، هاريانفي، هاوايي، الهندية، همونغ داو (اللاتينيي)، هو (ديفاناغيري)، المجرية، الأيسلندية، الإينارية السامية، الإندونيسية، إنترلينغوا، إينوكتيتوت (اللاتينية)، الأيرلندية، الإيطالية، اليابانية، الجونساري (ديفاناغيري)، الجاوية، كابوفيرديانو، كاشين (اللاتينية)، كانغري (ديفاناغيري)، قراشاي بالكار، كارا-كالباك (السيريالية)، كارا-كالباك (اللاتينية)، الكوشوبية، الكازاخستانية (السيريالية)، الكازاخستانية (اللاتينية)، خالينغ، خاسي، كيشي، الكورية، كوركو، كورياك، كوسراين، كوميك (السيريالية)، الكردية (العربية)، الكردية (اللاتينية)، كوروخ (ديفاناغيري)، القرغيزية (السيريالية)، لاكوتا، اللاتينية، الليتوانية، الصوربية السفلى، لول السامية، اللوكسمبورغية، مهاسو باهاري (ديفاناغيري)، الملايو (اللاتينية)، المالطية، مالتو (ديفاناغيري)، مانكس، الماورية، المهاراتية، المنغولية (السيريالية)، الجبل الأسود (السيريالية)، الجبل الأسود (اللاتينية)، النابولية، النيبالية، نيوي، نوغاي، الشمال السامية (اللاتينية)، النرويجية، أوكسيتان، الأوسيتيكية، الباشتو، الفارسية، البولندية، البرتغالية، البنجابية (العربية)، الريبية، الرومانية، الرومانشية، الروسية، سادري (ديفاناغيري)، الساموية (اللاتينية)، السنسكريتية (ديفاناغاري)، السنتالية (الديفاناغيري)، الاسكتلندية، الغيلية الاسكتلندية، الصربية (اللاتينية)، شيربا (ديفاناغيري)، سيرموري (ديفاناغيري)، سكولت السامية، السلوفاكية، السلوفينية، الصومالية (العربية)، السامية الجنوبية، الإسبانية، السواحيلية (اللاتينية)، السويدية، الطاجيكية (السيريالية)، التتارية (اللاتينية)، التيتوم، ثانغمي، تونجا، التركية، التركمانية (اللاتينية)، توفان، الصوربية العليا، الأردية، الأويغورية (العربية)، الأوزبكية (العربية)، الأوزبكية (السيريالية)، الأوزبكية (اللاتينية)، فولابوك، والسر، الويلزية، الفريزية الغربية، يوكاتيك المايا، تشوانغ، زولو
  • لغة النص المكتوب باليد الإنجليزية، الصينية (مبسطة)، الفرنسية، الألمانية، الإيطالية، اليابانية، الكورية، البرتغالية، الإسبانية
  • التنسيق:
    • JPG
    • PNG
    • BMP
    • PDF
  • الحجم: 20 ميغابايت كحدٍ أقصى
  • وبالنسبة لمستندات PDF، لا تتم معالجة سوى أول 2,000 صفحة.

إخراج النموذج

إذا تم اكتشاف مستند، يقوم نموذج التعرف على النص بإخراج المعلومات التالية:

  • النتائج: قائمة بالأسطر المستخرجة من نص الإدخال.
  • النص: سلاسل تحتوي على سطر النص الذي تم اكتشافه.
  • BoundingBox: أربع قيم تمثل المربع المحيط، يتم وصفه باستخدام الموضعين العلوي واليسار بالإضافة إلى عرضه وارتفاعه.

الحدود

الإجراء حد فترة التجديد
مكالمات التعرف على النص (لكل بيئة) 480 60 ثانية

(راجع أيضًا)

التدريب: التعرف على النص باستخدام AI Builder (وحدة نمطية)