Model prefabricat pentru recunoașterea textului
Modelul predefinit de recunoaștere a textului extrage cuvinte din documente și imagini în fluxuri de caractere care pot fi citite de mașină. Utilizează recunoașterea optică a caracterelor (OCR) de ultimă generație pentru a detecta textul tipărit și scris de mână în imagini.
Acest model procesează imagini și fișiere de document pentru a extrage linii de text tipărit sau scris de mână.
Foloseste in Power Apps
Modelul predefinit pentru recunoașterea textului este disponibil în Power Apps prin utilizarea componentei de recunoaștere a textului. Mai multe informații: Utilizați componenta de recunoaștere a textului în Power Apps
Foloseste in Power Automate
Pentru informații despre cum să utilizați acest model în Power Automate, consultați Utilizarea modelului predefinit pentru recunoașterea textului în Power Automate.
Limba, formatul și dimensiunea acceptate
Fișierele pe care le puteți scana cu modelul de recunoaștere a textului trebuie să aibă următoarele caracteristici:
- Limbă pentru textul tipărit: afrikaans, albaneză, Angika (Devanagiri), arabă, asturiană, awadhi-hindi (Devanagiri), azera (latină), bagheli, bască, belarusă (chirilică), belarusă (latină), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), bosniacă (latină), Brajbha, bretonă, bulgară, Bundeli, Buryat (chirilic), catalană, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), chineză (simplificată), Chineză (tradițională), Cornish, Corsican, Tătar din Crimeea (latină), Croată, Cehă, Daneză, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), olandeză, engleză, Erzya (chirilic), Estonă, Feroeză, Fijiană, Filipină, finlandeză, franceză, friuleană, găgăuză (latină), galizică, germană, gilberteză, gondi (Devanagiri), groenlandeză, gurung (devanagiri), creolă haitiană, Halbi (Devanagiri), Hani, Haryanvi, hawaiană, hindi, Hmong Daw (latină) ), Ho (Devanagiri), maghiară, islandeză, inari sami, indoneziană, interlingua, inuktitut (latină), irlandeză, italiană, japoneză, jaunsari (Devanagiri), javaneză, Kabuverdianu, Kachin (latină), Kangri (Devanagiri), Karachay- Balkar, Kara-Kalpak (chirilic), Kara-Kalpak (latină), Kashubian, Kazah (chirilic), kazah (latină), Khaling, Khasi, K'iche', coreeană, Korku, Koryak, Kosraean, Kumyk (chirilic), kurdă (araba), kurdă (latină), kurukh (Devanagiri), kirghiză (chirilică), lakota, latină, lituaniană, sorabă inferioară, lule sami, luxemburgheză, Mahasu Pahari (Devanagiri), malaeză (latină), malteză, malto (Devanagiri) ), manx, maori, marathi, mongolă (chirilic), muntenegrean (chirilic), muntenegrean (latină), napolitană, nepaleză, niueană, nogay, sami de nord (latină), norvegiană, occitană, osetică, pașto, persană, poloneză, portugheză, punjabi (arabă), ripuară, română, romanșă, rusă, sadri (Devanagiri), samoană (latină), sanscrită (Devanagari), Santali (Devanagiri), scoțiană, gaelică scoțiană, sârbă (latină), șerpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, slovacă, slovenă, somaleză (araba), sudică sami, spaniolă, swahili (latină), suedeză, tadjik (chirilic), tătar (latină), tetum, Thangmi, tongană, turcă, turkmenă (latină), Tuvan, sorabă superioară, urdu, uigură (araba), uzbecă (arabă), uzbecă (chirilic), uzbec (latină), volapuk, walser, galeză, frizia de vest, maya yucatecă, zhuang, zulu
- Limba pentru textul scris de mână: engleză, chineză (simplificată), franceză, germană, italiană, japoneză, coreeană, portugheză, spaniolă
- Format:
- JPG
- PNG
- BMP
- Dimensiune: maxim 20 MB
- Pentru documentele PDF, sunt procesate doar primele 2.000 de pagini.
Ieșire model
Dacă este detectat un document, modelul de recunoaștere a textului emite următoarele informații:
- Rezultate: o listă de linii extrase din textul introdus.
- Text: șiruri de caractere care conțin linia de text detectată.
- BoundingBox: patru valori reprezentând caseta de delimitare, descrise prin utilizarea pozițiilor de sus și din stânga împreună cu lățimea și înălțimea acesteia.
Limite
Acțiune | Limită | Perioada de reînnoire |
---|---|---|
Apeluri de recunoaștere a textului (pe mediu) | 480 | 60 de secunde |