Iš anksto sukurtas teksto atpažinimo modelis

Iš anksto sukurtas teksto atpažinimo modelis ištraukia žodžius iš dokumentų ir vaizdų į mašininio skaitymo simbolių srautus. Jis naudoja moderniausią optinį simbolių atpažinimą (OCR), kad aptiktų spausdintą ir ranka rašytą tekstą vaizduose.

Šis modelis apdoroja vaizdus ir dokumentų failus, kad išgautų spausdinto ar ranka rašyto teksto eilutes.

Naudoti Power Apps

Iš anksto sukurtas teksto atpažinimo modelis pasiekiamas Power Apps naudojant teksto atpažinimo komponentą. Daugiau informacijos: Teksto atpažinimo komponento naudojimas Power Apps

Naudoti Power Automate

Informacijos apie tai, kaip naudoti Power Automate šį modelį, ieškokite Iš anksto sukurto teksto atpažinimo modelio Power Automate naudojimas.

Palaikoma kalba, formatas ir dydis

Failai, kuriuos galite nuskaityti naudodami teksto atpažinimo modelį, turi turėti šias charakteristikas:

  • Spausdinto teksto kalba: afrikanų, albanų, angika (Devanagiri), arabų, astūrų, awadhi-hindi (devanagiri), azerbaidžaniečių (lotynų), bagheli, baskų, baltarusių (kirilica), baltarusių (lotynų), bhojpuri-hindi (Devanagiri), bislama, bodo (Devanagiri), bosnių (lotynų), brajbha, bretonų, bulgarų, bundeli, buriatų (kirilica), katalonų, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), kinų (supaprastinta), kinų (tradicinė), kornvalio, korsikiečių, Krymo totorių (lotynų), kroatų, čekų, Danų, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), olandų, anglų, Erzya (kirilica), estų, Farerų, Fidžio, Filipinų, Suomių, Prancūzų, Friulian, Gagauz (lotynų), Galisų, Vokiečių, Gilbertese, Gondi (Devanagiri), Grenlandijos, Gurung (Devanagiri), Haičio kreolų, Halbi (Devanagiri), Hani, Haryanvi, Havajų, Hindi, Hmong Daw (lotynų), Ho(Devanagiri), vengrų, islandų, inari samių, indoneziečių, Interlingua, inuktitutų (lotynų), airių, italų, japonų, Jaunsari (Devanagiri), džavanų, Kabuverdianu, Kachin (lotynų), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kirilica), Kara-Kalpak (lotynų), Kašubų, Kazachų (kirilica), Kazachų (lotynų), Khaling, Khasi, K'iche", korėjiečių, Korku, Koryak, Kosraean, Kumyk (kirilica), kurdų (arabų), kurdų (lotynų), Kurukh (Devanagiri), kirgizų (kirilica), Lakota, lotynų, lietuvių, žemutinės sorbų, Lule Sami, liuksemburgiečių, Mahasu Pahari (Devanagiri), malajų (lotynų), maltiečių, malto (Devanagiri), manksų, maorių, maratų, mongolų (kirilica), Juodkalnijos (kirilica), juodkalniečių (lotynų), neapolių, nepaliečių, niujėnų, nogajų, šiaurės samių (lotynų), norvegų, oksitanų, ossetų, puštų, persų, lenkų, portugalų, pandžabų (arabų), ripuarų, rumunų, romėnų, rusų, sadri (Devanagiri), samoanų (lotynų), sanskrito (Devanagari), santali (Devanagiri), škotų, škotų gėlų, serbų (lotynų), šerpų (Devanagiri), sirmauri (Devanagiri), skoltų samių, slovakų, slovėnų, somalių (arabų), pietų samių, ispanų, svahilių (lotynų), švedų, tadžikų (kirilica), totorių (lotynų), Tetum, Thangmi, tonganų, turkų, turkmėnų (lotynų), tuvanų, aukštutinės sorbų, urdu, uigūrų (arabų), uzbekų (arabų), uzbekų (kirilica), uzbekų (lotynų), Volapük, Walser, valų, vakarų fryzų, Yucatec Maya, Zhuang, Zulu
  • Ranka rašyto teksto kalba: anglų, kinų (supaprastinta), prancūzų, vokiečių, italų, japonų, korėjiečių, portugalų, ispanų
  • Formatas:
    • JPG
    • PNG
    • BMP
    • PDF
  • Dydis: ne daugiau kaip 20 MB
  • PDF dokumentuose apdorojami tik pirmieji 2 000 puslapių.

Modelio išvestis

Jei aptinkamas dokumentas, teksto atpažinimo modelis pateikia šią informaciją:

  • Rezultatai: eilučių, ištrauktų iš įvesties teksto, sąrašas.
  • Tekstas: eilutės, kuriose yra aptikta teksto eilutė.
  • "BoundingBox": keturios reikšmės, vaizduojančios ribos lauką, aprašytos naudojant viršutinę ir kairiąją pozicijas kartu su jo pločiu ir aukščiu.

Apribojimai

Veiksmas Riba Atnaujinimo laikotarpis
Teksto atpažinimo skambučiai (pagal aplinką) 480 60 sek.

Taip pat žr.

Mokymas: atpažinti tekstą su AI Builder (modulis)