Iš anksto sukurtas teksto atpažinimo modelis
Iš anksto sukurtas teksto atpažinimo modelis ištraukia žodžius iš dokumentų ir vaizdų į mašininio skaitymo simbolių srautus. Jis naudoja moderniausią optinį simbolių atpažinimą (OCR), kad aptiktų spausdintą ir ranka rašytą tekstą vaizduose.
Šis modelis apdoroja vaizdus ir dokumentų failus, kad išgautų spausdinto ar ranka rašyto teksto eilutes.
Naudoti Power Apps
Iš anksto sukurtas teksto atpažinimo modelis pasiekiamas Power Apps naudojant teksto atpažinimo komponentą. Daugiau informacijos: Teksto atpažinimo komponento naudojimas Power Apps
Naudoti Power Automate
Informacijos apie tai, kaip naudoti Power Automate šį modelį, ieškokite Iš anksto sukurto teksto atpažinimo modelio Power Automate naudojimas.
Palaikoma kalba, formatas ir dydis
Failai, kuriuos galite nuskaityti naudodami teksto atpažinimo modelį, turi turėti šias charakteristikas:
- Spausdinto teksto kalba: afrikanų, albanų, angika (Devanagiri), arabų, astūrų, awadhi-hindi (devanagiri), azerbaidžaniečių (lotynų), bagheli, baskų, baltarusių (kirilica), baltarusių (lotynų), bhojpuri-hindi (Devanagiri), bislama, bodo (Devanagiri), bosnių (lotynų), brajbha, bretonų, bulgarų, bundeli, buriatų (kirilica), katalonų, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), kinų (supaprastinta), kinų (tradicinė), kornvalio, korsikiečių, Krymo totorių (lotynų), kroatų, čekų, Danų, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), olandų, anglų, Erzya (kirilica), estų, Farerų, Fidžio, Filipinų, Suomių, Prancūzų, Friulian, Gagauz (lotynų), Galisų, Vokiečių, Gilbertese, Gondi (Devanagiri), Grenlandijos, Gurung (Devanagiri), Haičio kreolų, Halbi (Devanagiri), Hani, Haryanvi, Havajų, Hindi, Hmong Daw (lotynų), Ho(Devanagiri), vengrų, islandų, inari samių, indoneziečių, Interlingua, inuktitutų (lotynų), airių, italų, japonų, Jaunsari (Devanagiri), džavanų, Kabuverdianu, Kachin (lotynų), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kirilica), Kara-Kalpak (lotynų), Kašubų, Kazachų (kirilica), Kazachų (lotynų), Khaling, Khasi, K'iche", korėjiečių, Korku, Koryak, Kosraean, Kumyk (kirilica), kurdų (arabų), kurdų (lotynų), Kurukh (Devanagiri), kirgizų (kirilica), Lakota, lotynų, lietuvių, žemutinės sorbų, Lule Sami, liuksemburgiečių, Mahasu Pahari (Devanagiri), malajų (lotynų), maltiečių, malto (Devanagiri), manksų, maorių, maratų, mongolų (kirilica), Juodkalnijos (kirilica), juodkalniečių (lotynų), neapolių, nepaliečių, niujėnų, nogajų, šiaurės samių (lotynų), norvegų, oksitanų, ossetų, puštų, persų, lenkų, portugalų, pandžabų (arabų), ripuarų, rumunų, romėnų, rusų, sadri (Devanagiri), samoanų (lotynų), sanskrito (Devanagari), santali (Devanagiri), škotų, škotų gėlų, serbų (lotynų), šerpų (Devanagiri), sirmauri (Devanagiri), skoltų samių, slovakų, slovėnų, somalių (arabų), pietų samių, ispanų, svahilių (lotynų), švedų, tadžikų (kirilica), totorių (lotynų), Tetum, Thangmi, tonganų, turkų, turkmėnų (lotynų), tuvanų, aukštutinės sorbų, urdu, uigūrų (arabų), uzbekų (arabų), uzbekų (kirilica), uzbekų (lotynų), Volapük, Walser, valų, vakarų fryzų, Yucatec Maya, Zhuang, Zulu
- Ranka rašyto teksto kalba: anglų, kinų (supaprastinta), prancūzų, vokiečių, italų, japonų, korėjiečių, portugalų, ispanų
- Formatas:
- JPG
- PNG
- BMP
- Dydis: ne daugiau kaip 20 MB
- PDF dokumentuose apdorojami tik pirmieji 2 000 puslapių.
Modelio išvestis
Jei aptinkamas dokumentas, teksto atpažinimo modelis pateikia šią informaciją:
- Rezultatai: eilučių, ištrauktų iš įvesties teksto, sąrašas.
- Tekstas: eilutės, kuriose yra aptikta teksto eilutė.
- "BoundingBox": keturios reikšmės, vaizduojančios ribos lauką, aprašytos naudojant viršutinę ir kairiąją pozicijas kartu su jo pločiu ir aukščiu.
Apribojimai
Veiksmas | Riba | Atnaujinimo laikotarpis |
---|---|---|
Teksto atpažinimo skambučiai (pagal aplinką) | 480 | 60 sek. |