Teksta atpazīšana iepriekš uzbūvēts modelis
Teksta atpazīšana iepriekš izveidotais modelis izgūst vārdus no dokumentiem un attēliem mašīnlasāmās rakstzīmju plūsmās. Tas izmanto vismodernāko optisko rakstzīmju atpazīšanu (OCR), lai attēlos noteiktu drukātu un ar roku rakstītu tekstu.
Šis modelis apstrādā attēlus un dokumentu failus, lai izvilktu drukāta vai ar roku rakstīta teksta rindas.
Izmantojiet pakalpojumā Power Apps
Iepriekš izveidotais teksta atpazīšana modelis ir pieejams Power Apps , izmantojot teksta atpazinēja komponentu. Papildinformācija: Teksta atpazinēja komponenta izmantošana Power Apps
Lietošana pakalpojumā Power Automate
Informāciju par to, kā izmantot šo modeli Power Automate, skatiet sadaļā Iepriekš izveidotā modeļa teksta atpazīšana izmantošana Power Automate.
Atbalstītā valoda, formāts un lielums
Failiem, kurus var skenēt ar teksta atpazīšana modeli, jābūt šādiem raksturlielumiem:
- Valoda drukātam tekstam: afrikandu, albāņu, angika (devanagiri), arābu, astūriešu, awadhi-hindi (devanagiri), azerbaidžāņu (latīņu alfabēts), bagheli, basku, baltkrievu (kirilica), baltkrievu (latīņu alfabēts), bhojpuri-hindi (devanagiri), bislama, bodo (devanagiri), bosniešu (latīņu alfabēts), brajbha, bretoņu, bulgāru, bundeli, burjats (kirilica), katalāņu, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), ķīniešu (vienkāršotā), ķīniešu (tradicionālā), kornvolas, korsikāņu, Krimas tatāru (latīņu alfabēts), horvātu, čehu, dāņu, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), holandiešu, angļu, Erzya (kirilica), igauņu, fēru, fidžiešu, filipīniešu, somu, franču, friulian, gagauz (latīņu alfabēts), galisiešu, vācu, Gilbertese, Gondi (Devanagiri), grenlandiešu, gurung (devanagiri), Haiti kreoliešu, Halbi (Devanagiri), Hani, Haryanvi, havajiešu, hindi, Hmong Daw (latīņu), Ho(devanagiri), ungāru, islandiešu, inari sāmu, indonēziešu, interlingvu, inuktitut (latīņu alfabēts), īru, itāļu, japāņu, jaunsari (devanagiri), javiešu, Kabuverdianu, Kachin (latīņu alfabēts), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kirilica), Kara-Kalpak (latīņu), Kašubu, kazahu (kirilica), kazahu (latīņu), Khaling, Khasi, K'iche', korejiešu, Korku, Koryak, Kosraean, Kumyk (kirilica), kurdu (arābu), kurdu (latīņu), Kurukh (Devanagiri), Kirgizstānas (kirilicas), Lakota, latīņu, lietuviešu, Lejassorbu, Lule Sami, Luksemburgas, Mahasu Pahari (devanagiri), malajiešu (latīņu), maltiešu, Malto (devanagiri), Manx, maori, marathi, mongoļu (kirilica), Melnkalne (kirilica), Melnkalne (latīņu alfabēts), neapoliešu, nepāliešu, niueiešu, nogaju, ziemeļu sāmu (latīņu alfabēts), norvēģu, oksitāņu, osetiešu, puštu, persiešu, poļu, portugāļu, pendžabi (arābu), ripuāriešu, rumāņu, romāņu, krievu, sadri (devanagiri), samoāņu (latīņu), sanskrita (devanagari), santali (devanagiri), skotu, skotu gēlu, serbu (latīņu), šerpa (devanagiri), sirmauri (devanagiri), skolta sāmu, slovāku, slovēņu, somāliešu (arābu), dienvidu sāmu, spāņu, svahili (latīņu), zviedru, tadžiku (kirilica), tatāru (latīņu alfabēts), Tetum, Thangmi, Tongan, turku, turkmēņu (latīņu alfabēts), Tuvan, Upper Sorbian, Urdu, Uyghur (arābu), Uzbeku (arābu), Uzbeku (kirilicas), Uzbeku (latīņu), Volapük, Walser, Velsiešu, Rietumu frīzu, Yucatec Maya, Zhuang, Zulu
- Ar roku rakstīta teksta valoda: angļu, ķīniešu (vienkāršotā), franču, vācu, itāļu, japāņu, korejiešu, portugāļu, spāņu
- Formāts:
- JPG
- PNG
- BMP
- Izmērs: ne vairāk kā 20 MB
- PDF dokumentiem tiek apstrādātas tikai pirmās 2 000 lappuses.
Modeļa izvade
Ja dokuments tiek noteikts, teksta atpazīšana modelis izvada šādu informāciju:
- Rezultāti: no ievades teksta izvilkto rindu saraksts.
- Teksts: virknes, kurās ir noteikta teksta rindiņa.
- BoundingBox: četras vērtības, kas apzīmē ierobežojošo lodziņu un kas aprakstītas, izmantojot augšējo un kreiso pozīciju kopā ar tās platumu un augstumu.
Ierobežojumi
Darbība | Ierobežojumu | Atjaunošanas periods |
---|---|---|
Teksta atpazīšana izsaukumi (katrai videi) | 480 | 60 sekundes |