Vooraf samengesteld model voor tekstherkenning

Artikel
01/10/2024

Met het vooraf samengestelde model voor tekstherkenning worden woorden uit documenten en afbeeldingen geëxtraheerd in tekenstromen die door machines kunnen worden gelezen. Het model maakt gebruik van geavanceerde optische-tekenherkenning (OCR) om afgedrukte en handgeschreven tekst in afbeeldingen te detecteren.

Met dit model worden afbeeldingen en documenten verwerkt voor het extraheren van gedrukte of handgeschreven tekstregels.

Gebruiken in Power Apps

Het vooraf samengestelde model voor tekstherkenning is beschikbaar in Power Apps door het onderdeel voor tekstherkenning te gebruiken. Meer informatie:Het onderdeel tekstherkenner in Power Apps

Gebruiken in Power Automate

Voor informatie over het gebruik van dit model in Power Automate, zie Het vooraf samengestelde tekstherkenningsmodel gebruiken in Power Automate.

Ondersteunde taal, indeling en grootte

De bestanden die u met het model voor tekstherkenning wilt scannen, moeten de volgende eigenschappen hebben:

Taal voor gedrukte tekst: Afrikaans, Albanees, Angika (Devanagiri), Arabisch, Asturisch, Awadhi-Hindi (Devanagiri), Azerbeidzjaans (Latijn), Bagheli, Baskisch, Wit-Russisch (Cyrillisch), Wit-Russisch (Latijn), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bosnisch (Latijn), Brajbha, Bretons, Bulgaars, Bundeli, Buryat (Cyrillisch), Catalaans, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Chinees (vereenvoudigd), Chinees (traditioneel), Cornish, Corsicaans, Krim Tatar (Latijn), Kroatisch, Tsjechisch, Deens, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Nederlands, Engels, Erzya (Cyrillisch), Ests, Faeröers, Fiji, Filipijns, Fins, Frans, Friulisch, Gagauz (Latijn), Galicisch, Duits, Gilbertees, Gondi (Devanagiri), Groenlands, Gurung (Devanagiri), Haïtiaans Creools, Halbi (Devanagiri), Hani, Haryanvi, Hawaiiaans, Hindi, Hmong Daw (Latijn), Ho (Devanagiri), Hongaars, IJslands, Inari Sami, Indonesisch, Interlingua, Inuktitut (Latijn), Iers, Italiaans, Japans, Jaunsari (Devanagiri), Javaans, Kabuverdianu, Kachin (Latijn), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (Cyrillisch), Kara-Kalpak (Latijn), Kashubian, Kazachs (Cyrillisch), Kazachs (Latijn), Khaling, Khasi, K'iche', Koreaans, Korku, Koryak, Kosraean, Kumyk (Cyrillisch), Koerdisch (Arabisch), Koerdisch (Latijn), Kurukh (Devanagiri), Kirgizisch (Cyrillisch), Lakota, Latijn, Litouws, Nedersorbisch, Lule Sami, Luxemburgs, Mahasu Pahari (Devanagiri), Maleis (Latijn), Maltees, Malto (Devanagiri), Manx, Maori, Marathi, Mongools (Cyrillisch), Montenegrijns (Cyrillisch), Montenegrijns (Latijn), Napolitaans, Nepalees, Niuean, Nogay, Noord-Sami (Latijn), Noors, Occitaans, Ossetisch, Pashto, Perzisch, Pools, Portugees, Punjabi (Arabisch), Ripuaria, Roemeens, Reto-Romaans, Russisch, Sadri (Devanagiri), Samoaans (Latijn), Sanskriet (Devanagari), Santali (Devanagiri), Schots, Schots-Gaelisch, Servisch (Latijn), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, Slowaaks, Sloveens, Somalisch (Arabisch), Zuid-Samisch, Spaans, Swahili (Latijn), Zweeds, Tadzjieks (Cyrillisch), Tataars (Latijn), Tetum, Thangmi, Ton gan, Turks, Turkmeens (Latijn), Tuvan, Oppersorbisch, Urdu, Oeigoers (Arabisch), Oezbeeks (Arabisch), Oezbeeks (Cyrillisch), Oezbeeks (Latijn), Volapük, Walser, Welsh, West-Fries, Yucatec Maya, Zhuang, Zulu
Taal voor handgeschreven tekst: Engels, Chinees (vereenvoudigd), Frans, Duits, Italiaans, Japans, Koreaans, Portugees, Spaans
Indeling:
- JPG
- PNG
- BMP
- PDF
Grootte: maximaal 20 MB
Voor PDF-documenten worden alleen de eerste 2,000 pagina's verwerkt.

Uitvoer van model

Als er een document wordt gedetecteerd, geeft het model voor tekstherkenning de volgende informatie als uitvoer:

Resultaten: een lijst met regels die uit de invoertekst zijn geëxtraheerd.
Tekst: tekenreeksen met de gedetecteerde tekstregel.
BoundingBox: vier waarden die het begrenzingsvak voorstellen, beschreven aan de hand van de bovenste en linker posities, in combinatie met de breedte en hoogte.

Limieten

Actie	Limiet	Verlengingsperiode
Tekstherkenningsaanroepen (per omgeving)	480	60 seconden

Training: Tekst herkennen met AI Builder (module)

Delen via

Vooraf samengesteld model voor tekstherkenning

Gebruiken in Power Apps

Gebruiken in Power Automate

Ondersteunde taal, indeling en grootte

Uitvoer van model

Limieten

Feedback

Feedback

Aanvullende resources

Delen via

Vooraf samengesteld model voor tekstherkenning

Gebruiken in Power Apps

Gebruiken in Power Automate

Ondersteunde taal, indeling en grootte

Uitvoer van model

Limieten

Gerelateerde informatie

Feedback

Feedback

Aanvullende resources