Vooraf samengesteld model voor tekstherkenning
Met het vooraf samengestelde model voor tekstherkenning worden woorden uit documenten en afbeeldingen geëxtraheerd in tekenstromen die door machines kunnen worden gelezen. Het model maakt gebruik van geavanceerde optische-tekenherkenning (OCR) om afgedrukte en handgeschreven tekst in afbeeldingen te detecteren.
Met dit model worden afbeeldingen en documenten verwerkt voor het extraheren van gedrukte of handgeschreven tekstregels.
Gebruiken in Power Apps
Het vooraf samengestelde model voor tekstherkenning is beschikbaar in Power Apps door het onderdeel voor tekstherkenning te gebruiken. Meer informatie:Het onderdeel tekstherkenner in Power Apps
Gebruiken in Power Automate
Voor informatie over het gebruik van dit model in Power Automate, zie Het vooraf samengestelde tekstherkenningsmodel gebruiken in Power Automate.
Ondersteunde taal, indeling en grootte
De bestanden die u met het model voor tekstherkenning wilt scannen, moeten de volgende eigenschappen hebben:
- Taal voor gedrukte tekst: Afrikaans, Albanees, Angika (Devanagiri), Arabisch, Asturisch, Awadhi-Hindi (Devanagiri), Azerbeidzjaans (Latijn), Bagheli, Baskisch, Wit-Russisch (Cyrillisch), Wit-Russisch (Latijn), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bosnisch (Latijn), Brajbha, Bretons, Bulgaars, Bundeli, Buryat (Cyrillisch), Catalaans, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Chinees (vereenvoudigd), Chinees (traditioneel), Cornish, Corsicaans, Krim Tatar (Latijn), Kroatisch, Tsjechisch, Deens, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Nederlands, Engels, Erzya (Cyrillisch), Ests, Faeröers, Fiji, Filipijns, Fins, Frans, Friulisch, Gagauz (Latijn), Galicisch, Duits, Gilbertees, Gondi (Devanagiri), Groenlands, Gurung (Devanagiri), Haïtiaans Creools, Halbi (Devanagiri), Hani, Haryanvi, Hawaiiaans, Hindi, Hmong Daw (Latijn), Ho (Devanagiri), Hongaars, IJslands, Inari Sami, Indonesisch, Interlingua, Inuktitut (Latijn), Iers, Italiaans, Japans, Jaunsari (Devanagiri), Javaans, Kabuverdianu, Kachin (Latijn), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (Cyrillisch), Kara-Kalpak (Latijn), Kashubian, Kazachs (Cyrillisch), Kazachs (Latijn), Khaling, Khasi, K'iche', Koreaans, Korku, Koryak, Kosraean, Kumyk (Cyrillisch), Koerdisch (Arabisch), Koerdisch (Latijn), Kurukh (Devanagiri), Kirgizisch (Cyrillisch), Lakota, Latijn, Litouws, Nedersorbisch, Lule Sami, Luxemburgs, Mahasu Pahari (Devanagiri), Maleis (Latijn), Maltees, Malto (Devanagiri), Manx, Maori, Marathi, Mongools (Cyrillisch), Montenegrijns (Cyrillisch), Montenegrijns (Latijn), Napolitaans, Nepalees, Niuean, Nogay, Noord-Sami (Latijn), Noors, Occitaans, Ossetisch, Pashto, Perzisch, Pools, Portugees, Punjabi (Arabisch), Ripuaria, Roemeens, Reto-Romaans, Russisch, Sadri (Devanagiri), Samoaans (Latijn), Sanskriet (Devanagari), Santali (Devanagiri), Schots, Schots-Gaelisch, Servisch (Latijn), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, Slowaaks, Sloveens, Somalisch (Arabisch), Zuid-Samisch, Spaans, Swahili (Latijn), Zweeds, Tadzjieks (Cyrillisch), Tataars (Latijn), Tetum, Thangmi, Ton gan, Turks, Turkmeens (Latijn), Tuvan, Oppersorbisch, Urdu, Oeigoers (Arabisch), Oezbeeks (Arabisch), Oezbeeks (Cyrillisch), Oezbeeks (Latijn), Volapük, Walser, Welsh, West-Fries, Yucatec Maya, Zhuang, Zulu
- Taal voor handgeschreven tekst: Engels, Chinees (vereenvoudigd), Frans, Duits, Italiaans, Japans, Koreaans, Portugees, Spaans
-
Indeling:
- JPG
- PNG
- BMP
- Grootte: maximaal 20 MB
- Voor PDF-documenten worden alleen de eerste 2,000 pagina's verwerkt.
Uitvoer van model
Als er een document wordt gedetecteerd, geeft het model voor tekstherkenning de volgende informatie als uitvoer:
- Resultaten: een lijst met regels die uit de invoertekst zijn geëxtraheerd.
- Tekst: tekenreeksen met de gedetecteerde tekstregel.
- BoundingBox: vier waarden die het begrenzingsvak voorstellen, beschreven aan de hand van de bovenste en linker posities, in combinatie met de breedte en hoogte.
Limieten
Actie | Limiet | Verlengingsperiode |
---|---|---|
Tekstherkenningsaanroepen (per omgeving) | 480 | 60 seconden |
Gerelateerde informatie
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor