Modèle prédéfini de reconnaissance de texte

Le modèle de reconnaissance de texte prédéfini extrait des mots de documents et d’images et les convertit en flux de caractères lisibles par l’ordinateur. Ils utilisent une reconnaissance optique de caractères (OCR) de pointe pour détecter le texte imprimé et manuscrit dans des images.

Ce modèle traite les fichiers images et documents pour en extraire des lignes de texte imprimé ou manuscrit.

Utiliser dans Power Apps

Le modèle de reconnaissance de texte prédéfini est disponible dans Power Apps en utilisant le composant de reconnaissance de texte. Plus d’informations: Utiliser le composant de reconnaissance du texte dans Power Apps

Utiliser dans Power Automate

Pour plus d’informations sur l’utilisation de ce modèle dans Power Automate, consultez Utiliser le modèle prédéfini de reconnaissance de texte dans Power Automate.

Langues, formats et tailles pris en charge

Les fichiers que vous pouvez analyser avec le modèle de reconnaissance de texte doivent présenter les caractéristiques suivantes :

  • Langue pour le texte d’impression : Afrikaans, Albanais, Angika (Devanagiri), Arabe, Asturien, Awadhi-Hindi (Devanagiri), Azerbaïdjanais (Latin), Bagheli, Basque, Biélorusse (Cyrillique), Biélorusse (Latin), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bosniaque (latin), Brajbha, Breton, Bulgare, Bundeli, Buryat (cyrillique), Catalan, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Chinois (simplifié), Chinois (traditionnel), Cornish, Corse, Crimée Tatar (latin), croate, tchèque, danois, dari, dhimal (devanagiri), dogri (devanagiri), néerlandais, anglais, erzya (cyrillique), estonien, féroïen, fidjien, philippin, finnois, français, frioulan, gagaouze (latin), Galicien, Allemand, Gilbertais, Gondi (Devanagiri), Groenlandais, Gurung (Devanagiri), Créole haïtien, Halbi (Devanagiri), Hani, Haryanvi, Hawaïen, Hindi, Hmong Daw (Latin), Ho (Devanagiri), Hongrois, Islandais, Inari Sami, Indonésien, Interlingua, Inuktitut (Latin), Irlandais, Italien, Japonais, Jaunsari (Devanagiri), Javanais, Kabuverdianu, Kachin (Latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (cyrillique), Kara-Kalpak (latin), Cachoube, Kazakh (cyrillique), Kazakh (latin), Khaling, Khasi, K’iche’, Coréen, Korku, Koryak, Kosraean, Kumyk (cyrillique), kurde (arabe), kurde (latin), kurukh (devanagiri), kirghize (cyrillique), lakota, latin, lituanien, bas sorabe, sami de Lule, luxembourgeois, masu pahari (devanagiri), malais (latin), maltais, malto (devanagiri), manx, maori, marathi, mongol (cyrillique), monténégrin (cyrillique), monténégrin (latin), napolitain, népalais, niuéen, nogay, sami du nord (latin), norvégien, occitan, ossète, pashto, persan, polonais, portugais, punjabi (arabe), riverain, roumain, romanche, russe, sadri (devanagiri), samoan (latin), sanskrit (devanagari), santali (devanagiri), écossais, gaélique écossais, serbe (latin), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, Slovaque, Slovène, Somali (Arabe), Sami du Sud, Espagnol, Swahili (Latin), Suédois, Tadjik (Cyrillique), Tatar (Latin), Tetum, Thangmi, Ton gan, turc, turkmène (latin), tuvan, haut sorabe, ourdou, ouïghour (arabe), ouzbek (arabe), ouzbek (cyrillique), ouzbek (latin), volapük, walser, gallois, Frison occidental, Maya yucatèque, Zhuang, zoulou
  • Langue du texte manuscrit : anglais, chinois (simplifié), français, allemand, italien, japonais, coréen, portugais, espagnol
  • Format :
    • JPG
    • PNG
    • BMP
    • PDF
  • Taille : 20 Mo maximum
  • Pour les documents PDF, seules les 2,000 premières pages sont traitées.

Sortie du modèle

Si un document est détecté, le modèle de reconnaissance de texte renvoie les informations suivantes :

  • Résultats : une liste de lignes extraites du texte d’entrée.
  • Texte : des chaînes contenant les lignes de texte détectées.
  • BoundingBox : quatre valeurs représentant le cadre englobant, décrit par les positions supérieures droite et gauche, puis la hauteur et la largeur.

Limites

Action Limite Période de renouvellement
Appels de reconnaissance de texte (par environnement) 480 60 secondes

Voir aussi

Formation : reconnaître du texte avec AI Builder (module)