Compartir por


Modelo preconstruído de recoñecemento de texto

O modelo preconstruído de recoñecemento de texto extrae palabras de documentos e imaxes e convertelas en fluxos de caracteres lexibles por máquina. Emprega o recoñecemento óptico de caracteres (OCR) de última xeración para detectar texto impreso e escrito a man nas imaxes.

Este modelo procesa imaxes e ficheiros de documentos para extraer liñas de texto impreso ou escrito a man.

Usar en Power Apps

O modelo precompilado de recoñecemento de texto está dispoñible en Power Apps mediante o compoñente de recoñecemento de texto. Máis información: Usar o compoñente de recoñecemento de texto en Power Apps

Usar en Power Automate

Para obter información sobre como usar este modelo en Power Automate, consulte Usar o modelo predefinido de recoñecemento de texto en Power Automate.

Idioma, formato e tamaño compatibles

Os ficheiros que podes dixitalizar co modelo de recoñecemento de texto deben ter estas características:

  • Idioma para o texto impreso: afrikaans, albanés, angika (devanagiri), árabe, asturiano, awadhi-hindi (devanagiri), azerbaiano (latín), bagheli, éuscaro, bielorruso (cirílico), bielorruso (latín), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), bosnio (latín), Brajbha, bretón, búlgaro, Bundeli, Buryat (cirílico), catalán, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), chinés (simplificado), chinés (tradicional), córnico, corso, tártaro de Crimea (latín), croata, checo, danés, dari, dhimal ( Devanagiri), Dogri (Devanagiri), holandés, inglés, erzya (cirílico), estonio, feroés, Fixiano, Filipino, Finlandés, Francés, Friulano, Gagauz (latín), Galego, Alemán, Gilbertés, Gondi (Devanagiri), Groenlandés, Gurung (Devanagiri), Crioulo haitiano, Halbi (Devanagiri), Hani, Haryanvi, Hawaiano, Hindi, Hmong Daw (latín), Ho (Devanagiri), húngaro, islandés, inari sami, indonesio, interlingua, inuktitut (latín), irlandés, Italiano, xaponés, Jaunsari (Devanagiri), xavanés, Kabuverdianu, Kachin (latín), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (cirílico), Kara-Kalpak (latín), Kashubian, Kazakh (cirílico), Kazakh ( latín), Khaling, Khasi, K'iche', coreano, korku, koryak, kosraean, kumyk (cirílico), kurdo (árabe), kurdo (latín), kurukh (devanagiri), kirguiso (cirílico), lakota, latín, lituano, baixosorabo, lule sami, luxemburgués, mahasu pahari (devanagiri), malayo (latín), maltés, malto (devanagiri), manx, maorí, marathi, mongol (cirílico), montenegrino (cirílico), montenegrino (latín), Napolitano, nepalí, niueano, nogay, sami do norte (latín), noruegués, occitano, oseto, paxtú, persa, polaco, portugués, punjabi (árabe), ripuario, romanés, romanche, ruso, sadri (devanagiri), samoano (latín), sánscrito (Devanagari), Santali (Devanagiri), escocés, gaélico escocés, serbio (latín), sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, eslovaco, esloveno, somalí (árabe), sami meridional, español, swahili (latín), sueco, taxico (cirílico), tártaro (latín), tetum, thangmi, tongano, turco, turcomano (latín), Tuvan, alto sorabo, urdú, uigur (árabe), uzbeco (árabe), uzbeco (cirílico), uzbeko (latín), volapük, walser, galés, frisón occidental, maia iucateco, zhuang, zulú
  • Idioma para o texto escrito a man: alemán, chinés (simplificado), coreano, español, francés, italiano, xaponés, portugués e inglés
  • Formato:
    • JPG
    • PNG
    • BMP
    • PDF
  • Tamaño: 20 MB máximo
  • Para os documentos PDF, só se procesan as primeiras 2.000 páxinas.

Saída do modelo

Se se detecta un documento, o modelo de recoñecemento de texto mostra a seguinte información:

  • Resultados: Unha lista de liñas extraídas do texto de entrada.
  • Texto: Cadeas que conteñen a liña de texto detectada.
  • BoundingBox: Catro valores que representan a caixa delimitadora, descrita mediante as posicións superior e esquerda xunto coa súa anchura e altura.

Límites

Acción Límite Período de renovación
Chamadas de recoñecemento de texto (por ambiente) 480 60 segundos

Formación: Recoñecer texto con AI Builder (módulo)