Modelo precompilado de reconocimiento de texto

El modelo de precompilado de reconocimiento de texto extrae palabras de documentos e imágenes en secuencias de caracteres que puede leer una máquina. Usan el reconocimiento óptico de caracteres (OCR) avanzado para detectar texto impreso y manuscrito en las imágenes.

Este modelo procesa archivos de imágenes y documento para extraer líneas de texto impreso o manuscrito.

Uso en Power Apps

El modelo de reconocimiento de texto precompilado está disponible en Power Apps mediante el componente de reconocedor de texto. Más información: Usar el componente de reconocimiento de texto en Power Apps

Uso en Power Automate

Para obtener información sobre cómo utilizar este modelo en Power Automate, vea Utilizar el modelo precompilado de reconocimiento de texto en Power Automate.

Idioma, formato y tamaño admitidos

Los archivos que puede escanear con el modelo de reconocimiento de texto deben tener estas características:

  • Idioma para imprimir texto: afrikáans, albanés, angika (devanagiri), árabe, asturiano, awadhi-hindi (devanagiri), azerbaiyano (latín), bagheli, vasco, bielorruso (cirílico), bielorruso (latín), bhojpuri-hindi (devanagiri), bislama, bodo (devanagiri), bosnio (latín), brajbha, bretón, búlgaro, bundeli, buriato (cirílico), catalán, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), chino (simplificado), chino (tradicional), de Cornualles, corso, de Crimea Tártaro (latín), croata, checo, danés, dari, dhimal (devanagiri), dogri (devanagiri), holandés, inglés, erzya (cirílico), estonio, feroés, fijiano, filipino, finlandés, francés, friulano, gagauz (latín), gallego, alemán, gilbertés, gondi (Devanagiri), groenlandés, gurung (Devanagiri), criollo haitiano, halbi (Devanagiri), hani, haryanvi, hawaiano, hindi, hmong daw (latín), ho(Devanagiri), húngaro, islandés, Inari Sami, indonesio, interlingua, inuktitut (latín), irlandés, italiano, japonés, jaunsari (devanagiri), javanés, kabuverdianu, kachin (latín), kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (cirílico), Kara-Kalpak (latín), Kashubian, Kazakh (cirílico), Kazakh (latín), Khaling, Khasi, K'iche', coreano, Korku, Koryak, Kosraean, kumyk (cirílico), kurdo (árabe), kurdo (latín), kurukh (devanagiri), kirguís (cirílico), lakota, latín, lituano, bajo sorabo, lule sami, luxemburgués, mahasu pahari (devanagiri), malayo (latín), maltés, malto (devanagiri), manx, maorí, maratí, mongol (cirílico), montenegrino (cirílico), montenegrino (latín), napolitano, nepalí, niueano, nogay, sami septentrional (latín), noruego, occitano, osético, pastún, persa, polaco, portugués, punjabi (árabe), ribereño, rumano, romanche, ruso, sadri (devanagiri), samoano (latín), sánscrito (devanagari), santali (devanagiri), escocés, gaélico escocés, serbio (latín), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, eslovaco, esloveno, somalí (árabe), sami del sur, español, swahili (latín), sueco, tayiko (cirílico), tártaro (latín), tetum, Thangmi, Ton gan, turco, turcomano (latín), tuvan, sorabo superior, urdu, uigur (árabe), uzbeko (árabe), uzbeko (cirílico), uzbeko (latín), volapük, walser, galés, frisón occidental, maya yucateco, zhuang, zulú
  • Idioma para texto escrito a mano: inglés, chino (simplificado), francés, alemán, italiano, japonés, coreano, portugués, español
  • Formato:
    • JPG
    • PNG
    • BMP
    • PDF
  • Tamaño: 20 MB máximo
  • En los documentos PDF, solo se procesan las primeras 2,000 páginas.

Salida de modelo

Si se detecta un documento, el modelo de reconocimiento de texto genera la siguiente información:

  • Resultados: Una lista de líneas extraídas del texto de entrada.
  • Texto: Cadenas que contienen la línea de texto detectada.
  • BoundingBox: Cuatro valores que representan el cuadro de límite, descrito mediante las posiciones superiores e izquierda junto con el ancho y alto.

Límites

Action Límite Periodo de renovación
Llamadas de reconocimiento de texto (por entorno) 480 60 segundos

Consulte también

Formación: reconocer texto con AI Builder (módulo)