Requisitos y limitaciones para un modelo de procesamiento de documentos

Idiomas compatibles

Modelo para documentos de plantilla fija

Se admiten los siguientes idiomas cuando se entrena un modelo de tratamiento de documentos y se selecciona Documentos de plantilla fija como tipo de documento:

Abaza, abjasio, achenés, acoli, adangme, adiguesio, afar, afrikáans, acano, albanés, algonquino, angika (devanagari), árabe, asturiano, asu (Tanzania), avárico, awadhi-hindi (devanagari), aimara, azerbaiyano (latín), bafia, bagheli, bambara, bashkir, euskera, bielorruso (cirílico), bielorruso (latino), bemba (Zambia), bhojpuri-hindi (devanagari), bikol, bini, bislama, bodo (devanagari), bosnio (latino), brajbha, bretón, búlgaro, bundeli, buriato (cirílico), catalán, cebuano, chamling, chamorro, checheno, chhattisgarhi (devanagari), chiga, chino simplificado, chino tradicional, choctaw, chukot, chuvash, córnico, corso, cree, creek, tártaro de Crimea (latín), croata, cuervo, checo, danés, dargwa, dari, dhimal (devanagari), dogri (devanagari), duala, dungan, neerlandés, efik, inglés, erzya (cirílico), estonio, feroés, fiyiano, filipino, finés, fon, francés, friulano, ga, gagauz (latín), gallego, ganda, gayo, alemán, gilbertés, gondi (devanagari), griego, groenlandés, guaraní, gurung (devanagari), gusii, criollo haitiano, halbi (devanagari), hani, haryanvi, hawaiano, hebreo, herero, hiligaynon, hindi, hmong daw (latín), ho (devanagiri), húngaro, ibano, islandés, igbo, iloko, inari sami, indonesio, ingush, interlingua, inuktitut (latín), irlandés, italiano, japonés, jaunsari (devanagari), javanés, jola-fonyi, kabardiano, kabuverdianu, kachin (latín), kalenjin, kalmyk, kangri (devanagari), kanuri, karachay-balkar, kara-kalpak (cirílico), kara-kalpak (latín), casubio, kazajo (cirílico), kazajo (latín), Khakas, Khaling, Khasi, K'iche', Kikuyu, Kildin Sami, Kinyarwanda, Komi, Kongo, Coreano, Korku, Koryak, Kosraean, Kpelle, Kuanyama, Kumyk (cirílico), Kurdo (árabe), Kurdo (latín), Kurukh (devanagari), kirguís (cirílico), lak, lakota, latín, letón, lezghiano, lingala, lituano, bajo sorabo, lozi, lule sami, luo (Kenia y Tanzania), luxemburgués, luyia luy, macedonio, machame, madurés, mahasu pahari (devanagari), Makhuwa-Meetto, Makonde, malgache, malayo (latín), maltés, malto (devanagari), mandinka, manx, maorí, mapudungun, marathi, mari (ruso), masai, mende (Sierra Leona), meru, meta', minangkabau, mohawk, mongol (cirílico), mongondow, montenegrino (cirílico), montenegrino (latín), morisyen, mundang, náhuatl, navajo, ndonga, napolitano, nepalí, ngomba, niueano, nogai, ndebele septentrional, sami septentrional (latín), noruego, nyanja, nyankole, nzima, occitano, ojibwa, oromo, oseta, pampanga, pangasinán, papiamento, pashto, pedi, persa, polaco, portugués, punjabi (árabe), quechua, ripuariano, rumano, romanche, rundi, ruso, rwa, sadri (devanagari), sajá, samburu, samoano (latín), sango, sangu (gabón), sánscrito (devanagari), santali(devanagiri), escocés, gaélico escocés, sena, serbio (cirílico), serbio (latín), shambala, sherpa (devanagari), shona, siksika, sirmauri (devanagari), skolt sami, eslovaco, esloveno, soga, somalí (árabe), somalí (latín), songhai, ndebele meridional, altai meridional, sami meridional, sotho meridional, español, sundanés, swahili (latín), swati, sueco, tabassaran, tachelhit, tahitiano, taita, tayiko (cirílico), tamil, tártaro (cirílico), tártaro (latín), teso, tetum, tailandés, thangmi, tok pisin, tongano, tsonga, tswana, turco, turcomano (latín), tuvano, udmurt, uigur (cirílico), ucraniano, alto sorabo, urdu, uigur (árabe), uzbeko (árabe), uzbeko (cirílico), uzbeko (latín), vietnamita, volapük, vunjo, walser, galés, frisón occidental, wolof, xhosa, maya yucateco, zapoteco, zarma, zhuang, zulú

Modelo para documentos generales

Se admiten los siguientes idiomas cuando se entrena un modelo de tratamiento de documentos y se selecciona Documentos generales como tipo de documento.

Afrikáans, albanés, árabe, búlgaro, chino (Han (variante simplificada)), chino (Han (variante tradicional)), croata, checo, danés, neerlandés, estonio, finés, francés, alemán, hebreo, hindi, húngaro, indonesio, italiano, japonés, coreano, letón, lituano, macedonio, marathi, griego moderno (1453-), nepalí (macrolengua), noruego, panyabí, persa, polaco, portugués, rumano, ruso, eslovaco, esloveno, somalí (árabe), somalí (latín), español, swahili (macrolengua), sueco, tamil, tailandés, turco, ucraniano, urdu y vietnamita

Requisitos

El procesamiento de documentos trabaja con los documentos introducidos que cumplen los siguientes requisitos:

  • Formato JPG, PNG o PDF (texto o digitalizado). Los archivos PDF de texto insertado son mejores, ya que no habrá ningún error en la ubicación y la extracción de caracteres.
  • Los archivos TIFF no se pueden utilizar para formación. Deberá usar documentos en formato PDF, JPG o PNG para formar un modelo. Una vez que el modelo ha sido formado, puede extraer datos de archivos TIFF cuando el modelo se use en un flujo de nube de Power Automate.
  • Si sus archivos PDF están bloqueados con contraseña, debe eliminar el bloqueo antes de enviarlos.
  • El tamaño máximo del documento a procesar no debe exceder los 20 MB.
  • Para las imágenes, las dimensiones deben estar entre 50 x 50 y 10.000 x 10.000 píxeles.
  • Si están digitalizados de documentos impresos, estos deben ser imágenes de alta calidad.
  • Puede crear hasta 200 colecciones por modelo.
  • En un flujo en la nube, el límite de campos que se pueden etiquetar para el procesamiento de documentos es 300.

Nota

  • Actualmente no se admite la extracción de firmas de documentos.
  • Actualmente no se admiten los campos que se dividen en los límites de la página.
  • Actualmente no se admiten filas que saltan de una página a otra.

Consejo de optimización

Aprenda a mejorar el rendimiento de los modelos de procesamiento de documentos.

Siguiente paso

Crear un modelo de procesamiento de formularios