Compatibilidad con lenguajes: análisis de documentos

Artículo
01/22/2024

Este contenido se aplica a:v4.0 (versión preliminar) | Versiones anteriores:v3.1 (GA)v3.0 (GA)v2.1 (GA)

Este contenido se aplica a:v3.1 (GA) | Versión más reciente:v4.0 (versión preliminar) | Versiones anteriores:v3.0v2.1

Este contenido se aplica a:v3.0 (GA) | Versiones más recientes:v4.0 (versión preliminar)v3.1 | Versión anterior:v2.1

Este contenido se aplica a:v2.1 | Versión más reciente:v4.0 (versión preliminar)

Los modelos de Documento de inteligencia de Azure AI proporcionan compatibilidad con el procesamiento de documentos en varios idiomas. Nuestras funcionalidades de soporte de idioma permiten a los usuarios comunicarse con sus aplicaciones de forma natural y capacitar al alcance global. Los modelos de análisis de documentos permiten la extracción de texto de formularios y documentos y devuelven contenido estructurado listo para el uso o el progreso de la organización. En las tablas siguientes se enumeran el idioma disponible y la compatibilidad con la configuración regional por modelo y característica:

Lectura: el modelo de lectura permite extraer y analizar texto impreso y manuscrito. Este modelo es el motor de OCR subyacente para otros modelos precompilados de Documento de inteligencia, como los de diseño, documento general, factura, recibo, documento de identidad (ID), tarjeta de seguro médico, documentos fiscales y modelos personalizados. Para más información, veaIntroducción al modelo de lectura

Diseño: el modelo de diseño permite extraer y analizar texto, tablas, estructura de documentos y marcas de selección (como botones de radio y casillas) de formularios y documentos.

Documento general: el modelo de documento general permite extraer y analizar texto, estructura de documentos y pares clave-valor. Para más información, veaIntroducción al modelo de documento general

Nota:

Código de idioma (opcional)

Los modelos universales basados en aprendizaje profundo de Documento de inteligencia extraen todo el texto multilingüe de los documentos, incluidas las líneas de texto con idiomas combinados, y no necesitan que se especifique un código de idioma.
No proporcione el código de idioma como parámetro a menos que esté seguro del idioma y quiera forzar al servicio a aplicar solo el modelo correspondiente. De lo contrario, el servicio puede devolver texto incompleto e incorrecto.
Además, tampoco es necesario especificar una configuración regional. Se trata de un parámetro opcional. La tecnología de aprendizaje profundo de Documento de inteligencia detectará automáticamente el idioma del texto de la imagen.

Modelo de lectura

Id. de modelo: prebuilt-read

En la tabla siguiente se muestra la compatibilidad del lenguaje de modelo de lectura para extraer y analizar texto impreso.

Idioma	Código (opcional)
Abaza	`abq`
Abjasio	`ab`
Achenés	`ace`
Acholí	`ach`
Adangme	`ada`
Adigué	`ady`
Afar	`aa`
Afrikáans	`af`
Akan	`ak`
Albanés	`sq`
Algonquino	`alq`
Angika (devanagari)	`anp`
Árabe	`ar`
Asturiano	`ast`
Asu (Tanzania)	`asa`
Avar	`av`
Awadhi-Hindi (devanagari)	`awa`
Aimara	`ay`
Azerbaiyano (latino)	`az`
Bafia	`ksf`
Bagheli	`bfy`
Bambara	`bm`
Bashkir	`ba`
Vasco	`eu`
Bielorruso (cirílico)	`be`, `be-cyrl`
Bielorruso (latino)	`be`, `be-latn`
Bemba (Zambia)	`bem`
Bena (Tanzania)	`bez`
Bhojpuri-Hindi (devanagari)	`bho`
Bikol	`bik`
Bini	`bin`
Bislama	`bi`
Bodo (devanagari)	`brx`
Bosnio (latino)	`bs`
Brajbha	`bra`
Bretón	`br`
Búlgaro	`bg`
Bundeli	`bns`
Buriato (cirílico)	`bua`
Catalán	`ca`
Cebuano	`ceb`
Chamling	`rab`
Chamorro	`ch`
Checheno	`ce`
Chhattisgarhi (devanagari)	`hne`
Chiga	`cgg`
Chino simplificado	`zh-Hans`
Chino tradicional	`zh-Hant`
Choctaw	`cho`
Chukot	`ckt`
Chuvasio	`cv`
Córnico	`kw`
Corso	`co`
Cree	`cr`
Creek	`mus`
Tártaro de Crimea (Latín)	`crh`
Croata	`hr`
Crow	`cro`
Checo	`cs`
Danés	`da`
Dargwa	`dar`
Dari	`prs`
Dhimal (devanagari)	`dhi`
Dogri (devanagari)	`doi`
Duala	`dua`
Dungano	`dng`
Neerlandés	`nl`
Efik	`efi`
English	`en`
Erzya (cirílico)	`myv`
Estonio	`et`
Feroés	`fo`
Fiyiano	`fj`
Filipino	`fil`
Finés	`fi`

Lenguaje	Código (opcional)
`Fon`	`fon`
Francés	`fr`
Friulano	`fur`
`Ga`	`gaa`
Gagauzo (latino)	`gag`
Gallego	`gl`
Ganda	`lg`
Gayo	`gay`
Alemán	`de`
Gilbertés	`gil`
Gondi (devanagari)	`gon`
Griego	`el`
Groenlandés	`kl`
Guaraní	`gn`
Gurung (devanagari)	`gvr`
Gusii	`guz`
Criollo haitiano	`ht`
Halbi (devanagari)	`hlb`
Hani	`hni`
Haryanvi	`bgc`
Hawaiano	`haw`
Hebreo	`he`
Herero	`hz`
Hiligaynon	`hil`
Hindi	`hi`
Hmong Daw (Latín)	`mww`
Ho (devanagiri)	`hoc`
Húngaro	`hu`
Iban	`iba`
Islandés	`is`
Igbo	`ig`
Ilocano	`ilo`
Sami inari	`smn`
Indonesio	`id`
Ingusetio	`inh`
Interlingua	`ia`
Inuktitut (latino)	`iu`
Irlandés	`ga`
Italiano	`it`
Japonés	`ja`
Jaunsari (devanagari)	`Jns`
Javanés	`jv`
Jola-fonyi	`dyo`
Cabardiano	`kbd`
Caboverdiano	`kea`
Kachin (Latín)	`kac`
Kalenjin	`kln`
Calmuco	`xal`
Kangri (devanagari)	`xnr`
Kanuri	`kr`
Karachái-bálkaro	`krc`
Karakalpako (cirílico)	`kaa-cyrl`
Karakalpako (latino)	`kaa`
Casubio	`csb`
Kazajo (cirílico)	`kk-cyrl`
Kazajo (latino)	`kk-latn`
Jakasio	`kjh`
Khaling	`klr`
Khasi	`kha`
Quiché	`quc`
Kikuyu	`ki`
Sami kildin	`sjd`
Kinyarwanda	`rw`
Komi	`kv`
Kongo	`kg`
Coreano	`ko`
Korku	`kfq`
Koriakia	`kpy`
Kosreano	`kos`
Kpelle	`kpe`
Kuanyama	`kj`
Cumuco (cirílico)	`kum`
Kurdo (árabe)	`ku-arab`
Kurdo (latino)	`ku-latn`
Kurukh (devanagari)	`kru`
Kirguís (cirílico)	`ky`
`Lak`	`lbe`
Lakota	`lkt`

Lenguaje	Código (opcional)
Latín	`la`
Letón	`lv`
Lezgiano	`lex`
Lingala	`ln`
Lituano	`lt`
Bajo sorbio	`dsb`
Lozi	`loz`
Sami lule	`smj`
Luo (Kenia y Tanzania)	`luo`
Luxemburgués	`lb`
Luyia	`luy`
Macedonio	`mk`
Machame	`jmc`
Madureso	`mad`
Mahasu Pahari (devanagari)	`bfz`
Makhuwa-meetto	`mgh`
Makonde	`kde`
Malgache	`mg`
Malayo (latino)	`ms`
Maltés	`mt`
Malto (devanagari)	`kmj`
Mandinká	`mnk`
Manx	`gv`
Maorí	`mi`
Mapuche	`arn`
Maratí	`mr`
Mari (Rusia)	`chm`
Masái	`mas`
Mende (Sierra Leona)	`men`
Meru	`mer`
Meta'	`mgo`
Minangkabau	`min`
Mohawk	`moh`
Mongol (cirílico)	`mn`
Mongondow	`mog`
Montenegrino (cirílico)	`cnr-cyrl`
Montenegrino (latino)	`cnr-latn`
Mauriciano	`mfe`
Mundang	`mua`
Náhuatl	`nah`
Navajo	`nv`
Ndonga	`ng`
Napolitano	`nap`
Nepalí	`ne`
Ngomba	`jgo`
Niueano	`niu`
Nogayo	`nog`
Ndebele septentrional	`nd`
Sami septentrional (latino)	`sme`
Noruego	`no`
Nyanja	`ny`
Nyankole	`nyn`
Nzima	`nzi`
Occitano	`oc`
Ojibwa	`oj`
Oromo	`om`
Osetio	`os`
Pampango	`pam`
Pangasinense	`pag`
Papiamento	`pap`
Pastún	`ps`
Pedi	`nso`
Persa	`fa`
Polaco	`pl`
Portugués	`pt`
Punyabí (árabe)	`pa`
Quechua	`qu`
Ripuario	`ksh`
Rumano	`ro`
Romanche	`rm`
Rundi	`rn`
Ruso	`ru`
`Rwa`	`rwk`
Sadri (devanagari)	`sck`
Sakha	`sah`
Samburu	`saq`
Samoano (latino)	`sm`
Sango	`sg`

Lenguaje	Código (opcional)
Sangu (Gabón)	`snq`
Sánscrito (Devanagari)	`sa`
Santali (devanagiri)	`sat`
Escocés	`sco`
Gaélico escocés	`gd`
Sena	`seh`
Serbio (cirílico)	`sr-cyrl`
Serbio (latino)	`sr`, s`r-latn`
Shambala	`ksb`
Shona	`sn`
Siksiká	`bla`
Sirmauri (devanagari)	`srx`
Sami skolt	`sms`
Eslovaco	`sk`
Esloveno	`sl`
Soga	`xog`
Somalí (árabe)	`so`
Somalí (latino)	`so-latn`
Songhay	`son`
Ndebele meridional	`nr`
Altaico del Sur	`alt`
Sami meridional	`sma`
Sotho meridional	`st`
Español	`es`
Sundanés	`su`
Swahili (Latín)	`sw`
Swati	`ss`
Sueco	`sv`
Tabassaran	`tab`
Tashelhit	`shi`
Tahitiano	`ty`
Taita	`dav`
Tayiko (cirílico)	`tg`
Tamil	`ta`
Tártaro (cirílico)	`tt-cyrl`
Tártaro (Latín)	`tt`
Teso	`teo`
Tetum	`tet`
Tailandés	`th`
Thangmi	`thf`
Tok Pisin	`tpi`
Tongano	`to`
Tsonga	`ts`
Tswana	`tn`
Turco	`tr`
Turcomano (latino)	`tk`
Tuvano	`tyv`
Udmurto	`udm`
Uigur (cirílico)	`ug-cyrl`
Ucraniano	`uk`
Alto sorbio	`hsb`
Urdu	`ur`
Uigur (árabe)	`ug`
Uzbeko (árabe)	`uz-arab`
Uzbeko (cirílico)	`uz-cyrl`
Uzbeko (latino)	`uz`
Vietnamita	`vi`
Volapük	`vo`
Vunjo	`vun`
Walser	`wae`
Galés	`cy`
Frisón occidental	`fy`
Wolof	`wo`
Xhosa	`xh`
Maya Yucateco	`yua`
Zapoteco	`zap`
Zarma	`dje`
Zhuang	`za`
Zulú	`zu`

En la tabla siguiente se muestra la compatibilidad del lenguaje de modelo de lectura para extraer y analizar texto impreso.

Idioma	Código (opcional)
Afrikáans	`af`
Angika	`anp`
Árabe	`ar`
Asturiano	`ast`
Awadhi	`awa`
Azerbaiyano	`az`
Bielorruso (cirílico)	`be`, `be-cyrl`
Bielorruso (latino)	`be-latn`
Bagheli	`bfy`
Mahasu Pahari	`bfz`
Búlgaro	`bg`
Haryanvi	`bgc`
Bhojpuri	`bho`
Bislama	`bi`
Bundeli	`bns`
Bretón	`br`
Braj	`bra`
Bodo	`brx`
Bosnio	`bs`
Buriat	`bua`
Catalán	`ca`
Cebuano	`ceb`
Chamorro	`ch`
Montenegrino (latino)	`cnr`, `cnr-latn`
Montenegrino (cirílico)	`cnr-cyrl`
Corso	`co`
Tártaro de Crimea	`crh`
Checo	`cs`
Casubio	`csb`
Galés	`cy`
Danés	`da`
Alemán	`de`
Dhimal	`dhi`
Dogri	`doi`
Bajo sorbio	`dsb`
English	`en`
Español	`es`
Estonio	`et`
Vasco	`eu`
Persa	`fa`
Finés	`fi`
Filipino	`fil`

Lenguaje	Código (opcional)
Fiyiano	`fj`
Feroés	`fo`
Francés	`fr`
Friulano	`fur`
Frisón occidental	`fy`
Irlandés	`ga`
Gagauz	`gag`
Gaélico escocés	`gd`
Gilbertés	`gil`
Gallego	`gl`
Gondi	`gon`
Manx	`gv`
Gurung	`gvr`
Hawaiano	`haw`
Hindi	`hi`
Halbi	`hlb`
Chhattisgarhi	`hne`
Hani	`hni`
`Ho`	`hoc`
Croata	`hr`
Alto sorbio	`hsb`
Haitiano	`ht`
Húngaro	`hu`
Interlingua	`ia`
Indonesio	`id`
Islandés	`is`
Italiano	`it`
Inuktitut	`iu`
Japonés
Jaunsari	`jns`
Javanés	`jv`
Karakalpako (latino)	`kaa`, `kaa-latn`
Karakalpako (cirílico)	`kaa-cyrl`
Kachin	`kac`
Caboverdiano	`kea`
Korku	`kfq`
Khasi	`kha`
Kazajo (latino)	`kk`, `kk-latn`
Kazajo (cirílico)	`kk-cyrl`
Kalaallisut	`kl`
Khaling	`klr`
Malto	`kmj`

Lenguaje	Código (opcional)
Coreano
Kosreano	`kos`
Koriakia	`kpy`
Karachái-bálkaro	`krc`
Kurukh	`kru`
Kölsch	`ksh`
Kurdo (latino)	`ku`, `ku-latn`
Kurdo (árabe)	`ku-arab`
Kumyk	`kum`
Córnico	`kw`
Kirguís	`ky`
Latín	`la`
Luxemburgués	`lb`
Lakota	`lkt`
Lituano	`lt`
Maorí	`mi`
Mongol	`mn`
Maratí	`mr`
Malayo	`ms`
Maltés	`mt`
Hmong `Daw`	`mww`
Erzya	`myv`
Napolitano	`nap`
Nepalí	`ne`
Niueano	`niu`
Neerlandés	`nl`
Noruego	`no`
Nogai	`nog`
Occitano	`oc`
Osetia	`os`
Panyabí	`pa`
Polaco	`pl`
Dari	`prs`
Pushto	`ps`
Portugués	`pt`
Quiché	`quc`
Camling	`rab`
Romanche	`rm`
Rumano	`ro`
Ruso	`ru`
Sánscrito	`sa`
Santali	`sat`

Lenguaje	Código (opcional)
Sadri	`sck`
Escocés	`sco`
Eslovaco	`sk`
Esloveno	`sl`
Samoano	`sm`
Sami meridional	`sma`
Sami septentrional	`sme`
Sami lule	`smj`
Sami inari	`smn`
Sami skolt	`sms`
Somalí	`so`
Albanés	`sq`
Serbio (latino)	`sr`, `sr-latn`
Sirmauri	`srx`
Sueco	`sv`
Swahili	`sw`
Tetum	`tet`
Tayiko	`tg`
Thangmi	`thf`
Turcomano	`tk`
Tonga	`to`
Turco	`tr`
Tártaro	`tt`
Tuvinian	`tyv`
Uighur	`ug`
Urdu	`ur`
Uzbeko (latino)	`uz`, `uz-latn`
Uzbeko (cirílico)	`uz-cyrl`
Uzbeko (árabe)	`uz-arab`
Volapük	`vo`
Walser	`wae`
Kangri	`xnr`
Yucateco	`yua`
Zhuang	`za`
Chino (Han (variante simplificada))	`zh`, `zh-hans`
Chino (Han (variante tradicional))	`zh-hant`
Zulú	`zu`

En la tabla siguiente se muestra la compatibilidad del lenguaje de modelo de lectura para extraer y analizar texto manuscrito.

Idioma	Código de idioma (opcional)	Lenguaje	Código de idioma (opcional)
Inglés	`en`	Japonés	`ja`
Chino simplificado	`zh-Hans`	Coreano	`ko`
Francés	`fr`	Portugués	`pt`
Alemán	`de`	Español	`es`
Italiano	`it`	Ruso (versión preliminar)	`ru`
Tailandés (versión preliminar)	`th`	Árabe (versión preliminar)	`ar`

En la tabla siguiente se muestra la compatibilidad del lenguaje de modelo de lectura para extraer y analizar texto manuscrito.

Idioma	Código de idioma (opcional)	Lenguaje	Código de idioma (opcional)
Inglés	`en`	Japonés	`ja`
Chino simplificado	`zh-Hans`	Coreano	`ko`
Francés	`fr`	Portugués	`pt`
Alemán	`de`	Español	`es`
Italiano	`it`

En la tabla siguiente se muestra la compatibilidad del lenguaje de modelo de lectura para extraer y analizar texto manuscrito.

Idioma	Código de idioma (opcional)	Lenguaje	Código de idioma (opcional)
Inglés	`en`	Japonés	`ja`
Chino simplificado	`zh-Hans`	Coreano	`ko`
Francés	`fr`	Portugués	`pt`
Alemán	`de`	Español	`es`
Italiano	`it`

La API del modelo de lectura admite la detección de idiomas de los siguientes idiomas en los documentos. Esta lista puede incluir idiomas que no se admiten actualmente para la extracción de texto.

Importante

Detección de idioma

El modelo de lectura de Documento de inteligencia puede detectar la presencia de idiomas y devolver códigos de idioma para los idiomas detectados.

Idiomas detectados frente a idiomas extraídos

En esta sección se enumeran los idiomas que se pueden detectar desde los documentos mediante el modelo De lectura, si está presente.
Tenga en cuenta que esta lista difiere de la lista de idiomas de los que se admite la extracción de texto, que se especifica en las secciones anteriores para cada modelo.

Idioma	Código
Afrikáans	`af`
Albanés	`sq`
Amárico	`am`
Árabe	`ar`
Armenio	`hy`
Asamés	`as`
Azerbaiyano	`az`
Vasco	`eu`
Bielorruso	`be`
Bengalí	`bn`
Bosnio	`bs`
Búlgaro	`bg`
Birmano	`my`
Catalán	`ca`
Camboyano	`km`
Chino	`zh`
Chino simplificado	`zh_chs`
Chino tradicional	`zh_cht`
Corso	`co`
Croata	`hr`
Checo	`cs`
Danés	`da`
Dari	`prs`
Divehi	`dv`
Neerlandés	`nl`
Inglés	`en`
Esperanto	`eo`
Estonio	`et`
Fiyiano	`fj`
Finés	`fi`
Francés	`fr`
Gallego	`gl`
Georgiano	`ka`
Alemán	`de`
Griego	`el`
Gujarati	`gu`
Haitiano	`ht`
Hausa	`ha`
Hebreo	`he`
Hindi	`hi`
Hmong Daw	`mww`
Húngaro	`hu`
Islandés	`is`
Igbo	`ig`
Indonesio	`id`
Inuktitut	`iu`
Irlandés	`ga`
Italiano	`it`
Japonés	`ja`
Javanés	`jv`
Canarés	`kn`
Kazajo	`kk`
Kinyarwanda	`rw`
Kirguís	`ky`
Coreano	`ko`
Kurdo	`ku`
Lao	`lo`
Latín	`la`

Idioma	Código
Letón	`lv`
Lituano	`lt`
Luxemburgués	`lb`
Macedonio	`mk`
Malgache	`mg`
Malayo	`ms`
Malayalam	`ml`
Maltés	`mt`
Maori	`mi`
Maratí	`mr`
Mongol	`mn`
Nepalí	`ne`
Noruego	`no`
Noruego nynorsk	`nn`
Odia	`or`
Pastún	`ps`
Persa	`fa`
Polaco	`pl`
Portugués	`pt`
Punjabi	`pa`
Otomí Querétaro	`otq`
Rumano	`ro`
Ruso	`ru`
Samoano	`sm`
Serbio	`sr`
Shona	`sn`
Sindhi	`sd`
Cingalés	`si`
Eslovaco	`sk`
Esloveno	`sl`
Somalí	`so`
Español	`es`
Sundanés	`su`
Swahili	`sw`
Sueco	`sv`
Tagalo	`tl`
Tahitiano	`ty`
Tayiko	`tg`
Tamil	`ta`
Tatar	`tt`
Telugu	`te`
Tailandés	`th`
Tibetano	`bo`
Tigriña	`ti`
Tongano	`to`
Turco	`tr`
Turcomano	`tk`
Ucraniano	`uk`
Urdu	`ur`
Uzbeko	`uz`
Vietnamita	`vi`
Galés	`cy`
Xhosa	`xh`
Yidis	`yi`
Yoruba	`yo`
Maya Yucateco	`yua`
Zulú	`zu`

Layout

En la tabla siguiente se enumeran los idiomas compatibles para texto impreso:

Lenguaje	Código (opcional)
Abaza	`abq`
Abjasio	`ab`
Achenés	`ace`
Acholí	`ach`
Adangme	`ada`
Adigué	`ady`
Afar	`aa`
Afrikáans	`af`
Akan	`ak`
Albanés	`sq`
Algonquino	`alq`
Angika (devanagari)	`anp`
Árabe	`ar`
Asturiano	`ast`
Asu (Tanzania)	`asa`
Avar	`av`
Awadhi-Hindi (devanagari)	`awa`
Aimara	`ay`
Azerbaiyano (latino)	`az`
Bafia	`ksf`
Bagheli	`bfy`
Bambara	`bm`
Bashkir	`ba`
Vasco	`eu`
Bielorruso (cirílico)	`be`, `be-cyrl`
Bielorruso (latino)	`be`, `be-latn`
Bemba (Zambia)	`bem`
Bena (Tanzania)	`bez`
Bhojpuri-Hindi (devanagari)	`bho`
Bikol	`bik`
Bini	`bin`
Bislama	`bi`
Bodo (devanagari)	`brx`
Bosnio (latino)	`bs`
Brajbha	`bra`
Bretón	`br`
Búlgaro	`bg`
Bundeli	`bns`
Buriato (cirílico)	`bua`
Catalán	`ca`
Cebuano	`ceb`
Chamling	`rab`
Chamorro	`ch`
Checheno	`ce`
Chhattisgarhi (devanagari)	`hne`
Chiga	`cgg`
Chino simplificado	`zh-Hans`
Chino tradicional	`zh-Hant`
Choctaw	`cho`
Chukot	`ckt`
Chuvasio	`cv`
Córnico	`kw`
Corso	`co`
Cree	`cr`
Creek	`mus`
Tártaro de Crimea (Latín)	`crh`
Croata	`hr`
Crow	`cro`
Checo	`cs`
Danés	`da`
Dargwa	`dar`
Dari	`prs`
Dhimal (devanagari)	`dhi`
Dogri (devanagari)	`doi`
Duala	`dua`
Dungano	`dng`
Neerlandés	`nl`
Efik	`efi`
English	`en`
Erzya (cirílico)	`myv`
Estonio	`et`
Feroés	`fo`
Fiyiano	`fj`
Filipino	`fil`
Finés	`fi`

Lenguaje	Código (opcional)
`Fon`	`fon`
Francés	`fr`
Friulano	`fur`
`Ga`	`gaa`
Gagauzo (latino)	`gag`
Gallego	`gl`
Ganda	`lg`
Gayo	`gay`
Alemán	`de`
Gilbertés	`gil`
Gondi (devanagari)	`gon`
Griego	`el`
Groenlandés	`kl`
Guaraní	`gn`
Gurung (devanagari)	`gvr`
Gusii	`guz`
Criollo haitiano	`ht`
Halbi (devanagari)	`hlb`
Hani	`hni`
Haryanvi	`bgc`
Hawaiano	`haw`
Hebreo	`he`
Herero	`hz`
Hiligaynon	`hil`
Hindi	`hi`
Hmong Daw (Latín)	`mww`
Ho (devanagiri)	`hoc`
Húngaro	`hu`
Iban	`iba`
Islandés	`is`
Igbo	`ig`
Ilocano	`ilo`
Sami inari	`smn`
Indonesio	`id`
Ingusetio	`inh`
Interlingua	`ia`
Inuktitut (latino)	`iu`
Irlandés	`ga`
Italiano	`it`
Japonés	`ja`
Jaunsari (devanagari)	`Jns`
Javanés	`jv`
Jola-fonyi	`dyo`
Cabardiano	`kbd`
Caboverdiano	`kea`
Kachin (Latín)	`kac`
Kalenjin	`kln`
Calmuco	`xal`
Kangri (devanagari)	`xnr`
Kanuri	`kr`
Karachái-bálkaro	`krc`
Karakalpako (cirílico)	`kaa-cyrl`
Karakalpako (latino)	`kaa`
Casubio	`csb`
Kazajo (cirílico)	`kk-cyrl`
Kazajo (latino)	`kk-latn`
Jakasio	`kjh`
Khaling	`klr`
Khasi	`kha`
Quiché	`quc`
Kikuyu	`ki`
Sami kildin	`sjd`
Kinyarwanda	`rw`
Komi	`kv`
Kongo	`kg`
Coreano	`ko`
Korku	`kfq`
Koriakia	`kpy`
Kosreano	`kos`
Kpelle	`kpe`
Kuanyama	`kj`
Cumuco (cirílico)	`kum`
Kurdo (árabe)	`ku-arab`
Kurdo (latino)	`ku-latn`

Lenguaje	Código (opcional)
Kurukh (devanagari)	`kru`
Kirguís (cirílico)	`ky`
`Lak`	`lbe`
Lakota	`lkt`
Latín	`la`
Letón	`lv`
Lezgiano	`lex`
Lingala	`ln`
Lituano	`lt`
Bajo sorbio	`dsb`
Lozi	`loz`
Sami lule	`smj`
Luo (Kenia y Tanzania)	`luo`
Luxemburgués	`lb`
Luyia	`luy`
Macedonio	`mk`
Machame	`jmc`
Madureso	`mad`
Mahasu Pahari (devanagari)	`bfz`
Makhuwa-meetto	`mgh`
Makonde	`kde`
Malgache	`mg`
Malayo (latino)	`ms`
Maltés	`mt`
Malto (devanagari)	`kmj`
Mandinká	`mnk`
Manx	`gv`
Maorí	`mi`
Mapuche	`arn`
Maratí	`mr`
Mari (Rusia)	`chm`
Masái	`mas`
Mende (Sierra Leona)	`men`
Meru	`mer`
Meta'	`mgo`
Minangkabau	`min`
Mohawk	`moh`
Mongol (cirílico)	`mn`
Mongondow	`mog`
Montenegrino (cirílico)	`cnr-cyrl`
Montenegrino (latino)	`cnr-latn`
Mauriciano	`mfe`
Mundang	`mua`
Náhuatl	`nah`
Navajo	`nv`
Ndonga	`ng`
Napolitano	`nap`
Nepalí	`ne`
Ngomba	`jgo`
Niueano	`niu`
Nogayo	`nog`
Ndebele septentrional	`nd`
Sami septentrional (latino)	`sme`
Noruego	`no`
Nyanja	`ny`
Nyankole	`nyn`
Nzima	`nzi`
Occitano	`oc`
Ojibwa	`oj`
Oromo	`om`
Osetio	`os`
Pampango	`pam`
Pangasinense	`pag`
Papiamento	`pap`
Pastún	`ps`
Pedi	`nso`
Persa	`fa`
Polaco	`pl`
Portugués	`pt`
Punyabí (árabe)	`pa`
Quechua	`qu`
Ripuario	`ksh`
Rumano	`ro`
Romanche	`rm`
Rundi	`rn`
Ruso	`ru`

Lenguaje	Código (opcional)
`Rwa`	`rwk`
Sadri (devanagari)	`sck`
Sakha	`sah`
Samburu	`saq`
Samoano (latino)	`sm`
Sango	`sg`
Sangu (Gabón)	`snq`
Sánscrito (Devanagari)	`sa`
Santali (devanagiri)	`sat`
Escocés	`sco`
Gaélico escocés	`gd`
Sena	`seh`
Serbio (cirílico)	`sr-cyrl`
Serbio (latino)	`sr`, `sr-latn`
Shambala	`ksb`
Shona	`sn`
Siksiká	`bla`
Sirmauri (devanagari)	`srx`
Sami skolt	`sms`
Eslovaco	`sk`
Esloveno	`sl`
Soga	`xog`
Somalí (árabe)	`so`
Somalí (latino)	`so-latn`
Songhay	`son`
Ndebele meridional	`nr`
Altaico del Sur	`alt`
Sami meridional	`sma`
Sotho meridional	`st`
Español	`es`
Sundanés	`su`
Swahili (Latín)	`sw`
Swati	`ss`
Sueco	`sv`
Tabassaran	`tab`
Tashelhit	`shi`
Tahitiano	`ty`
Taita	`dav`
Tayiko (cirílico)	`tg`
Tamil	`ta`
Tártaro (cirílico)	`tt-cyrl`
Tártaro (Latín)	`tt`
Teso	`teo`
Tetum	`tet`
Tailandés	`th`
Thangmi	`thf`
Tok Pisin	`tpi`
Tongano	`to`
Tsonga	`ts`
Tswana	`tn`
Turco	`tr`
Turcomano (latino)	`tk`
Tuvano	`tyv`
Udmurto	`udm`
Uigur (cirílico)	`ug-cyrl`
Ucraniano	`uk`
Alto sorbio	`hsb`
Urdu	`ur`
Uigur (árabe)	`ug`
Uzbeko (árabe)	`uz-arab`
Uzbeko (cirílico)	`uz-cyrl`
Uzbeko (latino)	`uz`
Vietnamita	`vi`
Volapük	`vo`
Vunjo	`vun`
Walser	`wae`
Galés	`cy`
Frisón occidental	`fy`
Wolof	`wo`
Xhosa	`xh`
Maya Yucateco	`yua`
Zapoteco	`zap`
Zarma	`dje`
Zhuang	`za`
Zulú	`zu`

En la tabla siguiente se muestra la compatibilidad del lenguaje de modelo de diseño para extraer y analizar texto impreso.

Lenguaje	Código (opcional)
Afrikáans	`af`
Angika	`anp`
Árabe	`ar`
Asturiano	`ast`
Awadhi	`awa`
Azerbaiyano	`az`
Bielorruso (cirílico)	`be`, `be-cyrl`
Bielorruso (latino)	`be-latn`
Bagheli	`bfy`
Mahasu Pahari	`bfz`
Búlgaro	`bg`
Haryanvi	`bgc`
Bhojpuri	`bho`
Bislama	`bi`
Bundeli	`bns`
Bretón	`br`
Braj	`bra`
Bodo	`brx`
Bosnio	`bs`
Buriat	`bua`
Catalán	`ca`
Cebuano	`ceb`
Chamorro	`ch`
Montenegrino (latino)	`cnr`, `cnr-latn`
Montenegrino (cirílico)	`cnr-cyrl`
Corso	`co`
Tártaro de Crimea	`crh`
Checo	`cs`
Casubio	`csb`
Galés	`cy`
Danés	`da`
Alemán	`de`
Dhimal	`dhi`
Dogri	`doi`
Bajo sorbio	`dsb`
English	`en`
Español	`es`
Estonio	`et`
Vasco	`eu`
Persa	`fa`
Finés	`fi`
Filipino	`fil`

Lenguaje	Código (opcional)
Fiyiano	`fj`
Feroés	`fo`
Francés	`fr`
Friulano	`fur`
Frisón occidental	`fy`
Irlandés	`ga`
Gagauz	`gag`
Gaélico escocés	`gd`
Gilbertés	`gil`
Gallego	`gl`
Gondi	`gon`
Manx	`gv`
Gurung	`gvr`
Hawaiano	`haw`
Hindi	`hi`
Halbi	`hlb`
Chhattisgarhi	`hne`
Hani	`hni`
`Ho`	`hoc`
Croata	`hr`
Alto sorbio	`hsb`
Haitiano	`ht`
Húngaro	`hu`
Interlingua	`ia`
Indonesio	`id`
Islandés	`is`
Italiano	`it`
Inuktitut	`iu`
Japonés
Jaunsari	`jns`
Javanés	`jv`
Karakalpako (latino)	`kaa`, `kaa-latn`
Karakalpako (cirílico)	`kaa-cyrl`
Kachin	`kac`
Caboverdiano	`kea`
Korku	`kfq`
Khasi	`kha`
Kazajo (latino)	`kk`, `kk-latn`
Kazajo (cirílico)	`kk-cyrl`
Kalaallisut	`kl`
Khaling	`klr`
Malto	`kmj`

Lenguaje	Código (opcional)
Coreano
Kosreano	`kos`
Koriakia	`kpy`
Karachái-bálkaro	`krc`
Kurukh	`kru`
Kölsch	`ksh`
Kurdo (latino)	`ku`, `ku-latn`
Kurdo (árabe)	`ku-arab`
Kumyk	`kum`
Córnico	`kw`
Kirguís	`ky`
Latín	`la`
Luxemburgués	`lb`
Lakota	`lkt`
Lituano	`lt`
Maorí	`mi`
Mongol	`mn`
Maratí	`mr`
Malayo	`ms`
Maltés	`mt`
Hmong `Daw`	`mww`
Erzya	`myv`
Napolitano	`nap`
Nepalí	`ne`
Niueano	`niu`
Neerlandés	`nl`
Noruego	`no`
Nogai	`nog`
Occitano	`oc`
Osetia	`os`
Panyabí	`pa`
Polaco	`pl`
Dari	`prs`
Pushto	`ps`
Portugués	`pt`
Quiché	`quc`
Camling	`rab`
Romanche	`rm`
Rumano	`ro`
Ruso	`ru`
Sánscrito	`sa`
Santali	`sat`

Lenguaje	Código (opcional)
Sadri	`sck`
Escocés	`sco`
Eslovaco	`sk`
Esloveno	`sl`
Samoano	`sm`
Sami meridional	`sma`
Sami septentrional	`sme`
Sami lule	`smj`
Sami inari	`smn`
Sami skolt	`sms`
Somalí	`so`
Albanés	`sq`
Serbio (latino)	`sr`, `sr-latn`
Sirmauri	`srx`
Sueco	`sv`
Swahili	`sw`
Tetum	`tet`
Tayiko	`tg`
Thangmi	`thf`
Turcomano	`tk`
Tonga	`to`
Turco	`tr`
Tártaro	`tt`
Tuvinian	`tyv`
Uighur	`ug`
Urdu	`ur`
Uzbeko (latino)	`uz`, `uz-latn`
Uzbeko (cirílico)	`uz-cyrl`
Uzbeko (árabe)	`uz-arab`
Volapük	`vo`
Walser	`wae`
Kangri	`xnr`
Yucateco	`yua`
Zhuang	`za`
Chino (Han (variante simplificada))	`zh`, `zh-hans`
Chino (Han (variante tradicional))	`zh-hant`
Zulú	`zu`

Idioma	Código de lenguaje
Afrikáans	`af`
Albanés	`sq`
Asturiano	`ast`
Vasco	`eu`
Bislama	`bi`
Bretón	`br`
Catalán	`ca`
Cebuano	`ceb`
Chamorro	`ch`
Chino (simplificado)	`zh-Hans`
Chino (tradicional)	`zh-Hant`
Córnico	`kw`
Corso	`co`
Tártaro de Crimea (Latín)	`crh`
Checo	`cs`
Danés	`da`
Neerlandés	`nl`
Inglés (impreso y manuscrito)	`en`
Estonio	`et`
Fiyiano	`fj`
Filipino	`fil`
Finés	`fi`
Francés	`fr`
Friulano	`fur`
Gallego	`gl`
Alemán	`de`
Gilbertés	`gil`
Groenlandés	`kl`
Criollo haitiano	`ht`
Hani	`hni`
Hmong Daw (Latín)	`mww`
Húngaro	`hu`
Indonesio	`id`
Interlingua	`ia`
Inuktitut (latino)	`iu`
Irlandés	`ga`

Idioma	Código de lenguaje
Italiano	`it`
Japonés	`ja`
Javanés	`jv`
Quiché	`quc`
Caboverdiano	`kea`
Kachin (Latín)	`kac`
Kara-Kalpak	`kaa`
Casubio	`csb`
Khasi	`kha`
Coreano	`ko`
Kurdo (latino)	`kur`
Luxemburgués	`lb`
Malayo (latino)	`ms`
Manx	`gv`
Napolitano	`nap`
Noruego	`no`
Occitano	`oc`
Polaco	`pl`
Portugués	`pt`
Romanche	`rm`
Escocés	`sco`
Gaélico escocés	`gd`
Esloveno	`slv`
Español	`es`
Swahili (Latín)	`sw`
Sueco	`sv`
Tártaro (Latín)	`tat`
Tetum	`tet`
Turco	`tr`
Alto sorbio	`hsb`
Uzbeko (latino)	`uz`
Volapük	`vo`
Walser	`wae`
Frisón occidental	`fy`
Maya Yucateco	`yua`
Zhuang	`za`
Zulú	`zu`

En la tabla siguiente se muestra la compatibilidad del lenguaje de modelo de diseño para extraer y analizar texto manuscrito.

Idioma	Código de idioma (opcional)	Lenguaje	Código de idioma (opcional)
Inglés	`en`	Japonés	`ja`
Chino simplificado	`zh-Hans`	Coreano	`ko`
Francés	`fr`	Portugués	`pt`
Alemán	`de`	Español	`es`
Italiano	`it`	Ruso (versión preliminar)	`ru`
Tailandés (versión preliminar)	`th`	Árabe (versión preliminar)	`ar`

Id. de modelo: prebuilt-layout

En la tabla siguiente se muestra la compatibilidad del lenguaje de modelo de diseño para extraer y analizar texto manuscrito.

Idioma	Código de idioma (opcional)	Lenguaje	Código de idioma (opcional)
Inglés	`en`	Japonés	`ja`
Chino simplificado	`zh-Hans`	Coreano	`ko`
Francés	`fr`	Portugués	`pt`
Alemán	`de`	Español	`es`
Italiano	`it`

Nota:

Documento de inteligencia v2.1 no admite la extracción de texto manuscrito.

En la tabla siguiente se muestra la compatibilidad del lenguaje de modelo de diseño para extraer y analizar texto manuscrito.

Idioma	Código de idioma (opcional)	Lenguaje	Código de idioma (opcional)
Inglés	`en`	Japonés	`ja`
Chino simplificado	`zh-Hans`	Coreano	`ko`
Francés	`fr`	Portugués	`pt`
Alemán	`de`	Español	`es`
Italiano	`it`	Ruso (versión preliminar)	`ru`
Tailandés (versión preliminar)	`th`	Árabe (versión preliminar)	`ar`

Documento general

Importante

Con La inteligencia de documentos v4.0:2024-02-29-preview, 2023-10-31-preview y, en adelante, se agrega el modelo de documento general (precompilado-documento) al diseño (diseño precompilado). Para extraer pares clave-valor, marcas de selección, texto, tablas y estructura de documentos, use los siguientes modelos:

Pares clave-valor	version	Id. de modelo
Modelo de diseño con una cadena de consulta `features=keyValuePairs` especificado.	• v4:2024-02-29-preview, 2023-10-31-preview • v3.1:2023-07-31 (GA)	`prebuilt-layout`
Modelo de documento general	• v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA)	`prebuilt-document`

Documento general

Id. de modelo: prebuilt-document

En la tabla siguiente se muestra la compatibilidad general con el lenguaje del modelo de documentos.

Modelo `ID`	Idioma: código de configuración local	Valor predeterminado
prebuilt-document	Inglés (Estados Unidos)—en-`US`	Inglés (Estados Unidos)—en-`US`

Compatibilidad con lenguajes: análisis de documentos

Modelo de lectura

Id. de modelo: prebuilt-read

Layout

Id. de modelo: prebuilt-layout

Documento general

Id. de modelo: prebuilt-document

Recursos adicionales