Compatibilidad de idioma: modelos personalizados
Este contenido se aplica a: v4.0 (versión preliminar) | Versiones anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Este contenido se aplica a: v3.1 (GA) | Última versión: v4.0 (versión preliminar) | Versiones anteriores: v3.0 v2.1
Este contenido se aplica a: v3.0 (GA) | Últimas versiones: v4.0 (versión preliminar) v3.1 | Versión anterior: v2.1
Este contenido se aplica a: v2.1 | Versión más reciente: v4.0 (versión preliminar)
Los modelos de Documento de inteligencia de Azure AI proporcionan compatibilidad con el procesamiento de documentos en varios idiomas. Nuestras funcionalidades de soporte de idioma permiten a los usuarios comunicarse con sus aplicaciones de forma natural y capacitar al alcance global. Los modelos personalizados se entrenan mediante los conjuntos de datos etiquetados para extraer datos distintos de documentos estructurados, semiestructurados y no estructurados específicos de los casos de uso. Los modelos personalizados independientes se pueden combinar para crear modelos compuestos. En las tablas siguientes se enumeran el idioma disponible y la compatibilidad con la configuración regional por modelo y característica:
Idioma: código de configuración local | Valor predeterminado |
---|---|
Inglés (Estados Unidos): en-US | Inglés (Estados Unidos): en-US |
Idioma | Código (opcional) |
---|---|
Afrikáans | af |
Albanés | sq |
Árabe | ar |
Búlgaro | bg |
Chino (Han (variante simplificada)) | zh-Hans |
Chino (Han (variante tradicional)) | zh-Hant |
Croata | hr |
Checo | cs |
Danés | da |
Neerlandés | nl |
Estonio | et |
Finés | fi |
Francés | fr |
Alemán | de |
Hebreo | he |
Hindi | hi |
Húngaro | hu |
Indonesio | id |
Italiano | it |
Japonés | ja |
Coreano | ko |
Letón | lv |
Lituano | lt |
Macedonio | mk |
Maratí | mr |
Griego moderno (1453-) | el |
Nepalí (macroidioma) | ne |
Noruego | no |
Panyabí | pa |
Persa | fa |
Polaco | pl |
Portugués | pt |
Rumano | rm |
Ruso | ru |
Eslovaco | sk |
Esloveno | sl |
Somalí (árabe) | so |
Somalí (latino) | so-latn |
Español | es |
Suajili (macroidioma) | sw |
Sueco | sv |
Tamil | ta |
Tailandés | th |
Turco | tr |
Ucraniano | uk |
Urdu | ur |
Vietnamita | vi |
El modelo generativo personalizado solo admite inglés en
En la siguiente tabla se enumeran los idiomas compatibles para texto impreso.
Idioma | Código (opcional) |
---|---|
Afrikáans | af |
Albanés | sq |
Árabe | ar |
Búlgaro | bg |
Chino simplificado | zh-Hans |
Chino tradicional | zh-Hant |
Croata | hr |
Checo | cs |
Danés | da |
Neerlandés | nl |
Inglés | en |
Estonio | et |
Finés | fi |
Francés | fr |
Alemán | de |
Hebreo | he |
Hindi | hi |
Húngaro | hu |
Indonesio | id |
Italiano | it |
Japonés | ja |
Coreano | ko |
Letón | lv |
Lituano | lt |
Macedonio | mk |
Maratí | mr |
Griego moderno (1453-) | el |
Nepalí (macroidioma) | ne |
Noruego | no |
Panyabí | pa |
Persa | fa |
Polaco | pl |
Portugués | pt |
Rumano | rm |
Ruso | ru |
Eslovaco | sk |
Esloveno | sl |
Somalí (árabe) | so |
Somalí (latino) | so-latn |
Español | es |
Suajili (macroidioma) | sw |
Sueco | sv |
Tamil | ta |
Tailandés | th |
Turco | tr |
Ucraniano | uk |
Urdu | ur |
Vietnamita | vi |
En la tabla siguiente se enumeran los idiomas compatibles para texto impreso:
Idioma | Código (opcional) |
---|---|
Abaza | abq |
Abjasio | ab |
Achenés | ace |
Acholí | ach |
Adangme | ada |
Adigué | ady |
Afar | aa |
Afrikáans | af |
Akan | ak |
Albanés | sq |
Algonquino | alq |
Angika (devanagari) | anp |
Árabe | ar |
Asturiano | ast |
Asu (Tanzania) | asa |
Avar | av |
Awadhi-Hindi (devanagari) | awa |
Aimara | ay |
Azerbaiyano (latino) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Bashkir | ba |
Vasco | eu |
Bielorruso (cirílico) | be, be-cyrl |
Bielorruso (latino) | be, be-latn |
Bemba (Zambia) | bem |
Bena (Tanzania) | bez |
Bhojpuri-Hindi (devanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (devanagari) | brx |
Bosnio (latino) | bs |
Brajbha | bra |
Bretón | br |
Búlgaro | bg |
Bundeli | bns |
Buriato (cirílico) | bua |
Catalán | ca |
Cebuano | ceb |
Chamling | rab |
Chamorro | ch |
Checheno | ce |
Chhattisgarhi (devanagari) | hne |
Chiga | cgg |
Chino simplificado | zh-Hans |
Chino tradicional | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Chuvasio | cv |
Córnico | kw |
Corso | co |
Cree | cr |
Creek | mus |
Tártaro de Crimea (Latín) | crh |
Croata | hr |
Crow | cro |
Checo | cs |
Danés | da |
Dargwa | dar |
Dari | prs |
Dhimal (devanagari) | dhi |
Dogri (devanagari) | doi |
Duala | dua |
Dungano | dng |
Neerlandés | nl |
Efik | efi |
Inglés | en |
Erzya (cirílico) | myv |
Estonio | et |
Feroés | fo |
Fiyiano | fj |
Filipino | fil |
Finés | fi |
Idioma | Código (opcional) |
---|---|
Fon | fon |
Francés | fr |
Friulano | fur |
Ga | gaa |
Gagauzo (latino) | gag |
Gallego | gl |
Ganda | lg |
Gayo | gay |
Alemán | de |
Gilbertés | gil |
Gondi (devanagari) | gon |
Griego | el |
Groenlandés | kl |
Guaraní | gn |
Gurung (devanagari) | gvr |
Gusii | guz |
Criollo haitiano | ht |
Halbi (devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Hawaiano | haw |
Hebreo | he |
Herero | hz |
Hiligaynon | hil |
Hindi | hi |
Hmong Daw (Latín) | mww |
Ho (devanagiri) | hoc |
Húngaro | hu |
Iban | iba |
Islandés | is |
Igbo | ig |
Ilocano | ilo |
Sami inari | smn |
Indonesio | id |
Ingusetio | inh |
Interlingua | ia |
Inuktitut (latino) | iu |
Irlandés | ga |
Italiano | it |
Japonés | ja |
Jaunsari (devanagari) | Jns |
Javanés | jv |
Jola-fonyi | dyo |
Cabardiano | kbd |
Caboverdiano | kea |
Kachin (Latín) | kac |
Kalenjin | kln |
Calmuco | xal |
Kangri (devanagari) | xnr |
Kanuri | kr |
Karachái-bálkaro | krc |
Karakalpako (cirílico) | kaa-cyrl |
Karakalpako (latino) | kaa |
Casubio | csb |
Kazajo (cirílico) | kk-cyrl |
Kazajo (latino) | kk-latn |
Jakasio | kjh |
Khaling | klr |
Khasi | kha |
Quiché | quc |
Kikuyu | ki |
Sami kildin | sjd |
Kinyarwanda | rw |
Komi | kv |
Kongo | kg |
Coreano | ko |
Korku | kfq |
Koriakia | kpy |
Kosreano | kos |
Kpelle | kpe |
Kuanyama | kj |
Cumuco (cirílico) | kum |
Kurdo (árabe) | ku-arab |
Kurdo (latino) | ku-latn |
Kurukh (devanagari) | kru |
Kirguís (cirílico) | ky |
Lak | lbe |
Lakota | lkt |
Idioma | Código (opcional) |
---|---|
Latín | la |
Letón | lv |
Lezgiano | lex |
Lingala | ln |
Lituano | lt |
Bajo sorbio | dsb |
Lozi | loz |
Sami lule | smj |
Luo (Kenia y Tanzania) | luo |
Luxemburgués | lb |
Luyia | luy |
Macedonio | mk |
Machame | jmc |
Madureso | mad |
Mahasu Pahari (devanagari) | bfz |
Makhuwa-meetto | mgh |
Makonde | kde |
Malgache | mg |
Malayo (latino) | ms |
Maltés | mt |
Malto (devanagari) | kmj |
Mandinká | mnk |
Manx | gv |
Maori | mi |
Mapuche | arn |
Maratí | mr |
Mari (Rusia) | chm |
Masái | mas |
Mende (Sierra Leona) | hombre |
Meru | mer |
Meta' | mgo |
Minangkabau | Min |
Mohawk | moh |
Mongol (cirílico) | mn |
Mongondow | mog |
Montenegrino (cirílico) | cnr-cyrl |
Montenegrino (latino) | cnr-latn |
Mauriciano | mfe |
Mundang | mua |
Náhuatl | nah |
Navajo | nv |
Ndonga | ng |
Napolitano | nap |
Nepalí | ne |
Ngomba | jgo |
Niueano | niu |
Nogayo | nog |
Ndebele septentrional | nd |
Sami septentrional (latino) | sme |
Noruego | no |
Nyanja | ny |
Nyankole | nyn |
Nzima | nzi |
Occitano | oc |
Ojibwa | oj |
Oromo | om |
Osetio | os |
Pampango | pam |
Pangasinense | pag |
Papiamento | pap |
Pastún | ps |
Pedi | nso |
Persa | fa |
Polaco | pl |
Portugués | pt |
Punyabí (árabe) | pa |
Quechua | qu |
Ripuario | ksh |
Rumano | ro |
Romanche | rm |
Rundi | rn |
Ruso | ru |
Rwa | rwk |
Sadri (devanagari) | sck |
Sakha | sah |
Samburu | saq |
Samoano (latino) | Se |
Sango | sg |
Idioma | Código (opcional) |
---|---|
Sangu (Gabón) | snq |
Sánscrito (Devanagari) | sa |
Santali (devanagiri) | sat |
Escocés | sco |
Gaélico escocés | gd |
Sena | seh |
Serbio (cirílico) | sr-cyrl |
Serbio (latino) | sr, sr-latn |
Shambala | ksb |
Shona | sn |
Siksiká | bla |
Sirmauri (devanagari) | srx |
Sami skolt | sms |
Eslovaco | sk |
Esloveno | sl |
Soga | xog |
Somalí (árabe) | SO |
Somalí (latino) | so-latn |
Songhay | son |
Ndebele meridional | nr |
Altaico del Sur | alt |
Sami meridional | sma |
Sotho meridional | st |
Español | es |
Sundanés | su |
Swahili (Latín) | sw |
Swati | ss |
Sueco | sv |
Tabassaran | tabulador |
Tashelhit | shi |
Tahitiano | ty |
Taita | dav |
Tayiko (cirílico) | tg |
Tamil | ta |
Tártaro (cirílico) | tt-cyrl |
Tártaro (Latín) | tt |
Teso | teo |
Tetum | tet |
Tailandés | th |
Thangmi | thf |
Tok Pisin | tpi |
Tongano | to |
Tsonga | ts |
Tswana | tn |
Turco | tr |
Turcomano (latino) | tk |
Tuvano | tyv |
Udmurto | udm |
Uigur (cirílico) | ug-cyrl |
Ucraniano | uk |
Alto sorbio | hsb |
Urdu | ur |
Uigur (árabe) | ug |
Uzbeko (árabe) | uz-arab |
Uzbeko (cirílico) | uz-cyrl |
Uzbeko (latino) | uz |
Vietnamita | vi |
Volapük | vo |
Vunjo | vun |
Walser | wae |
Galés | cy |
Frisón occidental | fy |
Wolof | wo |
Xhosa | xh |
Maya Yucateco | yua |
Zapoteco | zap |
Zarma | dje |
Zhuang | za |
Zulú | zu |