Suporte ao idioma: modelos personalizados
Esse conteúdo se aplica a: v3.1 (GA) | Ultima versão: v4.0 (versão prévia) | Versões prévia: v3.0 v2.1
Esse conteúdo se aplica a: v3.0 (GA) | Ultimas versões: v4.0 (versão prévia) v3.1 | Versões prévia: v2.1
Esse conteúdo se aplica a: v2.1 | ais recente: v4.0 (versão prévia)
Os modelos da IA do Azure para Informação de Documentos fornecem suporte ao processamento de documentos multilíngue. Nossos recursos de suporte a idiomas permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem a divulgação global. Modelos personalizados são treinados usando seus conjuntos de dados rotulados para extrair dados distintos de documentos estruturados, semiestruturados e não estruturados específicos para seus casos de uso. Modelos personalizados autônomos podem ser combinados para criar modelos compostos. As tabelas a seguir listam o suporte ao idioma e local disponíveis por modelo e recurso:
Classificador personalizado
Idioma — código de localidade | Padrão |
---|---|
Inglês (Estados Unidos)—en-US | Inglês (Estados Unidos)—en-US |
Idioma | Código (opcional) |
---|---|
Africâner | af |
Albanês | sq |
Árabe | ar |
Búlgaro | bg |
Chinês (Han (variante simplificada)) | zh-Hans |
Chinês (Han (variante tradicional)) | zh-Hant |
Croata | hr |
Tcheco | cs |
Dinamarquês | da |
Holandês | nl |
Estoniano | et |
Finlandês | fi |
Francês | fr |
Alemão | de |
Hebraico | he |
Híndi | hi |
Húngaro | hu |
Indonésio | id |
Italiano | it |
Japonês | ja |
Coreano | ko |
Letão | lv |
Lituano | lt |
Macedônio | mk |
Marati | mr |
Grego Moderno (1453-) | el |
Nepalês (macrolíngua) | ne |
Norueguês | no |
Panjabi | pa |
Persa | fa |
Polonês | pl |
Português | pt |
Romeno | rm |
Russo | ru |
Eslovaco | sk |
Esloveno | sl |
Somali (árabe) | so |
Somali (latino) | so-latn |
Espanhol | es |
Swahili (macrolíngua) | sw |
Sueco | sv |
Tâmil | ta |
Tailandês | th |
Turco | tr |
Ucraniano | uk |
Urdu | ur |
Vietnamita | vi |
Generativa personalizada
A opção Generativa personalizada só dá suporte ao inglês en
Neural personalizado
A tabela a seguir lista os idiomas com suporte para texto impresso.
Idioma | Código (opcional) |
---|---|
Africâner | af |
Albanês | sq |
Árabe | ar |
Búlgaro | bg |
Chinês simplificado | zh-Hans |
Chinês tradicional | zh-Hant |
Croata | hr |
Tcheco | cs |
Dinamarquês | da |
Holandês | nl |
Inglês | en |
Estoniano | et |
Finlandês | fi |
Francês | fr |
Alemão | de |
Hebraico | he |
Híndi | hi |
Húngaro | hu |
Indonésio | id |
Italiano | it |
Japonês | ja |
Coreano | ko |
Letão | lv |
Lituano | lt |
Macedônio | mk |
Marati | mr |
Grego Moderno (1453-) | el |
Nepalês (macrolíngua) | ne |
Norueguês | no |
Panjabi | pa |
Persa | fa |
Polonês | pl |
Português | pt |
Romeno | rm |
Russo | ru |
Eslovaco | sk |
Esloveno | sl |
Somali (árabe) | so |
Somali (latino) | so-latn |
Espanhol | es |
Swahili (macrolíngua) | sw |
Sueco | sv |
Tâmil | ta |
Tailandês | th |
Turco | tr |
Ucraniano | uk |
Urdu | ur |
Vietnamita | vi |
Modelo personalizado
A tabela a seguir lista os idiomas com suporte para texto impresso.
Idioma | Código (opcional) |
---|---|
Abaza | abq |
Abecásia | ab |
Achinese | ace |
Acoli | ach |
Adangme | ada |
Adyghe | ady |
Afar | aa |
Africâner | af |
Akan | ak |
Albanês | sq |
Algonquin | alq |
Angika (Devanagari) | anp |
Árabe | ar |
Asturiano | ast |
Asu (Tanzânia) | asa |
Avaric | av |
Awadhi-Hindi (Devanagari) | awa |
Aimará | ay |
Azerbaidjano (Latino) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Bashkir | ba |
Basco | eu |
bielorrusso (cirílico) | be, be-cyrl |
bielorrusso (latino) | be, be-latn |
Bemba (Zâmbia) | bem |
Bena (Tanzânia) | bez |
Bhojpuri-Hindi (Devanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (Devanagari) | brx |
Bósnio (latim) | bs |
Brajbha | bra |
Bretão | br |
Búlgaro | bg |
Bundeli | bns |
buryat (cirílico) | bua |
Catalão | ca |
Cebuano | ceb |
Chamling | rab |
Chamorro | ch |
Checheno | ce |
Chhattisgarhi (Devanagari) | hne |
Chiga | cgg |
Chinês simplificado | zh-Hans |
Chinês (tradicional) | zh-Hans |
Choctaw | cho |
Chukot | ckt |
Chuvash | cv |
Córnico | kw |
Corso | co |
Cree | cr |
Creek | mus |
Tártaro da Crimeia (latim) | crh |
Croata | hr |
Crow | cro |
Tcheco | cs |
Dinamarquês | da |
Dargwa | dar |
Dari | prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | doi |
Duala | dua |
Dungan | dng |
Holandês | nl |
Efik | efi |
English | en |
erzya (cirílico) | myv |
Estoniano | et |
Faroês | fo |
Fijiano | fj |
Filipino | fil |
Finlandês | fi |
Idioma | Código (opcional) |
---|---|
Fon | fon |
Francês | fr |
Friuliano | fur |
Ga | gaa |
gagauz (latino) | gag |
Galego | gl |
Ganda | lg |
Gayo | gay |
Alemão | de |
Gilbertês | gil |
Gondi (Devanagari) | gon |
Grego | el |
Groenlandês | kl |
Guarani | gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Crioulo haitiano | ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
havaiano | haw |
Hebraico | he |
Herero | hz |
Hiligaynon | hil |
Híndi | hi |
Hmong daw (latim) | mww |
Ho(Devanagiri) | hoc |
Húngaro | hu |
Iban | iba |
Islandês | é |
Igbo | ig |
Iloko | ilo |
sami de Inari | smn |
Indonésio | ID |
Ingush | inh |
Interlíngua | ia |
Inuktitut (Latino) | iu |
Irlandês | ga |
Italiano | it |
Japonês | ja |
Jaunsari (Devanagari) | Jns |
Javanês | jv |
Jola-Fonyi | dyo |
Kabardian | kbd |
Kabuverdianu | kea |
Kachin (latim) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | kr |
Karachay-Balkar | krc |
kara-kalpak (cirílico) | kaa-cyrl |
Caracalpaque (latino) | kaa |
Cashubiano | csb |
cazaque (cirílico) | kk-cyrl |
cazaque (latino) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | kha |
Quiché | quc |
Kikuyu | ki |
Kildin Sami | sjd |
Quiniaruanda | rw |
Komi | kv |
Kongo | kg |
Coreano | ko |
Korku | kfq |
koryak | kpy |
kosraean | kos |
Kpelle | kpe |
Kuanyama | kj |
kumyk (cirílico) | kum |
Curdo (árabe) | ku-arab |
Curdo (latino) | ku-latn |
Kurukh (Devanagari) | kru |
quirguiz (cirílico) | ky |
Lak | lbe |
Lakota | lkt |
Idioma | Código (opcional) |
---|---|
Latim | la |
Letão | lv |
Lezghian | lex |
Lingala | ln |
Lituano | lt |
baixo sorábio | dsb |
Lozi | loz |
sami de Lule | smj |
Luo (Quênia e Tanzânia) | luo |
Luxemburguês | lb |
Luyia | luy |
Macedônio | mk |
Machame | jmc |
Madurese | mad |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | mgh |
Makonde | kde |
Malgaxe | mg |
Malaio (latino) | ms |
Maltês | mt |
Malto (Devanagari) | kmj |
Mandinka | mnk |
Manx | gv |
Maori | min |
Mapudungun | arn |
Marati | mr |
Mari (Rússia) | chm |
Masai | mas |
Mende (Serra Leoa) | homens |
Meru | mer |
Meta' | mgo |
Minangkabau | min |
Mohawk | moh |
Mongol (Cirílico) | mn |
Mongondow | mog |
montenegrino (cirílico) | cnr-cyrl |
montenegrino (latino) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | Não |
Navajo | nv |
Ndonga | ng |
Napolitano | nap |
Nepali | ne |
Ngomba | jgo |
niueano | niu |
nogay | nog |
Ndebele do Norte | nd |
sami setentrional (latino) | sme |
Norueguês | não |
Nianja | ny |
Nyankole | nyn |
Nzima | nzi |
Occitânico | oc |
Ojibwa | oj |
Oromo | om |
osseto | os |
Pampanga | pam |
Pangasinan | pag |
Papiamento | pap |
Pashto | ps |
Pedi | nso |
Persa | fa |
Polonês | pl |
Português | pt |
Punjabi (Árabe) | pa |
Quíchua | qu |
ripuário | ksh |
Romeno | ro |
Romanche | rm |
Rundi | rn |
Russo | ru |
Rwa | rwk |
Sadri (Devanagari) | sck |
Sakha | sah |
Samburu | saq |
samoano (latino) | sm |
Sango | sg |
Idioma | Código (opcional) |
---|---|
Sangu (Gabão) | snq |
Sanskrit (Devanagari) | sa |
Santali(Devanagiri) | sat |
Escocês | sco |
Gaélico escocês | gd |
Sena | seh |
Sérvio (cirílico) | sr-cyrl |
Sérvio (latino) | sr, sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Devanagari) | srx |
sami de Skolt | sms |
Eslovaco | sk |
Esloveno | sl |
Soga | xog |
Somali (árabe) | SO |
Somali (latino) | so-latn |
Songhai | son |
Ndebele do Sul | nr |
Altai do Sul | alt |
sami do sul | sma |
Sotho do Sul | st |
Espanhol | es |
Sundanês | su |
Suaíli (latim) | sw |
Swati | ss |
Sueco | sv |
Tabassaran | tab |
Tachelhit | shi |
Taitiano | ty |
Taita | dav |
Tadjique (Cirílico) | tg |
Tâmil | ta |
Tatar (cirílico) | tt-cyrl |
Tártaro (latim) | tt |
Teso | teo |
Tetum | tet |
Tailandês | th |
Thani | thf |
Tok Pisin | tpi |
Tongan | até |
Tsonga | ts |
Tswana | tn |
Turco | tr |
turcomeno (latino) | tk |
Tuva | tyv |
Udmurt | udm |
Uighur (cirílico) | ug-cyrl |
Ucraniano | uk |
Alto sorábio | hsb |
Urdu | ur |
Uigur (árabe) | ug |
Usbeque (árabe) | uz-arab |
Uzbeque (cirílico) | uz-cyrl |
Uzbeque (latino) | uz |
Vietnamita | vi |
Volapuque | vo |
Vunjo | vun |
Walser | wae |
Galês | cy |
Frísio ocidental | fy |
Wolof | wo |
Xhosa | xh |
Yucatec Maya | yua |
Zapoteca | zap |
Zarma | dje |
Zuangue | za |
Zulu | zu |