Share via


Suporte ao idioma: modelos personalizados

Este conteúdo se aplica a:marca de seleçãov4.0 (versão prévia) | Versões anteriores:marca de seleção azulv3.1 (GA)marca de seleção azulv3.0 (GA)marca de seleção azulv2.1 (GA)

Este conteúdo se aplica a:marca de seleçãov3.1 (GA) | Versão mais recente:marca de seleção púrpurav4.0 (versão prévia) | Versões anteriores:marca de seleção azulv3.0marca de seleção azulv2.1

Este conteúdo aplica-se a:marca de seleçãov3.0 (GA) | Últimas versões:marca de seleção púrpurav4.0 (versão prévia)marca de seleção púrpurav3.1 | Versão anterior:marca de seleção azulv2.1

Este conteúdo se aplica a:marca de seleçãov2.1 | Versão mais recente:marca de seleção azulv4.0 (versão prévia)

Os modelos da IA do Azure para Informação de Documentos fornecem suporte ao processamento de documentos multilíngue. Nossos recursos de suporte a idiomas permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem a divulgação global. Modelos personalizados são treinados usando seus conjuntos de dados rotulados para extrair dados distintos de documentos estruturados, semiestruturados e não estruturados específicos para seus casos de uso. Modelos personalizados autônomos podem ser combinados para criar modelos compostos. As tabelas a seguir listam o suporte ao idioma e local disponíveis por modelo e recurso:

Classificador personalizado

Idioma — código de localidade Padrão
Inglês (Estados Unidos)—en-US Inglês (Estados Unidos)—en-US
Idioma Código (opcional)
Africâner af
Albanês sq
Árabe ar
Búlgaro bg
Chinês (Han (variante simplificada)) zh-Hans
Chinês (Han (variante tradicional)) zh-Hant
Croata hr
Tcheco cs
Dinamarquês da
Holandês nl
Estoniano et
Finlandês fi
Francês fr
Alemão de
Hebraico he
Híndi hi
Húngaro hu
Indonésio id
Italiano it
Japonês ja
Coreano ko
Letão lv
Lituano lt
Macedônio mk
Marati mr
Grego Moderno (1453-) el
Nepalês (macrolíngua) ne
Norueguês no
Panjabi pa
Persa fa
Polonês pl
Português pt
Romeno rm
Russo ru
Eslovaco sk
Esloveno sl
Somali (árabe) so
Somali (latino) so-latn
Espanhol es
Swahili (macrolíngua) sw
Sueco sv
Tâmil ta
Tailandês th
Turco tr
Ucraniano uk
Urdu ur
Vietnamita vi

Neural personalizado

A tabela a seguir lista os idiomas com suporte para texto impresso.

Idioma Código (opcional)
Africâner af
Albanês sq
Árabe ar
Búlgaro bg
Chinês simplificado zh-Hans
Chinês tradicional zh-Hant
Croata hr
Tcheco cs
Dinamarquês da
Holandês nl
Estoniano et
Finlandês fi
Francês fr
Alemão de
Hebraico he
Híndi hi
Húngaro hu
Indonésio id
Italiano it
Japonês ja
Coreano ko
Letão lv
Lituano lt
Macedônio mk
Marati mr
Grego Moderno (1453-) el
Nepalês (macrolíngua) ne
Norueguês no
Panjabi pa
Persa fa
Polonês pl
Português pt
Romeno rm
Russo ru
Eslovaco sk
Esloveno sl
Somali (árabe) so
Somali (latino) so-latn
Espanhol es
Swahili (macrolíngua) sw
Sueco sv
Tâmil ta
Tailandês th
Turco tr
Ucraniano uk
Urdu ur
Vietnamita vi

Os modelos neurais dão suporte a idiomas adicionados para as APIs v3.1 e posteriores.

Idiomas Versão da API
Inglês v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA), v3.0:2022-08-31 (GA)
Alemão v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Italiano v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Francês v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Espanhol v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Holandês v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)

Modelo personalizado

A tabela a seguir lista os idiomas com suporte para texto impresso.

Idioma Código (opcional)
Abaza abq
Abecásia ab
Achinese ace
Acoli ach
Adangme ada
Adyghe ady
Afar aa
Africâner af
Akan ak
Albanês sq
Algonquin alq
Angika (Devanagari) anp
Árabe ar
Asturiano ast
Asu (Tanzânia) asa
Avaric av
Awadhi-Hindi (Devanagari) awa
Aimará ay
Azerbaidjano (Latino) az
Bafia ksf
Bagheli bfy
Bambara bm
Bashkir ba
Basco eu
bielorrusso (cirílico) be, be-cyrl
bielorrusso (latino) be, be-latn
Bemba (Zâmbia) bem
Bena (Tanzânia) bez
Bhojpuri-Hindi (Devanagari) bho
Bikol bik
Bini bin
Bislama bi
Bodo (Devanagari) brx
Bósnio (latim) bs
Brajbha bra
Bretão br
Búlgaro bg
Bundeli bns
buryat (cirílico) bua
Catalão ca
Cebuano ceb
Chamling rab
Chamorro ch
Checheno ce
Chhattisgarhi (Devanagari) hne
Chiga cgg
Chinês simplificado zh-Hans
Chinês (tradicional) zh-Hans
Choctaw cho
Chukot ckt
Chuvash cv
Córnico kw
Corso co
Cree cr
Creek mus
Tártaro da Crimeia (latim) crh
Croata hr
Crow cro
Tcheco cs
Dinamarquês da
Dargwa dar
Dari prs
Dhimal (Devanagari) dhi
Dogri (Devanagari) doi
Duala dua
Dungan dng
Holandês nl
Efik efi
English en
erzya (cirílico) myv
Estoniano et
Faroês fo
Fijiano fj
Filipino fil
Finlandês fi
Idioma Código (opcional)
Fon fon
Francês fr
Friuliano fur
Ga gaa
gagauz (latino) gag
Galego gl
Ganda lg
Gayo gay
Alemão de
Gilbertês gil
Gondi (Devanagari) gon
Grego el
Groenlandês kl
Guarani gn
Gurung (Devanagari) gvr
Gusii guz
Crioulo haitiano ht
Halbi (Devanagari) hlb
Hani hni
Haryanvi bgc
havaiano haw
Hebraico he
Herero hz
Hiligaynon hil
Híndi hi
Hmong daw (latim) mww
Ho(Devanagiri) hoc
Húngaro hu
Iban iba
Islandês é
Igbo ig
Iloko ilo
sami de Inari smn
Indonésio ID
Ingush inh
Interlíngua ia
Inuktitut (Latino) iu
Irlandês ga
Italiano it
Japonês ja
Jaunsari (Devanagari) Jns
Javanês jv
Jola-Fonyi dyo
Kabardian kbd
Kabuverdianu kea
Kachin (latim) kac
Kalenjin kln
Kalmyk xal
Kangri (Devanagari) xnr
Kanuri kr
Karachay-Balkar krc
kara-kalpak (cirílico) kaa-cyrl
Caracalpaque (latino) kaa
Cashubiano csb
cazaque (cirílico) kk-cyrl
cazaque (latino) kk-latn
Khakas kjh
Khaling klr
Khasi kha
Quiché quc
Kikuyu ki
Kildin Sami sjd
Quiniaruanda rw
Komi kv
Kongo kg
Coreano ko
Korku kfq
koryak kpy
kosraean kos
Kpelle kpe
Kuanyama kj
kumyk (cirílico) kum
Curdo (árabe) ku-arab
Curdo (latino) ku-latn
Kurukh (Devanagari) kru
quirguiz (cirílico) ky
Lak lbe
Lakota lkt
Idioma Código (opcional)
Latim la
Letão lv
Lezghian lex
Lingala ln
Lituano lt
baixo sorábio dsb
Lozi loz
sami de Lule smj
Luo (Quênia e Tanzânia) luo
Luxemburguês lb
Luyia luy
Macedônio mk
Machame jmc
Madurese mad
Mahasu Pahari (Devanagari) bfz
Makhuwa-Meetto mgh
Makonde kde
Malgaxe mg
Malaio (latino) ms
Maltês mt
Malto (Devanagari) kmj
Mandinka mnk
Manx gv
Maori min
Mapudungun arn
Marati mr
Mari (Rússia) chm
Masai mas
Mende (Serra Leoa) homens
Meru mer
Meta' mgo
Minangkabau min
Mohawk moh
Mongol (Cirílico) mn
Mongondow mog
montenegrino (cirílico) cnr-cyrl
montenegrino (latino) cnr-latn
Morisyen mfe
Mundang mua
Nahuatl Não
Navajo nv
Ndonga ng
Napolitano nap
Nepali ne
Ngomba jgo
niueano niu
nogay nog
Ndebele do Norte nd
sami setentrional (latino) sme
Norueguês não
Nianja ny
Nyankole nyn
Nzima nzi
Occitânico oc
Ojibwa oj
Oromo om
osseto os
Pampanga pam
Pangasinan pag
Papiamento pap
Pashto ps
Pedi nso
Persa fa
Polonês pl
Português pt
Punjabi (Árabe) pa
Quíchua qu
ripuário ksh
Romeno ro
Romanche rm
Rundi rn
Russo ru
Rwa rwk
Sadri (Devanagari) sck
Sakha sah
Samburu saq
samoano (latino) sm
Sango sg
Idioma Código (opcional)
Sangu (Gabão) snq
Sanskrit (Devanagari) sa
Santali(Devanagiri) sat
Escocês sco
Gaélico escocês gd
Sena seh
Sérvio (cirílico) sr-cyrl
Sérvio (latino) sr, sr-latn
Shambala ksb
Shona sn
Siksika bla
Sirmauri (Devanagari) srx
sami de Skolt sms
Eslovaco sk
Esloveno sl
Soga xog
Somali (árabe) SO
Somali (latino) so-latn
Songhai son
Ndebele do Sul nr
Altai do Sul alt
sami do sul sma
Sotho do Sul st
Espanhol es
Sundanês su
Suaíli (latim) sw
Swati ss
Sueco sv
Tabassaran tab
Tachelhit shi
Taitiano ty
Taita dav
Tadjique (Cirílico) tg
Tâmil ta
Tatar (cirílico) tt-cyrl
Tártaro (latim) tt
Teso teo
Tetum tet
Tailandês th
Thani thf
Tok Pisin tpi
Tongan até
Tsonga ts
Tswana tn
Turco tr
turcomeno (latino) tk
Tuva tyv
Udmurt udm
Uighur (cirílico) ug-cyrl
Ucraniano uk
Alto sorábio hsb
Urdu ur
Uigur (árabe) ug
Usbeque (árabe) uz-arab
Uzbeque (cirílico) uz-cyrl
Uzbeque (latino) uz
Vietnamita vi
Volapuque vo
Vunjo vun
Walser wae
Galês cy
Frísio ocidental fy
Wolof wo
Xhosa xh
Yucatec Maya yua
Zapoteca zap
Zarma dje
Zuangue za
Zulu zu