Partilhar via


Suporte a idiomas: modelos personalizados

Este conteúdo aplica-se a:marca de verificaçãov4.0 (pré-visualização) | Versões anteriores:Marca de verificação azulv3.1 (GA)Marca de verificação azulv3.0 (GA)Marca de verificação azulv2.1 (GA)

Este conteúdo aplica-se a:marca de verificaçãov3.1 (GA) | Última versão:marca de verificação roxav4.0 (visualização) | Versões anteriores:Marca de verificação azulv3.0Marca de verificação azulv2.1

Este conteúdo aplica-se a:marca de verificaçãov3.0 (GA) | Últimas versões:marca de verificação roxav4.0 (preview)marca de verificação roxav3.1 | Versão anterior:Marca de verificação azulv2.1

Este conteúdo aplica-se a:marca de verificaçãov2.1 | Última versão:Marca de verificação azulv4.0 (pré-visualização)

Os modelos do Azure AI Document Intelligence fornecem suporte ao processamento de documentos multilíngue. Nossos recursos de suporte a idiomas permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem o alcance global. Os modelos personalizados são treinados usando seus conjuntos de dados rotulados para extrair dados distintos de documentos estruturados, semiestruturados e não estruturados específicos para seus casos de uso. Modelos personalizados independentes podem ser combinados para criar modelos compostos. As tabelas a seguir listam o suporte de idioma e localidade disponível por modelo e recurso:

Classificador personalizado

Idioma—Código de localidade Predefinido
Inglês (Estados Unidos)—en-US Inglês (Estados Unidos)—en-US
Linguagem Código (opcional)
Afrikaans af
Albanês sq
Árabe ar
Búlgaro bg
Chinês (Han (variante simplificada)) zh-Hans
Chinês (Han (variante tradicional)) zh-Hant
Croata hr
Checo cs
Dinamarquês da
Neerlandês nl
Estónio et
Finlandês fi
Francês fr
Alemão de
Hebraico he
Hindi hi
Húngaro hu
Indonésio id
Italiano it
Japonês ja
Coreano ko
Letão lv
Lituano lt
Macedónio mk
Marata mr
Grego moderno (1453-) el
Nepalês (macrolinguagem) ne
Norueguês no
Panjabi pa
Persa fa
Polaco pl
Português pt
Romeno rm
Russo ru
Eslovaco sk
Esloveno sl
Somali (árabe) so
Somali (Latim) so-latn
Espanhol es
Swahili (macrolinguagem) sw
Sueco sv
Tâmil ta
Tailandês th
Turco tr
Ucraniano uk
Urdu ur
Vietnamita vi

Neural personalizado

A tabela a seguir lista os idiomas suportados para texto impresso.

Linguagem Código (opcional)
Afrikaans af
Albanês sq
Árabe ar
Búlgaro bg
Chineses (Simplificado) zh-Hans
Chinês (Tradicional) zh-Hant
Croata hr
Checo cs
Dinamarquês da
Neerlandês nl
Estónio et
Finlandês fi
Francês fr
Alemão de
Hebraico he
Hindi hi
Húngaro hu
Indonésio id
Italiano it
Japonês ja
Coreano ko
Letão lv
Lituano lt
Macedónio mk
Marata mr
Grego moderno (1453-) el
Nepalês (macrolinguagem) ne
Norueguês no
Panjabi pa
Persa fa
Polaco pl
Português pt
Romeno rm
Russo ru
Eslovaco sk
Esloveno sl
Somali (árabe) so
Somali (Latim) so-latn
Espanhol es
Swahili (macrolinguagem) sw
Sueco sv
Tâmil ta
Tailandês th
Turco tr
Ucraniano uk
Urdu ur
Vietnamita vi

Os modelos neurais suportam idiomas adicionados para as v3.1 APIs e posteriores.

Idiomas Versão da API
Inglês v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA), v3.0:2022-08-31 (GA)
Alemão v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Italiano v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Francês v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Espanhol v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)
Neerlandês v4.0:2024-02-29-preview, 2023-10-31-preview, v3.1:2023-07-31 (GA)

Modelo personalizado

A tabela a seguir lista os idiomas suportados para texto impresso .

Linguagem Código (opcional)
Abaza ABQ
Abcásia ab
Chinês ás
Acoli ach
Adangme Ada
Adyghe Ady
Afar AA
Afrikaans AF
Akan AK
Albanês sq
Algonquin ALQ
Angika (Devanagari) ANP
Árabe ar
Asturiano AST
Asu (Tanzânia) ASA
Avaric AV
Awadhi-Hindi (Devanagari) AWA
Aymara ay
Azerbaijão (Latim) AZ
Máfia KSF
Bagheli Bfy
Bambara BM
Basquir ba
Basco eu
Bielorrusso (cirílico) ser, be-cyrl
Bielorrusso (Latim) be, be-latn
Bemba (Zâmbia) bem
Bena (Tanzânia) bez
Bhojpuri-Hindi (Devanagari) BHO
Bikol Bik
Bini classe
Bislama bi
Bodo (Devanagari) BRX
Bósnio (Latim) BS
Brajbha Sutiã
Bretão br
Búlgaro bg
Bundeli BNS
Buryat (cirílico) Bua
Catalão ca
Cebuano CEB
Chamling Rab
Chamorro ch
Checheno ce
Chhattisgarhi (Devanagari) HNE
Chiga CGG
Chineses (Simplificado) zh-Hans
Chinês (Tradicional) zh-Hant
Choctaw Cho
Chukot CKT
Chuvash CV
Cornualha kW
Córsega co
Cree CR
Riacho Mus
Tártaro da Crimeia (latim) CRH
Croata h
Corvo Cro
Checo cs
Dinamarquês da
Dargwa dar
Dari PRS
Dhimal (Devanagari) DHI
Dogri (Devanagari) doi
Duala Dua
Dungan GND
Neerlandês nl
Efik EFI
Português in
Erzya (cirílico) MYV
Estónio et
Faroense fo
Fijiano FJ
Filipino fil
Finlandês fi
Linguagem Código (opcional)
Fon Fon
Francês fr
Friuliano peles
Ga GAA
Gagauz (latim) Mordaça
Galego gl
Ganda LG
Gayo gay
Alemão al
Gilbertese Gil
Gondi (Devanagari) vai
Grego el
Gronelândia KL
Guarani GN
Gurung (Devanagari) GVR
Gusii Guz
Crioulo haitiano HT
Halbi (Devanagari) HLB
Hani hni
Haryanvi BGC
Havaiano Haw
Hebraico he
Herero HZ
Hiligaynon Hil
Hindi hi
Hmong Daw (Latim) MWW
Ho(Devanagiri) HOC
Húngaro hu
Iban IBA
Islandês é
Igbo IG
Iloko OIT
Inari Sami SMN
Indonésio id
Inguche INH
Interlíngua ia
Inuktitut (latim) IU
Irlandês GA
Italiano it
Japonês ja
Jaunsari (Devanagari) Jns
Javanês JV
Jola-Fonyi Dyo
Kabardiano KBD
Kabuverdianu Kea
Kachin (Latim) Kac
Kalenjin KLN
Kalmyk xal
Kangri (Devanagari) XNR
Kanuri KR
Karachay-Balkar KRC
Kara-Kalpak (cirílico) Kaa-Cyrl
Kara-Kalpak (Latim) Kaa
Kashubian CSB
Cazaque (cirílico) kk-cyrl
Cazaque (Latim) kk-latn
Khakas KJH
Khaling KLR
Khasi Kha
K'iche» Quc
Kikuyu ki
Kildin Sami SJD
Kinyarwanda RW
Komi KV
Kongo kg
Coreano ko
Korku KFQ
Koryak KPY
Kosraean Kós
Kpelle kpe
Kuanyama KJ
Kumyk (cirílico) Kum
Curdo (árabe) Ku-Árabe
Curdo (latim) Ku-Latn
Kurukh (Devanagari) Kru
Quirguistão (cirílico) KY
Lak LBE
Lakota LKT
Linguagem Código (opcional)
Latim la
Letão lv
Lezghian Lex
Lingala ln
Lituano lt
Baixo Sorbian DSB
Lozi loz
Lule Sami SMJ
Luo (Quênia e Tanzânia) luo
Luxemburguês lb
Luyia Luy
Macedónio Mk
Machame JMC
Madurese louco
Mahasu Pahari (Devanagari) BFZ
Makhuwa-Meetto MGH
Makonde KDE
Malgaxe em mg
Malaio (Latim) ms
Maltês mt
Malto (Devanagari) KMJ
Mandinka MNK
Manx GV
Maori mi
Mapudungun ARN
Marata O Sr.
Mari (Rússia) CHM
Masai mas
Mende (Serra Leoa) homens
Meru Mer
Meta» MGO
Minangkabau min
Mohawk Moh
Mongol (cirílico) MN
Mongondow mog
Montenegrino (cirílico) CNR-CYRL
Montenegrino (Latim) CNR-LATN
Morisyen MFE
Mundang mua
Nahuatl Não
Navajo NV
Ndonga ng
Napolitano Sesta
Nepalês ne
Ngomba JGO
Niuean NIU
Nogay Nog
Ndebele do Norte nd
Sami do Norte (Latim) PME
Norueguês não
Nyanja Nova Iorque
Nyankole Nova Iorque
Nzima NZI
Occitano OC
Ojibwa JO
Oromo om
Ossético o
Pampanga Pam
Pangasinan pag
Papiamento Papanicolau
Pashto PS
Pedi NSO
Persa FA
Polaco pl
Português pt
Punjabi (árabe) PA
Quechua Qu
Ripuariano KSH
Romeno ro
Romanche RM
Rundi RN
Russo ru
Rwa RWK
Sadri (Devanagari) Sck
Sakha SAH
Samburu SAQ
Samoa (Latim) SM
Sango SG
Linguagem Código (opcional)
Sangu (Gabão) SNQ
Sânscrito (Devanagari) SA
Santali(Devanagiri) Sáb
Escoceses sco
Gaélico escocês GD
Sena ela
Sérvio (Cirílico) SR-CYRL
Sérvio (Latim) Sr, Sr-Latn
Shambala KSB
Shona sn
Siksika BLA
Sirmauri (Devanagari) SRX
Skolt Sami sms
Eslovaco sk
Esloveno sl
Soga XOG
Somali (árabe) so
Somali (Latim) So-Latn
Songhai filho
Ndebele do Sul Nr
Altai do Sul Alt
Sami Meridional SMA
Sotho do Sul st
Espanhol es
Sundanês SU
Swahili (latim) sw
Suazilândia ss
Sueco sv
Tabassaran guia
Tachelhit Shi
Taitiano ty
Taita DAV
Tajique (cirílico) TG
Tâmil ta
Tártaro (cirílico) TT-CYRL
Tártaro (Latim) TT
Teso Téo
Tétum Tet
Tailandês th
Thangmi thf
Tok Pisin TPI
Tonga para
Tsonga TS
Tswana tn
Turco tr
Turquemeno (latim) TK
Tuvan TYV
Udmurt UDM
Uigur (cirílico) ug-cyrl
Ucraniano uk
Alto Sorábio HSB
Urdu o seu
Uigur (árabe) ug
Uzbeque (árabe) UZ-Árabe
Usbeque (Cirílico) UZ-CYRL
Uzbeque (Latim) UZ
Vietnamita vi
Volapük VO
Vunjo VUN
Walser Wae
Galês cy
Frísio Ocidental fy
Wolof wo
Xhosa xh
Iucatego Yua
Zapoteca zap
Zarma Dje
Zhuang za
Zulu zu