Os modelos do Azure AI Document Intelligence fornecem suporte ao processamento de documentos multilíngue. Nossos recursos de suporte a idiomas permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem o alcance global. Os modelos de análise de documentos permitem a extração de texto de formulários e documentos e retornam conteúdo estruturado pronto para os negócios pronto para a ação, uso ou progresso da sua organização. As tabelas a seguir listam o suporte de idioma e localidade disponível por modelo e recurso:
Leia: O modelo de leitura permite a extração e análise de texto impresso e manuscrito. Este modelo é o mecanismo de OCR subjacente para outros modelos pré-construídos de Inteligência Documental, como layout, documento geral, fatura, recibo, documento de identidade (ID), cartão de seguro de saúde, documentos fiscais e modelos personalizados. Para obter mais informações, consulteLer visão geral do modelo
Layout: O modelo de layout permite extrair e analisar texto, tabelas, estrutura do documento e marcas de seleção (como botões de opção e caixas de seleção) de formulários e documentos.
Documento geral: O modelo de documento geral permite a extração e análise de texto, estrutura do documento e pares chave-valor. Para obter mais informações, consulteVisão geral do modelo de documento
Nota
Código linguístico opcional
Os modelos universais baseados em aprendizagem profunda do Document Intelligence extraem todo o texto multilíngue em seus documentos, incluindo linhas de texto com idiomas mistos, e não exigem a especificação de um código de idioma.
Não forneça o código do idioma como parâmetro, a menos que tenha certeza do idioma e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço pode retornar texto incompleto e incorreto.
Além disso, não é necessário especificar uma localidade. Este é um parâmetro opcional. A tecnologia de aprendizagem profunda Document Intelligence irá detetar automaticamente a linguagem de texto na sua imagem.
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso .
Idioma
Código (opcional)
Abaza
abq
Abcásia
ab
Chinês
ace
Acoli
ach
Adangme
ada
Adyghe
ady
Afar
aa
Afrikaans
af
Akan
ak
Albanês
sq
Algonquin
alq
Angika (Devanagari)
anp
Árabe
ar
Asturiano
ast
Asu (Tanzânia)
asa
Avaric
av
Awadhi-Hindi (Devanagari)
awa
Aymara
ay
Azerbaijão (Latim)
az
Máfia
ksf
Bagheli
bfy
Bambara
bm
Basquir
ba
Basco
eu
Bielorrusso (cirílico)
be, be-cyrl
Bielorrusso (Latim)
be, be-latn
Bemba (Zâmbia)
bem
Bena (Tanzânia)
bez
Bhojpuri-Hindi (Devanagari)
bho
Bikol
bik
Bini
bin
Bislama
bi
Bodo (Devanagari)
brx
Bósnio (Latim)
bs
Brajbha
bra
Bretão
br
Búlgaro
bg
Bundeli
bns
Buryat (cirílico)
bua
Catalão
ca
Cebuano
ceb
Chamling
rab
Chamorro
ch
Checheno
ce
Chhattisgarhi (Devanagari)
hne
Chiga
cgg
Chineses (Simplificado)
zh-Hans
Chinês (Tradicional)
zh-Hant
Choctaw
cho
Chukot
ckt
Chuvash
cv
Cornualha
kw
Córsega
co
Cree
cr
Riacho
mus
Tártaro da Crimeia (latim)
crh
Croata
hr
Corvo
cro
Checo
cs
Dinamarquês
da
Dargwa
dar
Dari
prs
Dhimal (Devanagari)
dhi
Dogri (Devanagari)
doi
Duala
dua
Dungan
dng
Neerlandês
nl
Efik
efi
Inglês
en
Erzya (cirílico)
myv
Estónio
et
Faroense
fo
Fijiano
fj
Filipino
fil
Finlandês
fi
Idioma
Código (opcional)
Fon
fon
Francês
fr
Friuliano
fur
Ga
gaa
Gagauz (latim)
gag
Galego
gl
Ganda
lg
Gayo
gay
Alemão
de
Gilbertese
gil
Gondi (Devanagari)
gon
Grego
el
Gronelândia
kl
Guarani
gn
Gurung (Devanagari)
gvr
Gusii
guz
Crioulo haitiano
ht
Halbi (Devanagari)
hlb
Hani
hni
Haryanvi
bgc
Havaiano
haw
Hebraico
he
Herero
hz
Hiligaynon
hil
Hindi
hi
Hmong Daw (Latim)
mww
Ho(Devanagiri)
hoc
Húngaro
hu
Iban
iba
Islandês
is
Igbo
ig
Iloko
ilo
Inari Sami
smn
Indonésio
id
Inguche
inh
Interlíngua
ia
Inuktitut (latim)
iu
Irlandês
ga
Italiano
it
Japonês
ja
Jaunsari (Devanagari)
Jns
Javanês
jv
Jola-Fonyi
dyo
Kabardiano
kbd
Kabuverdianu
kea
Kachin (Latim)
kac
Kalenjin
kln
Kalmyk
xal
Kangri (Devanagari)
xnr
Kanuri
kr
Karachay-Balkar
krc
Kara-Kalpak (cirílico)
kaa-cyrl
Kara-Kalpak (Latim)
kaa
Kashubian
csb
Cazaque (cirílico)
kk-cyrl
Cazaque (Latim)
kk-latn
Khakas
kjh
Khaling
klr
Khasi
kha
K'iche»
quc
Kikuyu
ki
Kildin Sami
sjd
Kinyarwanda
rw
Komi
kv
Kongo
kg
Coreano
ko
Korku
kfq
Koryak
kpy
Kosraean
kos
Kpelle
kpe
Kuanyama
kj
Kumyk (cirílico)
kum
Curdo (árabe)
ku-arab
Curdo (latim)
ku-latn
Kurukh (Devanagari)
kru
Quirguistão (cirílico)
ky
Lak
lbe
Lakota
lkt
Idioma
Código (opcional)
Latim
la
Letão
lv
Lezghian
lex
Lingala
ln
Lituano
lt
Baixo Sorbian
dsb
Lozi
loz
Lule Sami
smj
Luo (Quênia e Tanzânia)
luo
Luxemburguês
lb
Luyia
luy
Macedónio
mk
Machame
jmc
Madurese
mad
Mahasu Pahari (Devanagari)
bfz
Makhuwa-Meetto
mgh
Makonde
kde
Malgaxe
mg
Malaio (Latim)
ms
Maltês
mt
Malto (Devanagari)
kmj
Mandinka
mnk
Manx
gv
Maori
mi
Mapudungun
arn
Marata
mr
Mari (Rússia)
chm
Masai
mas
Mende (Serra Leoa)
men
Meru
mer
Meta»
mgo
Minangkabau
min
Mohawk
moh
Mongol (cirílico)
mn
Mongondow
mog
Montenegrino (cirílico)
cnr-cyrl
Montenegrino (Latim)
cnr-latn
Morisyen
mfe
Mundang
mua
Nahuatl
nah
Navajo
nv
Ndonga
ng
Napolitano
nap
Nepalês
ne
Ngomba
jgo
Niuean
niu
Nogay
nog
Ndebele do Norte
nd
Sami do Norte (Latim)
sme
Norueguês
no
Nyanja
ny
Nyankole
nyn
Nzima
nzi
Occitano
oc
Ojibwa
oj
Oromo
om
Ossético
os
Pampanga
pam
Pangasinan
pag
Papiamento
pap
Pashto
ps
Pedi
nso
Persa
fa
Polaco
pl
Português
pt
Punjabi (árabe)
pa
Quechua
qu
Ripuariano
ksh
Romeno
ro
Romanche
rm
Rundi
rn
Russo
ru
Rwa
rwk
Sadri (Devanagari)
sck
Sakha
sah
Samburu
saq
Samoa (Latim)
sm
Sango
sg
Idioma
Código (opcional)
Sangu (Gabão)
snq
Sânscrito (Devanagari)
sa
Santali(Devanagiri)
sat
Escoceses
sco
Gaélico escocês
gd
Sena
seh
Sérvio (Cirílico)
sr-cyrl
Sérvio (Latim)
sr, sr-latn
Shambala
ksb
Shona
sn
Siksika
bla
Sirmauri (Devanagari)
srx
Skolt Sami
sms
Eslovaco
sk
Esloveno
sl
Soga
xog
Somali (árabe)
so
Somali (Latim)
so-latn
Songhai
son
Ndebele do Sul
nr
Altai do Sul
alt
Sami Meridional
sma
Sotho do Sul
st
Espanhol
es
Sundanês
su
Swahili (latim)
sw
Suazilândia
ss
Sueco
sv
Tabassaran
tab
Tachelhit
shi
Taitiano
ty
Taita
dav
Tajique (cirílico)
tg
Tâmil
ta
Tártaro (cirílico)
tt-cyrl
Tártaro (Latim)
tt
Teso
teo
Tétum
tet
Tailandês
th
Thangmi
thf
Tok Pisin
tpi
Tonga
to
Tsonga
ts
Tswana
tn
Turco
tr
Turquemeno (latim)
tk
Tuvan
tyv
Udmurt
udm
Uigur (cirílico)
ug-cyrl
Ucraniano
uk
Alto Sorábio
hsb
Urdu
ur
Uigur (árabe)
ug
Uzbeque (árabe)
uz-arab
Usbeque (Cirílico)
uz-cyrl
Uzbeque (Latim)
uz
Vietnamita
vi
Volapük
vo
Vunjo
vun
Walser
wae
Galês
cy
Frísio Ocidental
fy
Wolof
wo
Xhosa
xh
Iucatego
yua
Zapoteca
zap
Zarma
dje
Zhuang
za
Zulu
zu
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso .
Idioma
Código (opcional)
Afrikaans
af
Angika
anp
Árabe
ar
Asturiano
ast
Awadhi
awa
Azerbaijanês
az
Bielorrusso (cirílico)
be, be-cyrl
Bielorrusso (Latim)
be-latn
Bagheli
bfy
Mahasu Pahari
bfz
Búlgaro
bg
Haryanvi
bgc
Bhojpuri
bho
Bislama
bi
Bundeli
bns
Bretão
br
Braj
bra
Bodo
brx
Bósnio
bs
Buriat
bua
Catalão
ca
Cebuano
ceb
Chamorro
ch
Montenegrino (Latim)
cnr, cnr-latn
Montenegrino (cirílico)
cnr-cyrl
Córsega
co
Tártaro da Crimeia
crh
Checo
cs
Kashubian
csb
Galês
cy
Dinamarquês
da
Alemão
de
Dhimal
dhi
Dogri
doi
Baixo Sorbian
dsb
Inglês
en
Espanhol
es
Estónio
et
Basco
eu
Persa
fa
Finlandês
fi
Filipino
fil
Idioma
Código (opcional)
Fijiano
fj
Faroense
fo
Francês
fr
Friuliano
fur
Frísio Ocidental
fy
Irlandês
ga
Gagauz
gag
Gaélico escocês
gd
Gilbertese
gil
Galego
gl
Gondi
gon
Manx
gv
Gurung
gvr
Havaiano
haw
Hindi
hi
Halbi
hlb
Chhattisgarhi
hne
Hani
hni
Ho
hoc
Croata
hr
Alto Sorábio
hsb
Haitiano
ht
Húngaro
hu
Interlíngua
ia
Indonésio
id
Islandês
is
Italiano
it
Inuktitut
iu
Japonês
Jaunsari
jns
Javanês
jv
Kara-Kalpak (Latim)
kaa, kaa-latn
Kara-Kalpak (cirílico)
kaa-cyrl
Kachin
kac
Kabuverdianu
kea
Korku
kfq
Khasi
kha
Cazaque (Latim)
kk, kk-latn
Cazaque (cirílico)
kk-cyrl
Kalaallisut
kl
Khaling
klr
Malto
kmj
Idioma
Código (opcional)
Coreano
Kosraean
kos
Koryak
kpy
Karachay-Balkar
krc
Kurukh
kru
Kölsch
ksh
Curdo (latim)
ku, ku-latn
Curdo (árabe)
ku-arab
Kumyk
kum
Cornualha
kw
Quirguiz
ky
Latim
la
Luxemburguês
lb
Lakota
lkt
Lituano
lt
Maori
mi
Mongol
mn
Marata
mr
Malaio
ms
Maltês
mt
Hmong Daw
mww
Erzya
myv
Napolitano
nap
Nepalês
ne
Niuean
niu
Neerlandês
nl
Norueguês
no
Nogai
nog
Occitano
oc
Ossétia
os
Panjabi
pa
Polaco
pl
Dari
prs
Pushto
ps
Português
pt
K'iche»
quc
Camling
rab
Romanche
rm
Romeno
ro
Russo
ru
Sânscrito
sa
Santali
sat
Idioma
Código (opcional)
Sadri
sck
Escoceses
sco
Eslovaco
sk
Esloveno
sl
Samoano
sm
Sami Meridional
sma
Sami do Norte
sme
Lule Sami
smj
Inari Sami
smn
Skolt Sami
sms
Somali
so
Albanês
sq
Sérvio (Latim)
sr, sr-latn
Sirmauri
srx
Sueco
sv
Suaíli
sw
Tétum
tet
Tajique
tg
Thangmi
thf
Turquemenistão
tk
Tonga
to
Turco
tr
Tatar
tt
Tuviniano
tyv
Uigur
ug
Urdu
ur
Uzbeque (Latim)
uz, uz-latn
Usbeque (Cirílico)
uz-cyrl
Uzbeque (árabe)
uz-arab
Volapük
vo
Walser
wae
Kangri
xnr
Yucateco
yua
Zhuang
za
Chinês (Han (variante simplificada))
zh, zh-hans
Chinês (Han (variante tradicional))
zh-hant
Zulu
zu
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto manuscrito .
Idioma
Código da língua (opcional)
Idioma
Código da língua (opcional)
Inglês
en
Japonês
ja
Chineses (Simplificado)
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
Russo (pré-visualização)
ru
Tailandês (pré-visualização)
th
Árabe (pré-visualização)
ar
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto manuscrito .
Idioma
Código da língua (opcional)
Idioma
Código da língua (opcional)
Inglês
en
Japonês
ja
Chineses (Simplificado)
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto manuscrito .
Idioma
Código da língua (opcional)
Idioma
Código da língua (opcional)
Inglês
en
Japonês
ja
Chineses (Simplificado)
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
A API do modelo de leitura suporta a deteção de idioma para os seguintes idiomas em seus documentos. Esta lista pode incluir idiomas atualmente não suportados para extração de texto.
Importante
Deteção de idioma
O modelo de leitura do Document Intelligence pode detetar a presença de idiomas e retornar códigos de idioma para idiomas detetados.
Idiomas detetados vs idiomas extraídos
Esta seção lista os idiomas que podemos detetar nos documentos usando o modelo de leitura, se houver.
Por favor, note que esta lista difere da lista de idiomas dos quais suportamos extrair texto, que é especificada nas seções acima para cada modelo.
A tabela a seguir lista os idiomas suportados para texto impresso:
Idioma
Código (opcional)
Abaza
abq
Abcásia
ab
Chinês
ace
Acoli
ach
Adangme
ada
Adyghe
ady
Afar
aa
Afrikaans
af
Akan
ak
Albanês
sq
Algonquin
alq
Angika (Devanagari)
anp
Árabe
ar
Asturiano
ast
Asu (Tanzânia)
asa
Avaric
av
Awadhi-Hindi (Devanagari)
awa
Aymara
ay
Azerbaijão (Latim)
az
Máfia
ksf
Bagheli
bfy
Bambara
bm
Basquir
ba
Basco
eu
Bielorrusso (cirílico)
be, be-cyrl
Bielorrusso (Latim)
be, be-latn
Bemba (Zâmbia)
bem
Bena (Tanzânia)
bez
Bhojpuri-Hindi (Devanagari)
bho
Bikol
bik
Bini
bin
Bislama
bi
Bodo (Devanagari)
brx
Bósnio (Latim)
bs
Brajbha
bra
Bretão
br
Búlgaro
bg
Bundeli
bns
Buryat (cirílico)
bua
Catalão
ca
Cebuano
ceb
Chamling
rab
Chamorro
ch
Checheno
ce
Chhattisgarhi (Devanagari)
hne
Chiga
cgg
Chineses (Simplificado)
zh-Hans
Chinês (Tradicional)
zh-Hant
Choctaw
cho
Chukot
ckt
Chuvash
cv
Cornualha
kw
Córsega
co
Cree
cr
Riacho
mus
Tártaro da Crimeia (latim)
crh
Croata
hr
Corvo
cro
Checo
cs
Dinamarquês
da
Dargwa
dar
Dari
prs
Dhimal (Devanagari)
dhi
Dogri (Devanagari)
doi
Duala
dua
Dungan
dng
Neerlandês
nl
Efik
efi
Inglês
en
Erzya (cirílico)
myv
Estónio
et
Faroense
fo
Fijiano
fj
Filipino
fil
Finlandês
fi
Idioma
Código (opcional)
Fon
fon
Francês
fr
Friuliano
fur
Ga
gaa
Gagauz (latim)
gag
Galego
gl
Ganda
lg
Gayo
gay
Alemão
de
Gilbertese
gil
Gondi (Devanagari)
gon
Grego
el
Gronelândia
kl
Guarani
gn
Gurung (Devanagari)
gvr
Gusii
guz
Crioulo haitiano
ht
Halbi (Devanagari)
hlb
Hani
hni
Haryanvi
bgc
Havaiano
haw
Hebraico
he
Herero
hz
Hiligaynon
hil
Hindi
hi
Hmong Daw (Latim)
mww
Ho(Devanagiri)
hoc
Húngaro
hu
Iban
iba
Islandês
is
Igbo
ig
Iloko
ilo
Inari Sami
smn
Indonésio
id
Inguche
inh
Interlíngua
ia
Inuktitut (latim)
iu
Irlandês
ga
Italiano
it
Japonês
ja
Jaunsari (Devanagari)
Jns
Javanês
jv
Jola-Fonyi
dyo
Kabardiano
kbd
Kabuverdianu
kea
Kachin (Latim)
kac
Kalenjin
kln
Kalmyk
xal
Kangri (Devanagari)
xnr
Kanuri
kr
Karachay-Balkar
krc
Kara-Kalpak (cirílico)
kaa-cyrl
Kara-Kalpak (Latim)
kaa
Kashubian
csb
Cazaque (cirílico)
kk-cyrl
Cazaque (Latim)
kk-latn
Khakas
kjh
Khaling
klr
Khasi
kha
K'iche»
quc
Kikuyu
ki
Kildin Sami
sjd
Kinyarwanda
rw
Komi
kv
Kongo
kg
Coreano
ko
Korku
kfq
Koryak
kpy
Kosraean
kos
Kpelle
kpe
Kuanyama
kj
Kumyk (cirílico)
kum
Curdo (árabe)
ku-arab
Curdo (latim)
ku-latn
Idioma
Código (opcional)
Kurukh (Devanagari)
kru
Quirguistão (cirílico)
ky
Lak
lbe
Lakota
lkt
Latim
la
Letão
lv
Lezghian
lex
Lingala
ln
Lituano
lt
Baixo Sorbian
dsb
Lozi
loz
Lule Sami
smj
Luo (Quênia e Tanzânia)
luo
Luxemburguês
lb
Luyia
luy
Macedónio
mk
Machame
jmc
Madurese
mad
Mahasu Pahari (Devanagari)
bfz
Makhuwa-Meetto
mgh
Makonde
kde
Malgaxe
mg
Malaio (Latim)
ms
Maltês
mt
Malto (Devanagari)
kmj
Mandinka
mnk
Manx
gv
Maori
mi
Mapudungun
arn
Marata
mr
Mari (Rússia)
chm
Masai
mas
Mende (Serra Leoa)
men
Meru
mer
Meta»
mgo
Minangkabau
min
Mohawk
moh
Mongol (cirílico)
mn
Mongondow
mog
Montenegrino (cirílico)
cnr-cyrl
Montenegrino (Latim)
cnr-latn
Morisyen
mfe
Mundang
mua
Nahuatl
nah
Navajo
nv
Ndonga
ng
Napolitano
nap
Nepalês
ne
Ngomba
jgo
Niuean
niu
Nogay
nog
Ndebele do Norte
nd
Sami do Norte (Latim)
sme
Norueguês
no
Nyanja
ny
Nyankole
nyn
Nzima
nzi
Occitano
oc
Ojibwa
oj
Oromo
om
Ossético
os
Pampanga
pam
Pangasinan
pag
Papiamento
pap
Pashto
ps
Pedi
nso
Persa
fa
Polaco
pl
Português
pt
Punjabi (árabe)
pa
Quechua
qu
Ripuariano
ksh
Romeno
ro
Romanche
rm
Rundi
rn
Russo
ru
Idioma
Código (opcional)
Rwa
rwk
Sadri (Devanagari)
sck
Sakha
sah
Samburu
saq
Samoa (Latim)
sm
Sango
sg
Sangu (Gabão)
snq
Sânscrito (Devanagari)
sa
Santali(Devanagiri)
sat
Escoceses
sco
Gaélico escocês
gd
Sena
seh
Sérvio (Cirílico)
sr-cyrl
Sérvio (Latim)
sr, sr-latn
Shambala
ksb
Shona
sn
Siksika
bla
Sirmauri (Devanagari)
srx
Skolt Sami
sms
Eslovaco
sk
Esloveno
sl
Soga
xog
Somali (árabe)
so
Somali (Latim)
so-latn
Songhai
son
Ndebele do Sul
nr
Altai do Sul
alt
Sami Meridional
sma
Sotho do Sul
st
Espanhol
es
Sundanês
su
Swahili (latim)
sw
Suazilândia
ss
Sueco
sv
Tabassaran
tab
Tachelhit
shi
Taitiano
ty
Taita
dav
Tajique (cirílico)
tg
Tâmil
ta
Tártaro (cirílico)
tt-cyrl
Tártaro (Latim)
tt
Teso
teo
Tétum
tet
Tailandês
th
Thangmi
thf
Tok Pisin
tpi
Tonga
to
Tsonga
ts
Tswana
tn
Turco
tr
Turquemeno (latim)
tk
Tuvan
tyv
Udmurt
udm
Uigur (cirílico)
ug-cyrl
Ucraniano
uk
Alto Sorábio
hsb
Urdu
ur
Uigur (árabe)
ug
Uzbeque (árabe)
uz-arab
Usbeque (Cirílico)
uz-cyrl
Uzbeque (Latim)
uz
Vietnamita
vi
Volapük
vo
Vunjo
vun
Walser
wae
Galês
cy
Frísio Ocidental
fy
Wolof
wo
Xhosa
xh
Iucatego
yua
Zapoteca
zap
Zarma
dje
Zhuang
za
Zulu
zu
A tabela a seguir lista o suporte à linguagem do modelo de layout para extrair e analisar texto impresso .
Idioma
Código (opcional)
Afrikaans
af
Angika
anp
Árabe
ar
Asturiano
ast
Awadhi
awa
Azerbaijanês
az
Bielorrusso (cirílico)
be, be-cyrl
Bielorrusso (Latim)
be-latn
Bagheli
bfy
Mahasu Pahari
bfz
Búlgaro
bg
Haryanvi
bgc
Bhojpuri
bho
Bislama
bi
Bundeli
bns
Bretão
br
Braj
bra
Bodo
brx
Bósnio
bs
Buriat
bua
Catalão
ca
Cebuano
ceb
Chamorro
ch
Montenegrino (Latim)
cnr, cnr-latn
Montenegrino (cirílico)
cnr-cyrl
Córsega
co
Tártaro da Crimeia
crh
Checo
cs
Kashubian
csb
Galês
cy
Dinamarquês
da
Alemão
de
Dhimal
dhi
Dogri
doi
Baixo Sorbian
dsb
Inglês
en
Espanhol
es
Estónio
et
Basco
eu
Persa
fa
Finlandês
fi
Filipino
fil
Idioma
Código (opcional)
Fijiano
fj
Faroense
fo
Francês
fr
Friuliano
fur
Frísio Ocidental
fy
Irlandês
ga
Gagauz
gag
Gaélico escocês
gd
Gilbertese
gil
Galego
gl
Gondi
gon
Manx
gv
Gurung
gvr
Havaiano
haw
Hindi
hi
Halbi
hlb
Chhattisgarhi
hne
Hani
hni
Ho
hoc
Croata
hr
Alto Sorábio
hsb
Haitiano
ht
Húngaro
hu
Interlíngua
ia
Indonésio
id
Islandês
is
Italiano
it
Inuktitut
iu
Japonês
Jaunsari
jns
Javanês
jv
Kara-Kalpak (Latim)
kaa, kaa-latn
Kara-Kalpak (cirílico)
kaa-cyrl
Kachin
kac
Kabuverdianu
kea
Korku
kfq
Khasi
kha
Cazaque (Latim)
kk, kk-latn
Cazaque (cirílico)
kk-cyrl
Kalaallisut
kl
Khaling
klr
Malto
kmj
Idioma
Código (opcional)
Coreano
Kosraean
kos
Koryak
kpy
Karachay-Balkar
krc
Kurukh
kru
Kölsch
ksh
Curdo (latim)
ku, ku-latn
Curdo (árabe)
ku-arab
Kumyk
kum
Cornualha
kw
Quirguiz
ky
Latim
la
Luxemburguês
lb
Lakota
lkt
Lituano
lt
Maori
mi
Mongol
mn
Marata
mr
Malaio
ms
Maltês
mt
Hmong Daw
mww
Erzya
myv
Napolitano
nap
Nepalês
ne
Niuean
niu
Neerlandês
nl
Norueguês
no
Nogai
nog
Occitano
oc
Ossétia
os
Panjabi
pa
Polaco
pl
Dari
prs
Pushto
ps
Português
pt
K'iche»
quc
Camling
rab
Romanche
rm
Romeno
ro
Russo
ru
Sânscrito
sa
Santali
sat
Idioma
Código (opcional)
Sadri
sck
Escoceses
sco
Eslovaco
sk
Esloveno
sl
Samoano
sm
Sami Meridional
sma
Sami do Norte
sme
Lule Sami
smj
Inari Sami
smn
Skolt Sami
sms
Somali
so
Albanês
sq
Sérvio (Latim)
sr, sr-latn
Sirmauri
srx
Sueco
sv
Suaíli
sw
Tétum
tet
Tajique
tg
Thangmi
thf
Turquemenistão
tk
Tonga
to
Turco
tr
Tatar
tt
Tuviniano
tyv
Uigur
ug
Urdu
ur
Uzbeque (Latim)
uz, uz-latn
Usbeque (Cirílico)
uz-cyrl
Uzbeque (árabe)
uz-arab
Volapük
vo
Walser
wae
Kangri
xnr
Yucateco
yua
Zhuang
za
Chinês (Han (variante simplificada))
zh, zh-hans
Chinês (Han (variante tradicional))
zh-hant
Zulu
zu
Linguagem
Código de idioma
Afrikaans
af
Albanês
sq
Asturiano
ast
Basco
eu
Bislama
bi
Bretão
br
Catalão
ca
Cebuano
ceb
Chamorro
ch
Chinês (Simplificado)
zh-Hans
Chinês (Tradicional)
zh-Hant
Cornualha
kw
Córsega
co
Tártaro da Crimeia (latim)
crh
Checo
cs
Dinamarquês
da
Neerlandês
nl
Inglês (impresso e manuscrito)
en
Estónio
et
Fijiano
fj
Filipino
fil
Finlandês
fi
Francês
fr
Friuliano
fur
Galego
gl
Alemão
de
Gilbertese
gil
Gronelândia
kl
Crioulo haitiano
ht
Hani
hni
Hmong Daw (Latim)
mww
Húngaro
hu
Indonésio
id
Interlíngua
ia
Inuktitut (latim)
iu
Irlandês
ga
Linguagem
Código de idioma
Italiano
it
Japonês
ja
Javanês
jv
K'iche»
quc
Kabuverdianu
kea
Kachin (Latim)
kac
Kara-Kalpak
kaa
Kashubian
csb
Khasi
kha
Coreano
ko
Curdo (latim)
kur
Luxemburguês
lb
Malaio (Latim)
ms
Manx
gv
Napolitano
nap
Norueguês
no
Occitano
oc
Polaco
pl
Português
pt
Romanche
rm
Escoceses
sco
Gaélico escocês
gd
Esloveno
slv
Espanhol
es
Swahili (latim)
sw
Sueco
sv
Tártaro (Latim)
tat
Tétum
tet
Turco
tr
Alto Sorábio
hsb
Uzbeque (Latim)
uz
Volapük
vo
Walser
wae
Frísio Ocidental
fy
Iucatego
yua
Zhuang
za
Zulu
zu
A tabela a seguir lista o suporte à linguagem do modelo de layout para extrair e analisar texto manuscrito .
Idioma
Código da língua (opcional)
Idioma
Código da língua (opcional)
Inglês
en
Japonês
ja
Chineses (Simplificado)
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
Russo (pré-visualização)
ru
Tailandês (pré-visualização)
th
Árabe (pré-visualização)
ar
ID do modelo: layout pré-construído
A tabela a seguir lista o suporte à linguagem do modelo de layout para extrair e analisar texto manuscrito .
Idioma
Código da língua (opcional)
Idioma
Código da língua (opcional)
Inglês
en
Japonês
ja
Chineses (Simplificado)
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
Nota
O Document Intelligence v2.1 não suporta extração de texto manuscrito.
A tabela a seguir lista o suporte à linguagem do modelo de layout para extrair e analisar texto manuscrito .
Idioma
Código da língua (opcional)
Idioma
Código da língua (opcional)
Inglês
en
Japonês
ja
Chineses (Simplificado)
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
Russo (pré-visualização)
ru
Tailandês (pré-visualização)
th
Árabe (pré-visualização)
ar
Documento geral
Importante
Com o Document Intelligence v4.0:2024-07-31-preview, 2023-10-31-preview e no futuro, o modelo geral do documento (prebuilt-document) está sendo adicionado ao layout (prebuilt-layout). Para extrair pares chave-valor, marcas de seleção, texto, tabelas e estrutura de documentos, use os seguintes modelos:
Pares de valores-chave
versão
Model ID
Modelo de layout com seqüência de caracteres de features=keyValuePairs consulta especificada.