Os modelos da IA do Azure para Informação de Documentos fornecem suporte ao processamento de documentos multilíngue. Nossos recursos de suporte a idiomas permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem a divulgação global. Os modelos de análise de documentos permitem a extração de texto de formulários e documentos e retornam conteúdo estruturado pronto para negócios pronto para a ação, o uso ou o progresso da sua organização. As tabelas a seguir listam o suporte ao idioma e local disponíveis por modelo e recurso:
Leitura: o modelo de leitura permite a extração e análise de texto impresso e manuscrito. O modelo é o mecanismo de OCR subjacente para outros modelos predefinidos da Informação de Documentos, como layout, documento geral, fatura, recibo, identidade (ID), cartão de seguro saúde, documentos fiscais e modelos personalizados. Para saber mais, confiraVisão geral do modelo de Leitura
Layout: o modelo de layout permite a extração e análise de texto, tabelas, estrutura de documentos e marcas de seleção (como botões de opção e caixas de seleção) de formulários e documentos.
Os modelos universais baseados em aprendizado profundo da Informação de Documentos extraem todo o texto multilíngue em seus documentos, incluindo linhas de texto com idiomas mistos, e não exigem a especificação de um código de idioma.
Não forneça o código de idioma como o parâmetro, a menos que você tenha certeza do idioma e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço poderá retornar texto incompleto e incorreto.
Também não é necessário especificar um local. Esse é um parâmetro opcional. A tecnologia de aprendizagem profunda da Informação de Documentos detectará automaticamente o idioma do texto em sua imagem.
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso.
Idioma
Código (opcional)
Abaza
abq
Abecásia
ab
Achinese
ace
Acoli
ach
Adangme
ada
Adyghe
ady
Afar
aa
Africâner
af
Akan
ak
Albanês
sq
Algonquin
alq
Angika (Devanagari)
anp
Árabe
ar
Asturiano
ast
Asu (Tanzânia)
asa
Avaric
av
Awadhi-Hindi (Devanagari)
awa
Aimará
ay
Azerbaidjano (Latino)
az
Bafia
ksf
Bagheli
bfy
Bambara
bm
Bashkir
ba
Basco
eu
bielorrusso (cirílico)
be, be-cyrl
bielorrusso (latino)
be, be-latn
Bemba (Zâmbia)
bem
Bena (Tanzânia)
bez
Bhojpuri-Hindi (Devanagari)
bho
Bikol
bik
Bini
bin
Bislama
bi
Bodo (Devanagari)
brx
Bósnio (Latino)
bs
Brajbha
bra
Bretão
br
Búlgaro
bg
Bundeli
bns
buryat (cirílico)
bua
Catalão
ca
Cebuano
ceb
Chamling
rab
Chamorro
ch
Checheno
ce
Chhattisgarhi (Devanagari)
hne
Chiga
cgg
Chinês simplificado
zh-Hans
Chinês tradicional
zh-Hant
Choctaw
cho
Chukot
ckt
Chuvash
cv
Córnico
kw
Corso
co
Cree
cr
Creek
mus
Tártaro da Crimeia (latim)
crh
Croata
hr
Crow
cro
Tcheco
cs
Dinamarquês
da
Dargwa
dar
Dari
prs
Dhimal (Devanagari)
dhi
Dogri (Devanagari)
doi
Duala
dua
Dungan
dng
Holandês
nl
Efik
efi
Português do Brasil
en
erzya (cirílico)
myv
Estoniano
et
Faroês
fo
Fijiano
fj
Filipino
fil
Finlandês
fi
Idioma
Código (opcional)
Fon
fon
Francês
fr
Friuliano
fur
Ga
gaa
gagauz (latino)
gag
Galego
gl
Ganda
lg
Gayo
gay
Alemão
de
Gilbertês
gil
Gondi (Devanagari)
gon
Grego
el
Groenlandês
kl
Guarani
gn
Gurung (Devanagari)
gvr
Gusii
guz
Crioulo Haitiano
ht
Halbi (Devanagari)
hlb
Hani
hni
Haryanvi
bgc
havaiano
haw
Hebraico
he
Herero
hz
Hiligaynon
hil
Híndi
hi
Hmong daw (latim)
mww
Ho(Devanagiri)
hoc
Húngaro
hu
Iban
iba
Islandês
is
Igbo
ig
Iloko
ilo
sami de Inari
smn
Indonésio
id
Ingush
inh
Interlíngua
ia
Inuktitut (Latino)
iu
Irlandês
ga
Italiano
it
Japonês
ja
Jaunsari (Devanagari)
Jns
Javanês
jv
Jola-Fonyi
dyo
Kabardian
kbd
Kabuverdianu
kea
Kachin (latim)
kac
Kalenjin
kln
Kalmyk
xal
Kangri (Devanagari)
xnr
Kanuri
kr
Karachay-Balkar
krc
kara-kalpak (cirílico)
kaa-cyrl
Caracalpaque (latino)
kaa
Cashubiano
csb
cazaque (cirílico)
kk-cyrl
cazaque (latino)
kk-latn
Khakas
kjh
Khaling
klr
Khasi
kha
Quiché
quc
Kikuyu
ki
Kildin Sami
sjd
Quiniaruanda
rw
Komi
kv
Kongo
kg
Coreano
ko
Korku
kfq
koryak
kpy
kosraean
kos
Kpelle
kpe
Kuanyama
kj
kumyk (cirílico)
kum
Curdo (árabe)
ku-arab
Curdo (latino)
ku-latn
Kurukh (Devanagari)
kru
quirguiz (cirílico)
ky
Lak
lbe
Lakota
lkt
Idioma
Código (opcional)
Latim
la
Letão
lv
Lezghian
lex
Lingala
ln
Lituano
lt
baixo sorábio
dsb
Lozi
loz
sami de Lule
smj
Luo (Quênia e Tanzânia)
luo
Luxemburguês
lb
Luyia
luy
Macedônio
mk
Machame
jmc
Madurese
mad
Mahasu Pahari (Devanagari)
bfz
Makhuwa-Meetto
mgh
Makonde
kde
Malgaxe
mg
Malaio (latino)
ms
Maltês
mt
Malto (Devanagari)
kmj
Mandinka
mnk
Manx
gv
Maori
mi
Mapudungun
arn
Marati
mr
Mari (Rússia)
chm
Masai
mas
Mende (Serra Leoa)
men
Meru
mer
Meta'
mgo
Minangkabau
min
Mohawk
moh
Mongol (Cirílico)
mn
Mongondow
mog
montenegrino (cirílico)
cnr-cyrl
montenegrino (latino)
cnr-latn
Morisyen
mfe
Mundang
mua
Nahuatl
nah
Navajo
nv
Ndonga
ng
Napolitano
nap
Nepalês
ne
Ngomba
jgo
niueano
niu
nogay
nog
Ndebele do Norte
nd
sami setentrional (latino)
sme
Norueguês
no
Nianja
ny
Nyankole
nyn
Nzima
nzi
Occitânico
oc
Ojibwa
oj
Oromo
om
osseto
os
Pampanga
pam
Pangasinan
pag
Papiamento
pap
Pashto
ps
Pedi
nso
Persa
fa
Polonês
pl
Português
pt
Punjabi (Árabe)
pa
Quíchua
qu
ripuário
ksh
Romeno
ro
Romanche
rm
Rundi
rn
Russo
ru
Rwa
rwk
Sadri (Devanagari)
sck
Sakha
sah
Samburu
saq
samoano (latino)
sm
Sango
sg
Idioma
Código (opcional)
Sangu (Gabão)
snq
Sanskrit (Devanagari)
sa
Santali(Devanagiri)
sat
Escocês
sco
Gaélico escocês
gd
Sena
seh
Sérvio (Cirílico)
sr-cyrl
Sérvio (Latino)
sr, sr-latn
Shambala
ksb
Shona
sn
Siksika
bla
Sirmauri (Devanagari)
srx
sami de Skolt
sms
Eslovaco
sk
Esloveno
sl
Soga
xog
Somali (árabe)
so
Somali (latino)
so-latn
Songhai
son
Ndebele do Sul
nr
Altai do Sul
alt
sami do sul
sma
Sotho do Sul
st
Espanhol
es
Sundanês
su
Suaíli (latim)
sw
Swati
ss
Sueco
sv
Tabassaran
tab
Tachelhit
shi
Taitiano
ty
Taita
dav
Tadjique (Cirílico)
tg
Tâmil
ta
Tatar (cirílico)
tt-cyrl
Tártaro (latim)
tt
Teso
teo
Tetum
tet
Tailandês
th
Thani
thf
Tok Pisin
tpi
Tonga
to
Tsonga
ts
Tswana
tn
Turco
tr
turcomeno (latino)
tk
Tuva
tyv
Udmurt
udm
Uighur (cirílico)
ug-cyrl
Ucraniano
uk
Sorábio Alto
hsb
Urdu
ur
Uigur (árabe)
ug
Usbeque (árabe)
uz-arab
Uzbeque (cirílico)
uz-cyrl
Uzbeque (latino)
uz
Vietnamita
vi
Volapuque
vo
Vunjo
vun
Walser
wae
Galês
cy
Frísio ocidental
fy
Wolof
wo
Xhosa
xh
Maia Iucateque
yua
Zapoteca
zap
Zarma
dje
Zuangue
za
Zulu
zu
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso.
Idioma
Código (opcional)
Africâner
af
Angika
anp
Árabe
ar
Asturiano
ast
Awadhi
awa
Azerbaijano
az
bielorrusso (cirílico)
be, be-cyrl
bielorrusso (latino)
be-latn
Bagheli
bfy
Mahasu Pahari
bfz
Búlgaro
bg
Haryanvi
bgc
Bhojpuri
bho
Bislama
bi
Bundeli
bns
Bretão
br
Braj
bra
Bodo
brx
Bósnio
bs
Buriat
bua
Catalão
ca
Cebuano
ceb
Chamorro
ch
montenegrino (latino)
cnr, cnr-latn
montenegrino (cirílico)
cnr-cyrl
Corso
co
Tártaro da Crimeia
crh
Tcheco
cs
Cashubiano
csb
Galês
cy
Dinamarquês
da
Alemão
de
Dhimal
dhi
Dogri
doi
baixo sorábio
dsb
Inglês
en
Espanhol
es
Estoniano
et
Basco
eu
Persa
fa
Finlandês
fi
Filipino
fil
Idioma
Código (opcional)
Fijiano
fj
Faroês
fo
Francês
fr
Friuliano
fur
Frísio ocidental
fy
Irlandês
ga
Gagauz
gag
Gaélico escocês
gd
Gilbertês
gil
Galego
gl
Gondi
gon
Manx
gv
Gurung
gvr
havaiano
haw
Híndi
hi
Halbi
hlb
Chhattisgarhi
hne
Hani
hni
Ho
hoc
Croata
hr
Sorábio Alto
hsb
Haitiano
ht
Húngaro
hu
Interlíngua
ia
Indonésio
id
Islandês
is
Italiano
it
Inuktitut
iu
Japonês
Jaunsari
jns
Javanês
jv
Caracalpaque (latino)
kaa, kaa-latn
kara-kalpak (cirílico)
kaa-cyrl
Kachin
kac
Kabuverdianu
kea
Korku
kfq
Khasi
kha
cazaque (latino)
kk, kk-latn
cazaque (cirílico)
kk-cyrl
Kalaallisut
kl
Khaling
klr
Malto
kmj
Idioma
Código (opcional)
Coreano
kosraean
kos
koryak
kpy
Karachay-Balkar
krc
Kurukh
kru
Kölsch
ksh
Curdo (latino)
ku, ku-latn
Curdo (árabe)
ku-arab
Kumyk
kum
Córnico
kw
Quirguiz
ky
Latim
la
Luxemburguês
lb
Lakota
lkt
Lituano
lt
Maori
mi
Mongol
mn
Marati
mr
Malaio
ms
Maltês
mt
Hmong Daw
mww
Erzya
myv
Napolitano
nap
Nepalês
ne
niueano
niu
Holandês
nl
Norueguês
no
Nogai
nog
Occitânico
oc
Ossetian
os
Panjabi
pa
Polonês
pl
Dari
prs
Pushto
ps
Português
pt
Quiché
quc
Camling
rab
Romanche
rm
Romeno
ro
Russo
ru
Sânscrito
sa
Santali
sat
Idioma
Código (opcional)
Sadri
sck
Escocês
sco
Eslovaco
sk
Esloveno
sl
Samoano
sm
sami do sul
sma
Sami do Norte
sme
sami de Lule
smj
sami de Inari
smn
sami de Skolt
sms
Somali
so
Albanês
sq
Sérvio (latino)
sr, sr-latn
Sirmauri
srx
Sueco
sv
Swahili
sw
Tetum
tet
Tajik
tg
Thani
thf
Turcomeno
tk
Tonga
to
Turco
tr
Tártaro
tt
Tuviniano
tyv
Uighur
ug
Urdu
ur
Uzbeque (latino)
uz, uz-latn
Uzbeque (cirílico)
uz-cyrl
Usbeque (árabe)
uz-arab
Volapuque
vo
Walser
wae
Kangri
xnr
Yucateco
yua
Zuangue
za
Chinês (Han (variante simplificada))
zh, zh-hans
Chinês (Han (variante tradicional))
zh-hant
Zulu
zu
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto manuscrito.
Idioma
Código de idioma (opcional)
Idioma
Código de idioma (opcional)
Inglês
en
Japonês
ja
Chinês simplificado
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
Russo (versão prévia)
ru
Tailandês (versão prévia)
th
Árabe (versão prévia)
ar
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto manuscrito.
Idioma
Código de idioma (opcional)
Idioma
Código de idioma (opcional)
Inglês
en
Japonês
ja
Chinês simplificado
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto manuscrito.
Idioma
Código de idioma (opcional)
Idioma
Código de idioma (opcional)
Inglês
en
Japonês
ja
Chinês simplificado
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
A API do modelo de leitura dá suporte à detecção de idioma para os idiomas a seguir em seus documentos. Esta lista pode incluir idiomas que não têm suporte para extração de texto no momento.
Importante
Detecção de idioma
O modelo de leitura da Informação de Documentos pode detectar a presença de idiomas e retornar códigos de idioma para os idiomas detectados.
Idiomas detectados versus idiomas extraídos
Esta seção lista os idiomas que podemos detectar nos documentos usando o modelo de leitura, se aplicável.
Observe que essa lista é diferente da lista de idiomas dos quais damos suporte à extração de texto, que é especificada nas seções acima para cada modelo.
A tabela a seguir lista os idiomas com suporte para texto impresso:
Idioma
Código (opcional)
Abaza
abq
Abecásia
ab
Achinese
ace
Acoli
ach
Adangme
ada
Adyghe
ady
Afar
aa
Africâner
af
Akan
ak
Albanês
sq
Algonquin
alq
Angika (Devanagari)
anp
Árabe
ar
Asturiano
ast
Asu (Tanzânia)
asa
Avaric
av
Awadhi-Hindi (Devanagari)
awa
Aimará
ay
Azerbaidjano (Latino)
az
Bafia
ksf
Bagheli
bfy
Bambara
bm
Bashkir
ba
Basco
eu
bielorrusso (cirílico)
be, be-cyrl
bielorrusso (latino)
be, be-latn
Bemba (Zâmbia)
bem
Bena (Tanzânia)
bez
Bhojpuri-Hindi (Devanagari)
bho
Bikol
bik
Bini
bin
Bislama
bi
Bodo (Devanagari)
brx
Bósnio (Latino)
bs
Brajbha
bra
Bretão
br
Búlgaro
bg
Bundeli
bns
buryat (cirílico)
bua
Catalão
ca
Cebuano
ceb
Chamling
rab
Chamorro
ch
Checheno
ce
Chhattisgarhi (Devanagari)
hne
Chiga
cgg
Chinês simplificado
zh-Hans
Chinês tradicional
zh-Hant
Choctaw
cho
Chukot
ckt
Chuvash
cv
Córnico
kw
Corso
co
Cree
cr
Creek
mus
Tártaro da Crimeia (latim)
crh
Croata
hr
Crow
cro
Tcheco
cs
Dinamarquês
da
Dargwa
dar
Dari
prs
Dhimal (Devanagari)
dhi
Dogri (Devanagari)
doi
Duala
dua
Dungan
dng
Holandês
nl
Efik
efi
Português do Brasil
en
erzya (cirílico)
myv
Estoniano
et
Faroês
fo
Fijiano
fj
Filipino
fil
Finlandês
fi
Idioma
Código (opcional)
Fon
fon
Francês
fr
Friuliano
fur
Ga
gaa
gagauz (latino)
gag
Galego
gl
Ganda
lg
Gayo
gay
Alemão
de
Gilbertês
gil
Gondi (Devanagari)
gon
Grego
el
Groenlandês
kl
Guarani
gn
Gurung (Devanagari)
gvr
Gusii
guz
Crioulo Haitiano
ht
Halbi (Devanagari)
hlb
Hani
hni
Haryanvi
bgc
havaiano
haw
Hebraico
he
Herero
hz
Hiligaynon
hil
Híndi
hi
Hmong daw (latim)
mww
Ho(Devanagiri)
hoc
Húngaro
hu
Iban
iba
Islandês
is
Igbo
ig
Iloko
ilo
sami de Inari
smn
Indonésio
id
Ingush
inh
Interlíngua
ia
Inuktitut (Latino)
iu
Irlandês
ga
Italiano
it
Japonês
ja
Jaunsari (Devanagari)
Jns
Javanês
jv
Jola-Fonyi
dyo
Kabardian
kbd
Kabuverdianu
kea
Kachin (latim)
kac
Kalenjin
kln
Kalmyk
xal
Kangri (Devanagari)
xnr
Kanuri
kr
Karachay-Balkar
krc
kara-kalpak (cirílico)
kaa-cyrl
Caracalpaque (latino)
kaa
Cashubiano
csb
cazaque (cirílico)
kk-cyrl
cazaque (latino)
kk-latn
Khakas
kjh
Khaling
klr
Khasi
kha
Quiché
quc
Kikuyu
ki
Kildin Sami
sjd
Quiniaruanda
rw
Komi
kv
Kongo
kg
Coreano
ko
Korku
kfq
koryak
kpy
kosraean
kos
Kpelle
kpe
Kuanyama
kj
kumyk (cirílico)
kum
Curdo (árabe)
ku-arab
Curdo (latino)
ku-latn
Idioma
Código (opcional)
Kurukh (Devanagari)
kru
quirguiz (cirílico)
ky
Lak
lbe
Lakota
lkt
Latim
la
Letão
lv
Lezghian
lex
Lingala
ln
Lituano
lt
baixo sorábio
dsb
Lozi
loz
sami de Lule
smj
Luo (Quênia e Tanzânia)
luo
Luxemburguês
lb
Luyia
luy
Macedônio
mk
Machame
jmc
Madurese
mad
Mahasu Pahari (Devanagari)
bfz
Makhuwa-Meetto
mgh
Makonde
kde
Malgaxe
mg
Malaio (latino)
ms
Maltês
mt
Malto (Devanagari)
kmj
Mandinka
mnk
Manx
gv
Maori
mi
Mapudungun
arn
Marati
mr
Mari (Rússia)
chm
Masai
mas
Mende (Serra Leoa)
men
Meru
mer
Meta'
mgo
Minangkabau
min
Mohawk
moh
Mongol (Cirílico)
mn
Mongondow
mog
montenegrino (cirílico)
cnr-cyrl
montenegrino (latino)
cnr-latn
Morisyen
mfe
Mundang
mua
Nahuatl
nah
Navajo
nv
Ndonga
ng
Napolitano
nap
Nepalês
ne
Ngomba
jgo
niueano
niu
nogay
nog
Ndebele do Norte
nd
sami setentrional (latino)
sme
Norueguês
no
Nianja
ny
Nyankole
nyn
Nzima
nzi
Occitânico
oc
Ojibwa
oj
Oromo
om
osseto
os
Pampanga
pam
Pangasinan
pag
Papiamento
pap
Pashto
ps
Pedi
nso
Persa
fa
Polonês
pl
Português
pt
Punjabi (Árabe)
pa
Quíchua
qu
ripuário
ksh
Romeno
ro
Romanche
rm
Rundi
rn
Russo
ru
Idioma
Código (opcional)
Rwa
rwk
Sadri (Devanagari)
sck
Sakha
sah
Samburu
saq
samoano (latino)
sm
Sango
sg
Sangu (Gabão)
snq
Sanskrit (Devanagari)
sa
Santali(Devanagiri)
sat
Escocês
sco
Gaélico escocês
gd
Sena
seh
Sérvio (Cirílico)
sr-cyrl
Sérvio (Latino)
sr, sr-latn
Shambala
ksb
Shona
sn
Siksika
bla
Sirmauri (Devanagari)
srx
sami de Skolt
sms
Eslovaco
sk
Esloveno
sl
Soga
xog
Somali (árabe)
so
Somali (latino)
so-latn
Songhai
son
Ndebele do Sul
nr
Altai do Sul
alt
sami do sul
sma
Sotho do Sul
st
Espanhol
es
Sundanês
su
Suaíli (latim)
sw
Swati
ss
Sueco
sv
Tabassaran
tab
Tachelhit
shi
Taitiano
ty
Taita
dav
Tadjique (Cirílico)
tg
Tâmil
ta
Tatar (cirílico)
tt-cyrl
Tártaro (latim)
tt
Teso
teo
Tetum
tet
Tailandês
th
Thani
thf
Tok Pisin
tpi
Tonga
to
Tsonga
ts
Tswana
tn
Turco
tr
turcomeno (latino)
tk
Tuva
tyv
Udmurt
udm
Uighur (cirílico)
ug-cyrl
Ucraniano
uk
Sorábio Alto
hsb
Urdu
ur
Uigur (árabe)
ug
Usbeque (árabe)
uz-arab
Uzbeque (cirílico)
uz-cyrl
Uzbeque (latino)
uz
Vietnamita
vi
Volapuque
vo
Vunjo
vun
Walser
wae
Galês
cy
Frísio ocidental
fy
Wolof
wo
Xhosa
xh
Maia Iucateque
yua
Zapoteca
zap
Zarma
dje
Zuangue
za
Zulu
zu
A tabela a seguir lista o suporte à linguagem de modelo de layout para extrair e analisar texto impresso.
Idioma
Código (opcional)
Africâner
af
Angika
anp
Árabe
ar
Asturiano
ast
Awadhi
awa
Azerbaijano
az
bielorrusso (cirílico)
be, be-cyrl
bielorrusso (latino)
be-latn
Bagheli
bfy
Mahasu Pahari
bfz
Búlgaro
bg
Haryanvi
bgc
Bhojpuri
bho
Bislama
bi
Bundeli
bns
Bretão
br
Braj
bra
Bodo
brx
Bósnio
bs
Buriat
bua
Catalão
ca
Cebuano
ceb
Chamorro
ch
montenegrino (latino)
cnr, cnr-latn
montenegrino (cirílico)
cnr-cyrl
Corso
co
Tártaro da Crimeia
crh
Tcheco
cs
Cashubiano
csb
Galês
cy
Dinamarquês
da
Alemão
de
Dhimal
dhi
Dogri
doi
baixo sorábio
dsb
Inglês
en
Espanhol
es
Estoniano
et
Basco
eu
Persa
fa
Finlandês
fi
Filipino
fil
Idioma
Código (opcional)
Fijiano
fj
Faroês
fo
Francês
fr
Friuliano
fur
Frísio ocidental
fy
Irlandês
ga
Gagauz
gag
Gaélico escocês
gd
Gilbertês
gil
Galego
gl
Gondi
gon
Manx
gv
Gurung
gvr
havaiano
haw
Híndi
hi
Halbi
hlb
Chhattisgarhi
hne
Hani
hni
Ho
hoc
Croata
hr
Sorábio Alto
hsb
Haitiano
ht
Húngaro
hu
Interlíngua
ia
Indonésio
id
Islandês
is
Italiano
it
Inuktitut
iu
Japonês
Jaunsari
jns
Javanês
jv
Caracalpaque (latino)
kaa, kaa-latn
kara-kalpak (cirílico)
kaa-cyrl
Kachin
kac
Kabuverdianu
kea
Korku
kfq
Khasi
kha
cazaque (latino)
kk, kk-latn
cazaque (cirílico)
kk-cyrl
Kalaallisut
kl
Khaling
klr
Malto
kmj
Idioma
Código (opcional)
Coreano
kosraean
kos
koryak
kpy
Karachay-Balkar
krc
Kurukh
kru
Kölsch
ksh
Curdo (latino)
ku, ku-latn
Curdo (árabe)
ku-arab
Kumyk
kum
Córnico
kw
Quirguiz
ky
Latim
la
Luxemburguês
lb
Lakota
lkt
Lituano
lt
Maori
mi
Mongol
mn
Marati
mr
Malaio
ms
Maltês
mt
Hmong Daw
mww
Erzya
myv
Napolitano
nap
Nepalês
ne
niueano
niu
Holandês
nl
Norueguês
no
Nogai
nog
Occitânico
oc
Ossetian
os
Panjabi
pa
Polonês
pl
Dari
prs
Pushto
ps
Português
pt
Quiché
quc
Camling
rab
Romanche
rm
Romeno
ro
Russo
ru
Sânscrito
sa
Santali
sat
Idioma
Código (opcional)
Sadri
sck
Escocês
sco
Eslovaco
sk
Esloveno
sl
Samoano
sm
sami do sul
sma
Sami do Norte
sme
sami de Lule
smj
sami de Inari
smn
sami de Skolt
sms
Somali
so
Albanês
sq
Sérvio (latino)
sr, sr-latn
Sirmauri
srx
Sueco
sv
Swahili
sw
Tetum
tet
Tajik
tg
Thani
thf
Turcomeno
tk
Tonga
to
Turco
tr
Tártaro
tt
Tuviniano
tyv
Uighur
ug
Urdu
ur
Uzbeque (latino)
uz, uz-latn
Uzbeque (cirílico)
uz-cyrl
Usbeque (árabe)
uz-arab
Volapuque
vo
Walser
wae
Kangri
xnr
Yucateco
yua
Zuangue
za
Chinês (Han (variante simplificada))
zh, zh-hans
Chinês (Han (variante tradicional))
zh-hant
Zulu
zu
Linguagem
Código de idioma
Africâner
af
Albanês
sq
Asturiano
ast
Basco
eu
Bislama
bi
Bretão
br
Catalão
ca
Cebuano
ceb
Chamorro
ch
Chinês (Simplificado)
zh-Hans
Chinês (Tradicional)
zh-Hant
Córnico
kw
Corso
co
Tártaro da Crimeia (latim)
crh
Tcheco
cs
Dinamarquês
da
Holandês
nl
Inglês (em letra de forma e manuscrito)
en
Estoniano
et
Fijiano
fj
Filipino
fil
Finlandês
fi
Francês
fr
Friuliano
fur
Galego
gl
Alemão
de
Gilbertês
gil
Groenlandês
kl
Crioulo haitiano
ht
Hani
hni
Hmong daw (latim)
mww
Húngaro
hu
Indonésio
id
Interlíngua
ia
Inuktitut (Latino)
iu
Irlandês
ga
Linguagem
Código do idioma
Italiano
it
Japonês
ja
Javanês
jv
Quiché
quc
Kabuverdianu
kea
Kachin (latim)
kac
Kara-Kalpak
kaa
Cashubiano
csb
Khasi
kha
Coreano
ko
Curdo (latim)
kur
Luxemburguês
lb
Malaio (latino)
ms
Manx
gv
Napolitano
nap
Norueguês
no
Occitânico
oc
Polonês
pl
Português
pt
Romanche
rm
Escocês
sco
Gaélico escocês
gd
Esloveno
slv
Espanhol
es
Suaíli (latim)
sw
Sueco
sv
Tártaro (latim)
tat
Tetum
tet
Turco
tr
Alto sorábio
hsb
Uzbeque (latino)
uz
Volapuque
vo
Walser
wae
Frísio ocidental
fy
Yucatec Maya
yua
Zuangue
za
Zulu
zu
A tabela a seguir lista o suporte à linguagem de modelo de layout para extrair e analisar texto manuscrito.
Idioma
Código de idioma (opcional)
Idioma
Código de idioma (opcional)
Inglês
en
Japonês
ja
Chinês simplificado
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
Russo (versão prévia)
ru
Tailandês (versão prévia)
th
Árabe (versão prévia)
ar
ID do modelo: prebuilt-layout
A tabela a seguir lista o suporte à linguagem de modelo de layout para extrair e analisar texto manuscrito.
Idioma
Código de idioma (opcional)
Idioma
Código de idioma (opcional)
Inglês
en
Japonês
ja
Chinês simplificado
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
Observação
A Informação de Documentos v2.1 não dá suporte à extração de texto manuscrito.
A tabela a seguir lista o suporte à linguagem de modelo de layout para extrair e analisar texto manuscrito.
Idioma
Código de idioma (opcional)
Idioma
Código de idioma (opcional)
Inglês
en
Japonês
ja
Chinês simplificado
zh-Hans
Coreano
ko
Francês
fr
Português
pt
Alemão
de
Espanhol
es
Italiano
it
Russo (versão prévia)
ru
Tailandês (versão prévia)
th
Árabe (versão prévia)
ar
Documentação geral
Importante
A partir da Informação de Documentos v4.0:2024-07-31-preview, 2023-10-31-preview e posterior, o modelo de documento geral (documento predefinido) será adicionado ao layout (layout predefinido). Para extrair pares de chave-valor, marcas de seleção, texto, tabelas e estrutura dos documentos use os seguintes modelos:
Pares chave-valor
version
ID do Modelo
Modelo de layout com cadeia de caracteres de consulta features=keyValuePairs especificada.