Partilhar via


Suporte linguístico: análise de documentos

Este conteúdo aplica-se a: marca de verificação v4.0 (pré-visualização) | Versões anteriores: Marca de verificação azul v3.1 (GA) Marca de verificação azul v3.0 (GA) Marca de verificação azul v2.1 (GA)

Este conteúdo aplica-se a: marca de verificação v3.1 (GA) | Última versão:marca de verificação roxa v4.0 (pré-visualização) | Versões anteriores: Marca de verificação azul v3.0Marca de verificação azul v2.1

Este conteúdo aplica-se a: marca de verificação v3.0 (GA) | Últimas versões: marca de verificação roxa v4.0 (preview) marca de verificação roxav3.1 | Versão anterior: Marca de verificação azul v2.1

Este conteúdo aplica-se a: marca de verificação v2.1 | Última versão: Marca de verificação azul v4.0 (pré-visualização)

Os modelos do Azure AI Document Intelligence fornecem suporte ao processamento de documentos multilíngue. Nossos recursos de suporte a idiomas permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem o alcance global. Os modelos de análise de documentos permitem a extração de texto de formulários e documentos e retornam conteúdo estruturado pronto para os negócios pronto para a ação, uso ou progresso da sua organização. As tabelas a seguir listam o suporte de idioma e localidade disponível por modelo e recurso:

  • Leia: O modelo de leitura permite a extração e análise de texto impresso e manuscrito. Este modelo é o mecanismo de OCR subjacente para outros modelos pré-construídos de Inteligência Documental, como layout, documento geral, fatura, recibo, documento de identidade (ID), cartão de seguro de saúde, documentos fiscais e modelos personalizados. Para obter mais informações, consulte Ler visão geral do modelo
  • Layout: O modelo de layout permite extrair e analisar texto, tabelas, estrutura do documento e marcas de seleção (como botões de opção e caixas de seleção) de formulários e documentos.

Nota

Código linguístico opcional

  • Os modelos universais baseados em aprendizagem profunda do Document Intelligence extraem todo o texto multilíngue em seus documentos, incluindo linhas de texto com idiomas mistos, e não exigem a especificação de um código de idioma.

  • Não forneça o código do idioma como parâmetro, a menos que tenha certeza do idioma e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço pode retornar texto incompleto e incorreto.

  • Além disso, não é necessário especificar uma localidade. Este é um parâmetro opcional. A tecnologia de aprendizagem profunda Document Intelligence irá detetar automaticamente a linguagem de texto na sua imagem.

Ler modelo

ID do modelo: leitura pré-embutida

A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso .

Idioma Código (opcional)
Abaza abq
Abcásia ab
Chinês ace
Acoli ach
Adangme ada
Adyghe ady
Afar aa
Afrikaans af
Akan ak
Albanês sq
Algonquin alq
Angika (Devanagari) anp
Árabe ar
Asturiano ast
Asu (Tanzânia) asa
Avaric av
Awadhi-Hindi (Devanagari) awa
Aymara ay
Azerbaijão (Latim) az
Máfia ksf
Bagheli bfy
Bambara bm
Basquir ba
Basco eu
Bielorrusso (cirílico) be, be-cyrl
Bielorrusso (Latim) be, be-latn
Bemba (Zâmbia) bem
Bena (Tanzânia) bez
Bhojpuri-Hindi (Devanagari) bho
Bikol bik
Bini bin
Bislama bi
Bodo (Devanagari) brx
Bósnio (Latim) bs
Brajbha bra
Bretão br
Búlgaro bg
Bundeli bns
Buryat (cirílico) bua
Catalão ca
Cebuano ceb
Chamling rab
Chamorro ch
Checheno ce
Chhattisgarhi (Devanagari) hne
Chiga cgg
Chineses (Simplificado) zh-Hans
Chinês (Tradicional) zh-Hant
Choctaw cho
Chukot ckt
Chuvash cv
Cornualha kw
Córsega co
Cree cr
Riacho mus
Tártaro da Crimeia (latim) crh
Croata hr
Corvo cro
Checo cs
Dinamarquês da
Dargwa dar
Dari prs
Dhimal (Devanagari) dhi
Dogri (Devanagari) doi
Duala dua
Dungan dng
Neerlandês nl
Efik efi
Inglês en
Erzya (cirílico) myv
Estónio et
Faroense fo
Fijiano fj
Filipino fil
Finlandês fi
Idioma Código (opcional)
Fon fon
Francês fr
Friuliano fur
Ga gaa
Gagauz (latim) gag
Galego gl
Ganda lg
Gayo gay
Alemão de
Gilbertese gil
Gondi (Devanagari) gon
Grego el
Gronelândia kl
Guarani gn
Gurung (Devanagari) gvr
Gusii guz
Crioulo haitiano ht
Halbi (Devanagari) hlb
Hani hni
Haryanvi bgc
Havaiano haw
Hebraico he
Herero hz
Hiligaynon hil
Hindi hi
Hmong Daw (Latim) mww
Ho(Devanagiri) hoc
Húngaro hu
Iban iba
Islandês is
Igbo ig
Iloko ilo
Inari Sami smn
Indonésio id
Inguche inh
Interlíngua ia
Inuktitut (latim) iu
Irlandês ga
Italiano it
Japonês ja
Jaunsari (Devanagari) Jns
Javanês jv
Jola-Fonyi dyo
Kabardiano kbd
Kabuverdianu kea
Kachin (Latim) kac
Kalenjin kln
Kalmyk xal
Kangri (Devanagari) xnr
Kanuri kr
Karachay-Balkar krc
Kara-Kalpak (cirílico) kaa-cyrl
Kara-Kalpak (Latim) kaa
Kashubian csb
Cazaque (cirílico) kk-cyrl
Cazaque (Latim) kk-latn
Khakas kjh
Khaling klr
Khasi kha
K'iche» quc
Kikuyu ki
Kildin Sami sjd
Kinyarwanda rw
Komi kv
Kongo kg
Coreano ko
Korku kfq
Koryak kpy
Kosraean kos
Kpelle kpe
Kuanyama kj
Kumyk (cirílico) kum
Curdo (árabe) ku-arab
Curdo (latim) ku-latn
Kurukh (Devanagari) kru
Quirguistão (cirílico) ky
Lak lbe
Lakota lkt
Idioma Código (opcional)
Latim la
Letão lv
Lezghian lex
Lingala ln
Lituano lt
Baixo Sorbian dsb
Lozi loz
Lule Sami smj
Luo (Quênia e Tanzânia) luo
Luxemburguês lb
Luyia luy
Macedónio mk
Machame jmc
Madurese mad
Mahasu Pahari (Devanagari) bfz
Makhuwa-Meetto mgh
Makonde kde
Malgaxe mg
Malaio (Latim) ms
Maltês mt
Malto (Devanagari) kmj
Mandinka mnk
Manx gv
Maori mi
Mapudungun arn
Marata mr
Mari (Rússia) chm
Masai mas
Mende (Serra Leoa) men
Meru mer
Meta» mgo
Minangkabau min
Mohawk moh
Mongol (cirílico) mn
Mongondow mog
Montenegrino (cirílico) cnr-cyrl
Montenegrino (Latim) cnr-latn
Morisyen mfe
Mundang mua
Nahuatl nah
Navajo nv
Ndonga ng
Napolitano nap
Nepalês ne
Ngomba jgo
Niuean niu
Nogay nog
Ndebele do Norte nd
Sami do Norte (Latim) sme
Norueguês no
Nyanja ny
Nyankole nyn
Nzima nzi
Occitano oc
Ojibwa oj
Oromo om
Ossético os
Pampanga pam
Pangasinan pag
Papiamento pap
Pashto ps
Pedi nso
Persa fa
Polaco pl
Português pt
Punjabi (árabe) pa
Quechua qu
Ripuariano ksh
Romeno ro
Romanche rm
Rundi rn
Russo ru
Rwa rwk
Sadri (Devanagari) sck
Sakha sah
Samburu saq
Samoa (Latim) sm
Sango sg
Idioma Código (opcional)
Sangu (Gabão) snq
Sânscrito (Devanagari) sa
Santali(Devanagiri) sat
Escoceses sco
Gaélico escocês gd
Sena seh
Sérvio (Cirílico) sr-cyrl
Sérvio (Latim) sr, sr-latn
Shambala ksb
Shona sn
Siksika bla
Sirmauri (Devanagari) srx
Skolt Sami sms
Eslovaco sk
Esloveno sl
Soga xog
Somali (árabe) so
Somali (Latim) so-latn
Songhai son
Ndebele do Sul nr
Altai do Sul alt
Sami Meridional sma
Sotho do Sul st
Espanhol es
Sundanês su
Swahili (latim) sw
Suazilândia ss
Sueco sv
Tabassaran tab
Tachelhit shi
Taitiano ty
Taita dav
Tajique (cirílico) tg
Tâmil ta
Tártaro (cirílico) tt-cyrl
Tártaro (Latim) tt
Teso teo
Tétum tet
Tailandês th
Thangmi thf
Tok Pisin tpi
Tonga to
Tsonga ts
Tswana tn
Turco tr
Turquemeno (latim) tk
Tuvan tyv
Udmurt udm
Uigur (cirílico) ug-cyrl
Ucraniano uk
Alto Sorábio hsb
Urdu ur
Uigur (árabe) ug
Uzbeque (árabe) uz-arab
Usbeque (Cirílico) uz-cyrl
Uzbeque (Latim) uz
Vietnamita vi
Volapük vo
Vunjo vun
Walser wae
Galês cy
Frísio Ocidental fy
Wolof wo
Xhosa xh
Iucatego yua
Zapoteca zap
Zarma dje
Zhuang za
Zulu zu

A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso .

Idioma Código (opcional)
Afrikaans af
Angika anp
Árabe ar
Asturiano ast
Awadhi awa
Azerbaijanês az
Bielorrusso (cirílico) be, be-cyrl
Bielorrusso (Latim) be-latn
Bagheli bfy
Mahasu Pahari bfz
Búlgaro bg
Haryanvi bgc
Bhojpuri bho
Bislama bi
Bundeli bns
Bretão br
Braj bra
Bodo brx
Bósnio bs
Buriat bua
Catalão ca
Cebuano ceb
Chamorro ch
Montenegrino (Latim) cnr, cnr-latn
Montenegrino (cirílico) cnr-cyrl
Córsega co
Tártaro da Crimeia crh
Checo cs
Kashubian csb
Galês cy
Dinamarquês da
Alemão de
Dhimal dhi
Dogri doi
Baixo Sorbian dsb
Inglês en
Espanhol es
Estónio et
Basco eu
Persa fa
Finlandês fi
Filipino fil
Idioma Código (opcional)
Fijiano fj
Faroense fo
Francês fr
Friuliano fur
Frísio Ocidental fy
Irlandês ga
Gagauz gag
Gaélico escocês gd
Gilbertese gil
Galego gl
Gondi gon
Manx gv
Gurung gvr
Havaiano haw
Hindi hi
Halbi hlb
Chhattisgarhi hne
Hani hni
Ho hoc
Croata hr
Alto Sorábio hsb
Haitiano ht
Húngaro hu
Interlíngua ia
Indonésio id
Islandês is
Italiano it
Inuktitut iu
Japonês
Jaunsari jns
Javanês jv
Kara-Kalpak (Latim) kaa, kaa-latn
Kara-Kalpak (cirílico) kaa-cyrl
Kachin kac
Kabuverdianu kea
Korku kfq
Khasi kha
Cazaque (Latim) kk, kk-latn
Cazaque (cirílico) kk-cyrl
Kalaallisut kl
Khaling klr
Malto kmj
Idioma Código (opcional)
Coreano
Kosraean kos
Koryak kpy
Karachay-Balkar krc
Kurukh kru
Kölsch ksh
Curdo (latim) ku, ku-latn
Curdo (árabe) ku-arab
Kumyk kum
Cornualha kw
Quirguiz ky
Latim la
Luxemburguês lb
Lakota lkt
Lituano lt
Maori mi
Mongol mn
Marata mr
Malaio ms
Maltês mt
Hmong Daw mww
Erzya myv
Napolitano nap
Nepalês ne
Niuean niu
Neerlandês nl
Norueguês no
Nogai nog
Occitano oc
Ossétia os
Panjabi pa
Polaco pl
Dari prs
Pushto ps
Português pt
K'iche» quc
Camling rab
Romanche rm
Romeno ro
Russo ru
Sânscrito sa
Santali sat
Idioma Código (opcional)
Sadri sck
Escoceses sco
Eslovaco sk
Esloveno sl
Samoano sm
Sami Meridional sma
Sami do Norte sme
Lule Sami smj
Inari Sami smn
Skolt Sami sms
Somali so
Albanês sq
Sérvio (Latim) sr, sr-latn
Sirmauri srx
Sueco sv
Suaíli sw
Tétum tet
Tajique tg
Thangmi thf
Turquemenistão tk
Tonga to
Turco tr
Tatar tt
Tuviniano tyv
Uigur ug
Urdu ur
Uzbeque (Latim) uz, uz-latn
Usbeque (Cirílico) uz-cyrl
Uzbeque (árabe) uz-arab
Volapük vo
Walser wae
Kangri xnr
Yucateco yua
Zhuang za
Chinês (Han (variante simplificada)) zh, zh-hans
Chinês (Han (variante tradicional)) zh-hant
Zulu zu

Esquema

ID do modelo: layout pré-construído

A tabela a seguir lista os idiomas suportados para texto impresso:

Idioma Código (opcional)
Abaza abq
Abcásia ab
Chinês ace
Acoli ach
Adangme ada
Adyghe ady
Afar aa
Afrikaans af
Akan ak
Albanês sq
Algonquin alq
Angika (Devanagari) anp
Árabe ar
Asturiano ast
Asu (Tanzânia) asa
Avaric av
Awadhi-Hindi (Devanagari) awa
Aymara ay
Azerbaijão (Latim) az
Máfia ksf
Bagheli bfy
Bambara bm
Basquir ba
Basco eu
Bielorrusso (cirílico) be, be-cyrl
Bielorrusso (Latim) be, be-latn
Bemba (Zâmbia) bem
Bena (Tanzânia) bez
Bhojpuri-Hindi (Devanagari) bho
Bikol bik
Bini bin
Bislama bi
Bodo (Devanagari) brx
Bósnio (Latim) bs
Brajbha bra
Bretão br
Búlgaro bg
Bundeli bns
Buryat (cirílico) bua
Catalão ca
Cebuano ceb
Chamling rab
Chamorro ch
Checheno ce
Chhattisgarhi (Devanagari) hne
Chiga cgg
Chineses (Simplificado) zh-Hans
Chinês (Tradicional) zh-Hant
Choctaw cho
Chukot ckt
Chuvash cv
Cornualha kw
Córsega co
Cree cr
Riacho mus
Tártaro da Crimeia (latim) crh
Croata hr
Corvo cro
Checo cs
Dinamarquês da
Dargwa dar
Dari prs
Dhimal (Devanagari) dhi
Dogri (Devanagari) doi
Duala dua
Dungan dng
Neerlandês nl
Efik efi
Inglês en
Erzya (cirílico) myv
Estónio et
Faroense fo
Fijiano fj
Filipino fil
Finlandês fi
Idioma Código (opcional)
Fon fon
Francês fr
Friuliano fur
Ga gaa
Gagauz (latim) gag
Galego gl
Ganda lg
Gayo gay
Alemão de
Gilbertese gil
Gondi (Devanagari) gon
Grego el
Gronelândia kl
Guarani gn
Gurung (Devanagari) gvr
Gusii guz
Crioulo haitiano ht
Halbi (Devanagari) hlb
Hani hni
Haryanvi bgc
Havaiano haw
Hebraico he
Herero hz
Hiligaynon hil
Hindi hi
Hmong Daw (Latim) mww
Ho(Devanagiri) hoc
Húngaro hu
Iban iba
Islandês is
Igbo ig
Iloko ilo
Inari Sami smn
Indonésio id
Inguche inh
Interlíngua ia
Inuktitut (latim) iu
Irlandês ga
Italiano it
Japonês ja
Jaunsari (Devanagari) Jns
Javanês jv
Jola-Fonyi dyo
Kabardiano kbd
Kabuverdianu kea
Kachin (Latim) kac
Kalenjin kln
Kalmyk xal
Kangri (Devanagari) xnr
Kanuri kr
Karachay-Balkar krc
Kara-Kalpak (cirílico) kaa-cyrl
Kara-Kalpak (Latim) kaa
Kashubian csb
Cazaque (cirílico) kk-cyrl
Cazaque (Latim) kk-latn
Khakas kjh
Khaling klr
Khasi kha
K'iche» quc
Kikuyu ki
Kildin Sami sjd
Kinyarwanda rw
Komi kv
Kongo kg
Coreano ko
Korku kfq
Koryak kpy
Kosraean kos
Kpelle kpe
Kuanyama kj
Kumyk (cirílico) kum
Curdo (árabe) ku-arab
Curdo (latim) ku-latn
Idioma Código (opcional)
Kurukh (Devanagari) kru
Quirguistão (cirílico) ky
Lak lbe
Lakota lkt
Latim la
Letão lv
Lezghian lex
Lingala ln
Lituano lt
Baixo Sorbian dsb
Lozi loz
Lule Sami smj
Luo (Quênia e Tanzânia) luo
Luxemburguês lb
Luyia luy
Macedónio mk
Machame jmc
Madurese mad
Mahasu Pahari (Devanagari) bfz
Makhuwa-Meetto mgh
Makonde kde
Malgaxe mg
Malaio (Latim) ms
Maltês mt
Malto (Devanagari) kmj
Mandinka mnk
Manx gv
Maori mi
Mapudungun arn
Marata mr
Mari (Rússia) chm
Masai mas
Mende (Serra Leoa) men
Meru mer
Meta» mgo
Minangkabau min
Mohawk moh
Mongol (cirílico) mn
Mongondow mog
Montenegrino (cirílico) cnr-cyrl
Montenegrino (Latim) cnr-latn
Morisyen mfe
Mundang mua
Nahuatl nah
Navajo nv
Ndonga ng
Napolitano nap
Nepalês ne
Ngomba jgo
Niuean niu
Nogay nog
Ndebele do Norte nd
Sami do Norte (Latim) sme
Norueguês no
Nyanja ny
Nyankole nyn
Nzima nzi
Occitano oc
Ojibwa oj
Oromo om
Ossético os
Pampanga pam
Pangasinan pag
Papiamento pap
Pashto ps
Pedi nso
Persa fa
Polaco pl
Português pt
Punjabi (árabe) pa
Quechua qu
Ripuariano ksh
Romeno ro
Romanche rm
Rundi rn
Russo ru
Idioma Código (opcional)
Rwa rwk
Sadri (Devanagari) sck
Sakha sah
Samburu saq
Samoa (Latim) sm
Sango sg
Sangu (Gabão) snq
Sânscrito (Devanagari) sa
Santali(Devanagiri) sat
Escoceses sco
Gaélico escocês gd
Sena seh
Sérvio (Cirílico) sr-cyrl
Sérvio (Latim) sr, sr-latn
Shambala ksb
Shona sn
Siksika bla
Sirmauri (Devanagari) srx
Skolt Sami sms
Eslovaco sk
Esloveno sl
Soga xog
Somali (árabe) so
Somali (Latim) so-latn
Songhai son
Ndebele do Sul nr
Altai do Sul alt
Sami Meridional sma
Sotho do Sul st
Espanhol es
Sundanês su
Swahili (latim) sw
Suazilândia ss
Sueco sv
Tabassaran tab
Tachelhit shi
Taitiano ty
Taita dav
Tajique (cirílico) tg
Tâmil ta
Tártaro (cirílico) tt-cyrl
Tártaro (Latim) tt
Teso teo
Tétum tet
Tailandês th
Thangmi thf
Tok Pisin tpi
Tonga to
Tsonga ts
Tswana tn
Turco tr
Turquemeno (latim) tk
Tuvan tyv
Udmurt udm
Uigur (cirílico) ug-cyrl
Ucraniano uk
Alto Sorábio hsb
Urdu ur
Uigur (árabe) ug
Uzbeque (árabe) uz-arab
Usbeque (Cirílico) uz-cyrl
Uzbeque (Latim) uz
Vietnamita vi
Volapük vo
Vunjo vun
Walser wae
Galês cy
Frísio Ocidental fy
Wolof wo
Xhosa xh
Iucatego yua
Zapoteca zap
Zarma dje
Zhuang za
Zulu zu

A tabela a seguir lista o suporte à linguagem do modelo de layout para extrair e analisar texto impresso .

Idioma Código (opcional)
Afrikaans af
Angika anp
Árabe ar
Asturiano ast
Awadhi awa
Azerbaijanês az
Bielorrusso (cirílico) be, be-cyrl
Bielorrusso (Latim) be-latn
Bagheli bfy
Mahasu Pahari bfz
Búlgaro bg
Haryanvi bgc
Bhojpuri bho
Bislama bi
Bundeli bns
Bretão br
Braj bra
Bodo brx
Bósnio bs
Buriat bua
Catalão ca
Cebuano ceb
Chamorro ch
Montenegrino (Latim) cnr, cnr-latn
Montenegrino (cirílico) cnr-cyrl
Córsega co
Tártaro da Crimeia crh
Checo cs
Kashubian csb
Galês cy
Dinamarquês da
Alemão de
Dhimal dhi
Dogri doi
Baixo Sorbian dsb
Inglês en
Espanhol es
Estónio et
Basco eu
Persa fa
Finlandês fi
Filipino fil
Idioma Código (opcional)
Fijiano fj
Faroense fo
Francês fr
Friuliano fur
Frísio Ocidental fy
Irlandês ga
Gagauz gag
Gaélico escocês gd
Gilbertese gil
Galego gl
Gondi gon
Manx gv
Gurung gvr
Havaiano haw
Hindi hi
Halbi hlb
Chhattisgarhi hne
Hani hni
Ho hoc
Croata hr
Alto Sorábio hsb
Haitiano ht
Húngaro hu
Interlíngua ia
Indonésio id
Islandês is
Italiano it
Inuktitut iu
Japonês
Jaunsari jns
Javanês jv
Kara-Kalpak (Latim) kaa, kaa-latn
Kara-Kalpak (cirílico) kaa-cyrl
Kachin kac
Kabuverdianu kea
Korku kfq
Khasi kha
Cazaque (Latim) kk, kk-latn
Cazaque (cirílico) kk-cyrl
Kalaallisut kl
Khaling klr
Malto kmj
Idioma Código (opcional)
Coreano
Kosraean kos
Koryak kpy
Karachay-Balkar krc
Kurukh kru
Kölsch ksh
Curdo (latim) ku, ku-latn
Curdo (árabe) ku-arab
Kumyk kum
Cornualha kw
Quirguiz ky
Latim la
Luxemburguês lb
Lakota lkt
Lituano lt
Maori mi
Mongol mn
Marata mr
Malaio ms
Maltês mt
Hmong Daw mww
Erzya myv
Napolitano nap
Nepalês ne
Niuean niu
Neerlandês nl
Norueguês no
Nogai nog
Occitano oc
Ossétia os
Panjabi pa
Polaco pl
Dari prs
Pushto ps
Português pt
K'iche» quc
Camling rab
Romanche rm
Romeno ro
Russo ru
Sânscrito sa
Santali sat
Idioma Código (opcional)
Sadri sck
Escoceses sco
Eslovaco sk
Esloveno sl
Samoano sm
Sami Meridional sma
Sami do Norte sme
Lule Sami smj
Inari Sami smn
Skolt Sami sms
Somali so
Albanês sq
Sérvio (Latim) sr, sr-latn
Sirmauri srx
Sueco sv
Suaíli sw
Tétum tet
Tajique tg
Thangmi thf
Turquemenistão tk
Tonga to
Turco tr
Tatar tt
Tuviniano tyv
Uigur ug
Urdu ur
Uzbeque (Latim) uz, uz-latn
Usbeque (Cirílico) uz-cyrl
Uzbeque (árabe) uz-arab
Volapük vo
Walser wae
Kangri xnr
Yucateco yua
Zhuang za
Chinês (Han (variante simplificada)) zh, zh-hans
Chinês (Han (variante tradicional)) zh-hant
Zulu zu
Linguagem Código de idioma
Afrikaans af
Albanês sq
Asturiano ast
Basco eu
Bislama bi
Bretão br
Catalão ca
Cebuano ceb
Chamorro ch
Chinês (Simplificado) zh-Hans
Chinês (Tradicional) zh-Hant
Cornualha kw
Córsega co
Tártaro da Crimeia (latim) crh
Checo cs
Dinamarquês da
Neerlandês nl
Inglês (impresso e manuscrito) en
Estónio et
Fijiano fj
Filipino fil
Finlandês fi
Francês fr
Friuliano fur
Galego gl
Alemão de
Gilbertese gil
Gronelândia kl
Crioulo haitiano ht
Hani hni
Hmong Daw (Latim) mww
Húngaro hu
Indonésio id
Interlíngua ia
Inuktitut (latim) iu
Irlandês ga
Linguagem Código de idioma
Italiano it
Japonês ja
Javanês jv
K'iche» quc
Kabuverdianu kea
Kachin (Latim) kac
Kara-Kalpak kaa
Kashubian csb
Khasi kha
Coreano ko
Curdo (latim) kur
Luxemburguês lb
Malaio (Latim) ms
Manx gv
Napolitano nap
Norueguês no
Occitano oc
Polaco pl
Português pt
Romanche rm
Escoceses sco
Gaélico escocês gd
Esloveno slv
Espanhol es
Swahili (latim) sw
Sueco sv
Tártaro (Latim) tat
Tétum tet
Turco tr
Alto Sorábio hsb
Uzbeque (Latim) uz
Volapük vo
Walser wae
Frísio Ocidental fy
Iucatego yua
Zhuang za
Zulu zu

Documento geral

Importante

Com o Document Intelligence v4.0:2024-07-31-preview, 2023-10-31-preview e no futuro, o modelo geral do documento (prebuilt-document) está sendo adicionado ao layout (prebuilt-layout). Para extrair pares chave-valor, marcas de seleção, texto, tabelas e estrutura de documentos, use os seguintes modelos:

Pares de valores-chave versão Model ID
Modelo de layout com seqüência de caracteres de features=keyValuePairs consulta especificada. • v4:2024-02-29-pré-visualização, 2023-10-31-pré-visualização
• v3.1:2023-07-31 (GA)
prebuilt-layout
Modelo de documento geral • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
prebuilt-document
ID do modelo: documento pré-construído

A tabela a seguir lista o suporte geral ao idioma do modelo de documento.

Modelo ID Idioma—Código de localidade Predefinido
documento pré-construído Inglês (Estados Unidos)—en-US Inglês (Estados Unidos)—en-US