Suporte ao idioma: análise de documentos
Este conteúdo se aplica a: v3.1 (GA) | Versão mais recente: v4.0 (versão prévia) | Versões anteriores: v3.0 v2.1
Este conteúdo se aplica a: v3.0 (GA) | Versões mais recentes: v4.0 (versão prévia) v3.1 | Versão anterior: v2.1
Este conteúdo se aplica a: v2.1 | Versão mais recente: v4.0 (versão prévia)
Os modelos da IA do Azure para Informação de Documentos fornecem suporte ao processamento de documentos multilíngue. Nossos recursos de suporte a idiomas permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem a divulgação global. Os modelos de análise de documentos permitem a extração de texto de formulários e documentos e retornam conteúdo estruturado pronto para negócios pronto para a ação, o uso ou o progresso da sua organização. As tabelas a seguir listam o suporte ao idioma e local disponíveis por modelo e recurso:
- Leitura: o modelo de leitura permite a extração e análise de texto impresso e manuscrito. O modelo é o mecanismo de OCR subjacente para outros modelos predefinidos da Informação de Documentos, como layout, documento geral, fatura, recibo, identidade (ID), cartão de seguro saúde, documentos fiscais e modelos personalizados. Para saber mais, confira Visão geral do modelo de Leitura
- Layout: o modelo de layout permite a extração e análise de texto, tabelas, estrutura de documentos e marcas de seleção (como botões de opção e caixas de seleção) de formulários e documentos.
- Documento geral: o modelo de documento geral permite a extração e análise de texto, estrutura do documentos e pares chave-valor. Para obter mais informações, confira Visão geral do modelo de documento geral
Observação
Código de idioma opcional
Os modelos universais baseados em aprendizado profundo da Informação de Documentos extraem todo o texto multilíngue em seus documentos, incluindo linhas de texto com idiomas mistos, e não exigem a especificação de um código de idioma.
Não forneça o código de idioma como o parâmetro, a menos que você tenha certeza do idioma e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço poderá retornar texto incompleto e incorreto.
Também não é necessário especificar um local. Esse é um parâmetro opcional. A tecnologia de aprendizagem profunda da Informação de Documentos detectará automaticamente o idioma do texto em sua imagem.
Modelo de Leitura
ID do modelo: prebuilt-read
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso.
Idioma | Código (opcional) |
---|---|
Abaza | abq |
Abecásia | ab |
Achinese | ace |
Acoli | ach |
Adangme | ada |
Adyghe | ady |
Afar | aa |
Africâner | af |
Akan | ak |
Albanês | sq |
Algonquin | alq |
Angika (Devanagari) | anp |
Árabe | ar |
Asturiano | ast |
Asu (Tanzânia) | asa |
Avaric | av |
Awadhi-Hindi (Devanagari) | awa |
Aimará | ay |
Azerbaidjano (Latino) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Bashkir | ba |
Basco | eu |
bielorrusso (cirílico) | be , be-cyrl |
bielorrusso (latino) | be , be-latn |
Bemba (Zâmbia) | bem |
Bena (Tanzânia) | bez |
Bhojpuri-Hindi (Devanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (Devanagari) | brx |
Bósnio (Latino) | bs |
Brajbha | bra |
Bretão | br |
Búlgaro | bg |
Bundeli | bns |
buryat (cirílico) | bua |
Catalão | ca |
Cebuano | ceb |
Chamling | rab |
Chamorro | ch |
Checheno | ce |
Chhattisgarhi (Devanagari) | hne |
Chiga | cgg |
Chinês simplificado | zh-Hans |
Chinês tradicional | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Chuvash | cv |
Córnico | kw |
Corso | co |
Cree | cr |
Creek | mus |
Tártaro da Crimeia (latim) | crh |
Croata | hr |
Crow | cro |
Tcheco | cs |
Dinamarquês | da |
Dargwa | dar |
Dari | prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | doi |
Duala | dua |
Dungan | dng |
Holandês | nl |
Efik | efi |
Português do Brasil | en |
erzya (cirílico) | myv |
Estoniano | et |
Faroês | fo |
Fijiano | fj |
Filipino | fil |
Finlandês | fi |
Idioma | Código (opcional) |
---|---|
Fon |
fon |
Francês | fr |
Friuliano | fur |
Ga |
gaa |
gagauz (latino) | gag |
Galego | gl |
Ganda | lg |
Gayo | gay |
Alemão | de |
Gilbertês | gil |
Gondi (Devanagari) | gon |
Grego | el |
Groenlandês | kl |
Guarani | gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Crioulo Haitiano | ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
havaiano | haw |
Hebraico | he |
Herero | hz |
Hiligaynon | hil |
Híndi | hi |
Hmong daw (latim) | mww |
Ho(Devanagiri) | hoc |
Húngaro | hu |
Iban | iba |
Islandês | is |
Igbo | ig |
Iloko | ilo |
sami de Inari | smn |
Indonésio | id |
Ingush | inh |
Interlíngua | ia |
Inuktitut (Latino) | iu |
Irlandês | ga |
Italiano | it |
Japonês | ja |
Jaunsari (Devanagari) | Jns |
Javanês | jv |
Jola-Fonyi | dyo |
Kabardian | kbd |
Kabuverdianu | kea |
Kachin (latim) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | kr |
Karachay-Balkar | krc |
kara-kalpak (cirílico) | kaa-cyrl |
Caracalpaque (latino) | kaa |
Cashubiano | csb |
cazaque (cirílico) | kk-cyrl |
cazaque (latino) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | kha |
Quiché | quc |
Kikuyu | ki |
Kildin Sami | sjd |
Quiniaruanda | rw |
Komi | kv |
Kongo | kg |
Coreano | ko |
Korku | kfq |
koryak | kpy |
kosraean | kos |
Kpelle | kpe |
Kuanyama | kj |
kumyk (cirílico) | kum |
Curdo (árabe) | ku-arab |
Curdo (latino) | ku-latn |
Kurukh (Devanagari) | kru |
quirguiz (cirílico) | ky |
Lak |
lbe |
Lakota | lkt |
Idioma | Código (opcional) |
---|---|
Latim | la |
Letão | lv |
Lezghian | lex |
Lingala | ln |
Lituano | lt |
baixo sorábio | dsb |
Lozi | loz |
sami de Lule | smj |
Luo (Quênia e Tanzânia) | luo |
Luxemburguês | lb |
Luyia | luy |
Macedônio | mk |
Machame | jmc |
Madurese | mad |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | mgh |
Makonde | kde |
Malgaxe | mg |
Malaio (latino) | ms |
Maltês | mt |
Malto (Devanagari) | kmj |
Mandinka | mnk |
Manx | gv |
Maori | mi |
Mapudungun | arn |
Marati | mr |
Mari (Rússia) | chm |
Masai | mas |
Mende (Serra Leoa) | men |
Meru | mer |
Meta' | mgo |
Minangkabau | min |
Mohawk | moh |
Mongol (Cirílico) | mn |
Mongondow | mog |
montenegrino (cirílico) | cnr-cyrl |
montenegrino (latino) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Napolitano | nap |
Nepalês | ne |
Ngomba | jgo |
niueano | niu |
nogay | nog |
Ndebele do Norte | nd |
sami setentrional (latino) | sme |
Norueguês | no |
Nianja | ny |
Nyankole | nyn |
Nzima | nzi |
Occitânico | oc |
Ojibwa | oj |
Oromo | om |
osseto | os |
Pampanga | pam |
Pangasinan | pag |
Papiamento | pap |
Pashto | ps |
Pedi | nso |
Persa | fa |
Polonês | pl |
Português | pt |
Punjabi (Árabe) | pa |
Quíchua | qu |
ripuário | ksh |
Romeno | ro |
Romanche | rm |
Rundi | rn |
Russo | ru |
Rwa |
rwk |
Sadri (Devanagari) | sck |
Sakha | sah |
Samburu | saq |
samoano (latino) | sm |
Sango | sg |
Idioma | Código (opcional) |
---|---|
Sangu (Gabão) | snq |
Sanskrit (Devanagari) | sa |
Santali(Devanagiri) | sat |
Escocês | sco |
Gaélico escocês | gd |
Sena | seh |
Sérvio (Cirílico) | sr-cyrl |
Sérvio (Latino) | sr , sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Devanagari) | srx |
sami de Skolt | sms |
Eslovaco | sk |
Esloveno | sl |
Soga | xog |
Somali (árabe) | so |
Somali (latino) | so-latn |
Songhai | son |
Ndebele do Sul | nr |
Altai do Sul | alt |
sami do sul | sma |
Sotho do Sul | st |
Espanhol | es |
Sundanês | su |
Suaíli (latim) | sw |
Swati | ss |
Sueco | sv |
Tabassaran | tab |
Tachelhit | shi |
Taitiano | ty |
Taita | dav |
Tadjique (Cirílico) | tg |
Tâmil | ta |
Tatar (cirílico) | tt-cyrl |
Tártaro (latim) | tt |
Teso | teo |
Tetum | tet |
Tailandês | th |
Thani | thf |
Tok Pisin | tpi |
Tonga | to |
Tsonga | ts |
Tswana | tn |
Turco | tr |
turcomeno (latino) | tk |
Tuva | tyv |
Udmurt | udm |
Uighur (cirílico) | ug-cyrl |
Ucraniano | uk |
Sorábio Alto | hsb |
Urdu | ur |
Uigur (árabe) | ug |
Usbeque (árabe) | uz-arab |
Uzbeque (cirílico) | uz-cyrl |
Uzbeque (latino) | uz |
Vietnamita | vi |
Volapuque | vo |
Vunjo | vun |
Walser | wae |
Galês | cy |
Frísio ocidental | fy |
Wolof | wo |
Xhosa | xh |
Maia Iucateque | yua |
Zapoteca | zap |
Zarma | dje |
Zuangue | za |
Zulu | zu |
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso.
Idioma | Código (opcional) |
---|---|
Africâner | af |
Angika | anp |
Árabe | ar |
Asturiano | ast |
Awadhi | awa |
Azerbaijano | az |
bielorrusso (cirílico) | be , be-cyrl |
bielorrusso (latino) | be-latn |
Bagheli | bfy |
Mahasu Pahari | bfz |
Búlgaro | bg |
Haryanvi | bgc |
Bhojpuri | bho |
Bislama | bi |
Bundeli | bns |
Bretão | br |
Braj | bra |
Bodo | brx |
Bósnio | bs |
Buriat | bua |
Catalão | ca |
Cebuano | ceb |
Chamorro | ch |
montenegrino (latino) | cnr , cnr-latn |
montenegrino (cirílico) | cnr-cyrl |
Corso | co |
Tártaro da Crimeia | crh |
Tcheco | cs |
Cashubiano | csb |
Galês | cy |
Dinamarquês | da |
Alemão | de |
Dhimal | dhi |
Dogri | doi |
baixo sorábio | dsb |
Inglês | en |
Espanhol | es |
Estoniano | et |
Basco | eu |
Persa | fa |
Finlandês | fi |
Filipino | fil |
Idioma | Código (opcional) |
---|---|
Fijiano | fj |
Faroês | fo |
Francês | fr |
Friuliano | fur |
Frísio ocidental | fy |
Irlandês | ga |
Gagauz | gag |
Gaélico escocês | gd |
Gilbertês | gil |
Galego | gl |
Gondi | gon |
Manx | gv |
Gurung | gvr |
havaiano | haw |
Híndi | hi |
Halbi | hlb |
Chhattisgarhi | hne |
Hani | hni |
Ho |
hoc |
Croata | hr |
Sorábio Alto | hsb |
Haitiano | ht |
Húngaro | hu |
Interlíngua | ia |
Indonésio | id |
Islandês | is |
Italiano | it |
Inuktitut | iu |
Japonês | |
Jaunsari | jns |
Javanês | jv |
Caracalpaque (latino) | kaa , kaa-latn |
kara-kalpak (cirílico) | kaa-cyrl |
Kachin | kac |
Kabuverdianu | kea |
Korku | kfq |
Khasi | kha |
cazaque (latino) | kk , kk-latn |
cazaque (cirílico) | kk-cyrl |
Kalaallisut | kl |
Khaling | klr |
Malto | kmj |
Idioma | Código (opcional) |
---|---|
Coreano | |
kosraean | kos |
koryak | kpy |
Karachay-Balkar | krc |
Kurukh | kru |
Kölsch | ksh |
Curdo (latino) | ku , ku-latn |
Curdo (árabe) | ku-arab |
Kumyk | kum |
Córnico | kw |
Quirguiz | ky |
Latim | la |
Luxemburguês | lb |
Lakota | lkt |
Lituano | lt |
Maori | mi |
Mongol | mn |
Marati | mr |
Malaio | ms |
Maltês | mt |
Hmong Daw |
mww |
Erzya | myv |
Napolitano | nap |
Nepalês | ne |
niueano | niu |
Holandês | nl |
Norueguês | no |
Nogai | nog |
Occitânico | oc |
Ossetian | os |
Panjabi | pa |
Polonês | pl |
Dari | prs |
Pushto | ps |
Português | pt |
Quiché | quc |
Camling | rab |
Romanche | rm |
Romeno | ro |
Russo | ru |
Sânscrito | sa |
Santali | sat |
Idioma | Código (opcional) |
---|---|
Sadri | sck |
Escocês | sco |
Eslovaco | sk |
Esloveno | sl |
Samoano | sm |
sami do sul | sma |
Sami do Norte | sme |
sami de Lule | smj |
sami de Inari | smn |
sami de Skolt | sms |
Somali | so |
Albanês | sq |
Sérvio (latino) | sr , sr-latn |
Sirmauri | srx |
Sueco | sv |
Swahili | sw |
Tetum | tet |
Tajik | tg |
Thani | thf |
Turcomeno | tk |
Tonga | to |
Turco | tr |
Tártaro | tt |
Tuviniano | tyv |
Uighur | ug |
Urdu | ur |
Uzbeque (latino) | uz , uz-latn |
Uzbeque (cirílico) | uz-cyrl |
Usbeque (árabe) | uz-arab |
Volapuque | vo |
Walser | wae |
Kangri | xnr |
Yucateco | yua |
Zuangue | za |
Chinês (Han (variante simplificada)) | zh , zh-hans |
Chinês (Han (variante tradicional)) | zh-hant |
Zulu | zu |
Layout
ID do modelo: prebuilt-layout
A tabela a seguir lista os idiomas com suporte para texto impresso:
Idioma | Código (opcional) |
---|---|
Abaza | abq |
Abecásia | ab |
Achinese | ace |
Acoli | ach |
Adangme | ada |
Adyghe | ady |
Afar | aa |
Africâner | af |
Akan | ak |
Albanês | sq |
Algonquin | alq |
Angika (Devanagari) | anp |
Árabe | ar |
Asturiano | ast |
Asu (Tanzânia) | asa |
Avaric | av |
Awadhi-Hindi (Devanagari) | awa |
Aimará | ay |
Azerbaidjano (Latino) | az |
Bafia | ksf |
Bagheli | bfy |
Bambara | bm |
Bashkir | ba |
Basco | eu |
bielorrusso (cirílico) | be , be-cyrl |
bielorrusso (latino) | be , be-latn |
Bemba (Zâmbia) | bem |
Bena (Tanzânia) | bez |
Bhojpuri-Hindi (Devanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (Devanagari) | brx |
Bósnio (Latino) | bs |
Brajbha | bra |
Bretão | br |
Búlgaro | bg |
Bundeli | bns |
buryat (cirílico) | bua |
Catalão | ca |
Cebuano | ceb |
Chamling | rab |
Chamorro | ch |
Checheno | ce |
Chhattisgarhi (Devanagari) | hne |
Chiga | cgg |
Chinês simplificado | zh-Hans |
Chinês tradicional | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Chuvash | cv |
Córnico | kw |
Corso | co |
Cree | cr |
Creek | mus |
Tártaro da Crimeia (latim) | crh |
Croata | hr |
Crow | cro |
Tcheco | cs |
Dinamarquês | da |
Dargwa | dar |
Dari | prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | doi |
Duala | dua |
Dungan | dng |
Holandês | nl |
Efik | efi |
Português do Brasil | en |
erzya (cirílico) | myv |
Estoniano | et |
Faroês | fo |
Fijiano | fj |
Filipino | fil |
Finlandês | fi |
Idioma | Código (opcional) |
---|---|
Fon |
fon |
Francês | fr |
Friuliano | fur |
Ga |
gaa |
gagauz (latino) | gag |
Galego | gl |
Ganda | lg |
Gayo | gay |
Alemão | de |
Gilbertês | gil |
Gondi (Devanagari) | gon |
Grego | el |
Groenlandês | kl |
Guarani | gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Crioulo Haitiano | ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
havaiano | haw |
Hebraico | he |
Herero | hz |
Hiligaynon | hil |
Híndi | hi |
Hmong daw (latim) | mww |
Ho(Devanagiri) | hoc |
Húngaro | hu |
Iban | iba |
Islandês | is |
Igbo | ig |
Iloko | ilo |
sami de Inari | smn |
Indonésio | id |
Ingush | inh |
Interlíngua | ia |
Inuktitut (Latino) | iu |
Irlandês | ga |
Italiano | it |
Japonês | ja |
Jaunsari (Devanagari) | Jns |
Javanês | jv |
Jola-Fonyi | dyo |
Kabardian | kbd |
Kabuverdianu | kea |
Kachin (latim) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | kr |
Karachay-Balkar | krc |
kara-kalpak (cirílico) | kaa-cyrl |
Caracalpaque (latino) | kaa |
Cashubiano | csb |
cazaque (cirílico) | kk-cyrl |
cazaque (latino) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | kha |
Quiché | quc |
Kikuyu | ki |
Kildin Sami | sjd |
Quiniaruanda | rw |
Komi | kv |
Kongo | kg |
Coreano | ko |
Korku | kfq |
koryak | kpy |
kosraean | kos |
Kpelle | kpe |
Kuanyama | kj |
kumyk (cirílico) | kum |
Curdo (árabe) | ku-arab |
Curdo (latino) | ku-latn |
Idioma | Código (opcional) |
---|---|
Kurukh (Devanagari) | kru |
quirguiz (cirílico) | ky |
Lak |
lbe |
Lakota | lkt |
Latim | la |
Letão | lv |
Lezghian | lex |
Lingala | ln |
Lituano | lt |
baixo sorábio | dsb |
Lozi | loz |
sami de Lule | smj |
Luo (Quênia e Tanzânia) | luo |
Luxemburguês | lb |
Luyia | luy |
Macedônio | mk |
Machame | jmc |
Madurese | mad |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | mgh |
Makonde | kde |
Malgaxe | mg |
Malaio (latino) | ms |
Maltês | mt |
Malto (Devanagari) | kmj |
Mandinka | mnk |
Manx | gv |
Maori | mi |
Mapudungun | arn |
Marati | mr |
Mari (Rússia) | chm |
Masai | mas |
Mende (Serra Leoa) | men |
Meru | mer |
Meta' | mgo |
Minangkabau | min |
Mohawk | moh |
Mongol (Cirílico) | mn |
Mongondow | mog |
montenegrino (cirílico) | cnr-cyrl |
montenegrino (latino) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Napolitano | nap |
Nepalês | ne |
Ngomba | jgo |
niueano | niu |
nogay | nog |
Ndebele do Norte | nd |
sami setentrional (latino) | sme |
Norueguês | no |
Nianja | ny |
Nyankole | nyn |
Nzima | nzi |
Occitânico | oc |
Ojibwa | oj |
Oromo | om |
osseto | os |
Pampanga | pam |
Pangasinan | pag |
Papiamento | pap |
Pashto | ps |
Pedi | nso |
Persa | fa |
Polonês | pl |
Português | pt |
Punjabi (Árabe) | pa |
Quíchua | qu |
ripuário | ksh |
Romeno | ro |
Romanche | rm |
Rundi | rn |
Russo | ru |
Idioma | Código (opcional) |
---|---|
Rwa |
rwk |
Sadri (Devanagari) | sck |
Sakha | sah |
Samburu | saq |
samoano (latino) | sm |
Sango | sg |
Sangu (Gabão) | snq |
Sanskrit (Devanagari) | sa |
Santali(Devanagiri) | sat |
Escocês | sco |
Gaélico escocês | gd |
Sena | seh |
Sérvio (Cirílico) | sr-cyrl |
Sérvio (Latino) | sr , sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Devanagari) | srx |
sami de Skolt | sms |
Eslovaco | sk |
Esloveno | sl |
Soga | xog |
Somali (árabe) | so |
Somali (latino) | so-latn |
Songhai | son |
Ndebele do Sul | nr |
Altai do Sul | alt |
sami do sul | sma |
Sotho do Sul | st |
Espanhol | es |
Sundanês | su |
Suaíli (latim) | sw |
Swati | ss |
Sueco | sv |
Tabassaran | tab |
Tachelhit | shi |
Taitiano | ty |
Taita | dav |
Tadjique (Cirílico) | tg |
Tâmil | ta |
Tatar (cirílico) | tt-cyrl |
Tártaro (latim) | tt |
Teso | teo |
Tetum | tet |
Tailandês | th |
Thani | thf |
Tok Pisin | tpi |
Tonga | to |
Tsonga | ts |
Tswana | tn |
Turco | tr |
turcomeno (latino) | tk |
Tuva | tyv |
Udmurt | udm |
Uighur (cirílico) | ug-cyrl |
Ucraniano | uk |
Sorábio Alto | hsb |
Urdu | ur |
Uigur (árabe) | ug |
Usbeque (árabe) | uz-arab |
Uzbeque (cirílico) | uz-cyrl |
Uzbeque (latino) | uz |
Vietnamita | vi |
Volapuque | vo |
Vunjo | vun |
Walser | wae |
Galês | cy |
Frísio ocidental | fy |
Wolof | wo |
Xhosa | xh |
Maia Iucateque | yua |
Zapoteca | zap |
Zarma | dje |
Zuangue | za |
Zulu | zu |
A tabela a seguir lista o suporte à linguagem de modelo de layout para extrair e analisar texto impresso.
Idioma | Código (opcional) |
---|---|
Africâner | af |
Angika | anp |
Árabe | ar |
Asturiano | ast |
Awadhi | awa |
Azerbaijano | az |
bielorrusso (cirílico) | be , be-cyrl |
bielorrusso (latino) | be-latn |
Bagheli | bfy |
Mahasu Pahari | bfz |
Búlgaro | bg |
Haryanvi | bgc |
Bhojpuri | bho |
Bislama | bi |
Bundeli | bns |
Bretão | br |
Braj | bra |
Bodo | brx |
Bósnio | bs |
Buriat | bua |
Catalão | ca |
Cebuano | ceb |
Chamorro | ch |
montenegrino (latino) | cnr , cnr-latn |
montenegrino (cirílico) | cnr-cyrl |
Corso | co |
Tártaro da Crimeia | crh |
Tcheco | cs |
Cashubiano | csb |
Galês | cy |
Dinamarquês | da |
Alemão | de |
Dhimal | dhi |
Dogri | doi |
baixo sorábio | dsb |
Inglês | en |
Espanhol | es |
Estoniano | et |
Basco | eu |
Persa | fa |
Finlandês | fi |
Filipino | fil |
Idioma | Código (opcional) |
---|---|
Fijiano | fj |
Faroês | fo |
Francês | fr |
Friuliano | fur |
Frísio ocidental | fy |
Irlandês | ga |
Gagauz | gag |
Gaélico escocês | gd |
Gilbertês | gil |
Galego | gl |
Gondi | gon |
Manx | gv |
Gurung | gvr |
havaiano | haw |
Híndi | hi |
Halbi | hlb |
Chhattisgarhi | hne |
Hani | hni |
Ho |
hoc |
Croata | hr |
Sorábio Alto | hsb |
Haitiano | ht |
Húngaro | hu |
Interlíngua | ia |
Indonésio | id |
Islandês | is |
Italiano | it |
Inuktitut | iu |
Japonês | |
Jaunsari | jns |
Javanês | jv |
Caracalpaque (latino) | kaa , kaa-latn |
kara-kalpak (cirílico) | kaa-cyrl |
Kachin | kac |
Kabuverdianu | kea |
Korku | kfq |
Khasi | kha |
cazaque (latino) | kk , kk-latn |
cazaque (cirílico) | kk-cyrl |
Kalaallisut | kl |
Khaling | klr |
Malto | kmj |
Idioma | Código (opcional) |
---|---|
Coreano | |
kosraean | kos |
koryak | kpy |
Karachay-Balkar | krc |
Kurukh | kru |
Kölsch | ksh |
Curdo (latino) | ku , ku-latn |
Curdo (árabe) | ku-arab |
Kumyk | kum |
Córnico | kw |
Quirguiz | ky |
Latim | la |
Luxemburguês | lb |
Lakota | lkt |
Lituano | lt |
Maori | mi |
Mongol | mn |
Marati | mr |
Malaio | ms |
Maltês | mt |
Hmong Daw |
mww |
Erzya | myv |
Napolitano | nap |
Nepalês | ne |
niueano | niu |
Holandês | nl |
Norueguês | no |
Nogai | nog |
Occitânico | oc |
Ossetian | os |
Panjabi | pa |
Polonês | pl |
Dari | prs |
Pushto | ps |
Português | pt |
Quiché | quc |
Camling | rab |
Romanche | rm |
Romeno | ro |
Russo | ru |
Sânscrito | sa |
Santali | sat |
Idioma | Código (opcional) |
---|---|
Sadri | sck |
Escocês | sco |
Eslovaco | sk |
Esloveno | sl |
Samoano | sm |
sami do sul | sma |
Sami do Norte | sme |
sami de Lule | smj |
sami de Inari | smn |
sami de Skolt | sms |
Somali | so |
Albanês | sq |
Sérvio (latino) | sr , sr-latn |
Sirmauri | srx |
Sueco | sv |
Swahili | sw |
Tetum | tet |
Tajik | tg |
Thani | thf |
Turcomeno | tk |
Tonga | to |
Turco | tr |
Tártaro | tt |
Tuviniano | tyv |
Uighur | ug |
Urdu | ur |
Uzbeque (latino) | uz , uz-latn |
Uzbeque (cirílico) | uz-cyrl |
Usbeque (árabe) | uz-arab |
Volapuque | vo |
Walser | wae |
Kangri | xnr |
Yucateco | yua |
Zuangue | za |
Chinês (Han (variante simplificada)) | zh , zh-hans |
Chinês (Han (variante tradicional)) | zh-hant |
Zulu | zu |
Linguagem | Código de idioma |
---|---|
Africâner | af |
Albanês | sq |
Asturiano | ast |
Basco | eu |
Bislama | bi |
Bretão | br |
Catalão | ca |
Cebuano | ceb |
Chamorro | ch |
Chinês (Simplificado) | zh-Hans |
Chinês (Tradicional) | zh-Hant |
Córnico | kw |
Corso | co |
Tártaro da Crimeia (latim) | crh |
Tcheco | cs |
Dinamarquês | da |
Holandês | nl |
Inglês (em letra de forma e manuscrito) | en |
Estoniano | et |
Fijiano | fj |
Filipino | fil |
Finlandês | fi |
Francês | fr |
Friuliano | fur |
Galego | gl |
Alemão | de |
Gilbertês | gil |
Groenlandês | kl |
Crioulo haitiano | ht |
Hani | hni |
Hmong daw (latim) | mww |
Húngaro | hu |
Indonésio | id |
Interlíngua | ia |
Inuktitut (Latino) | iu |
Irlandês | ga |
Linguagem | Código do idioma |
---|---|
Italiano | it |
Japonês | ja |
Javanês | jv |
Quiché | quc |
Kabuverdianu | kea |
Kachin (latim) | kac |
Kara-Kalpak | kaa |
Cashubiano | csb |
Khasi | kha |
Coreano | ko |
Curdo (latim) | kur |
Luxemburguês | lb |
Malaio (latino) | ms |
Manx | gv |
Napolitano | nap |
Norueguês | no |
Occitânico | oc |
Polonês | pl |
Português | pt |
Romanche | rm |
Escocês | sco |
Gaélico escocês | gd |
Esloveno | slv |
Espanhol | es |
Suaíli (latim) | sw |
Sueco | sv |
Tártaro (latim) | tat |
Tetum | tet |
Turco | tr |
Alto sorábio | hsb |
Uzbeque (latino) | uz |
Volapuque | vo |
Walser | wae |
Frísio ocidental | fy |
Yucatec Maya | yua |
Zuangue | za |
Zulu | zu |
Documentação geral
Importante
Começando com o Document Intelligence v4.0:2024-02-29-preview, 2023-10-31-preview e posteriores, o modelo de documento geral (documento predefinido) será adicionado ao layout (layout predefinido). Para extrair pares de chave-valor, marcas de seleção, texto, tabelas e estrutura dos documentos use os seguintes modelos:
Pares chave-valor | version | ID do Modelo |
---|---|---|
Modelo de layout com cadeia de caracteres de consulta features=keyValuePairs especificada. |
• v4:2024-02-29-preview, 2023-10-31-preview • v3.1:2023-07-31 (GA) |
prebuilt-layout |
Modelo de documento geral | - v3.1:2023-07-31 (GA) - v3.0:2022-08-31 (GA) |
prebuilt-document |
ID do modelo: prebuilt-document
A tabela a seguir lista o suporte ao idioma do modelo de documento geral.
Modelo ID |
Idioma — código de localidade | Padrão |
---|---|---|
prebuilt-document | Inglês (Estados Unidos) -en-US |
Inglês (Estados Unidos) -en-US |
Comentários
https://aka.ms/ContentUserFeedback.
Em breve: Ao longo de 2024, eliminaremos os problemas do GitHub como o mecanismo de comentários para conteúdo e o substituiremos por um novo sistema de comentários. Para obter mais informações, consulteEnviar e exibir comentários de