Suporte linguístico: análise de documentos
Este conteúdo aplica-se a: v4.0 (pré-visualização) | Versões anteriores: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Este conteúdo aplica-se a: v3.1 (GA) | Última versão: v4.0 (pré-visualização) | Versões anteriores: v3.0 v2.1
Este conteúdo aplica-se a: v3.0 (GA) | Últimas versões: v4.0 (preview) v3.1 | Versão anterior: v2.1
Este conteúdo aplica-se a: v2.1 | Última versão: v4.0 (pré-visualização)
Os modelos do Azure AI Document Intelligence fornecem suporte ao processamento de documentos multilíngue. Nossos recursos de suporte a idiomas permitem que seus usuários se comuniquem com seus aplicativos de maneiras naturais e capacitem o alcance global. Os modelos de análise de documentos permitem a extração de texto de formulários e documentos e retornam conteúdo estruturado pronto para os negócios pronto para a ação, uso ou progresso da sua organização. As tabelas a seguir listam o suporte de idioma e localidade disponível por modelo e recurso:
- Leia: O modelo de leitura permite a extração e análise de texto impresso e manuscrito. Este modelo é o mecanismo de OCR subjacente para outros modelos pré-construídos de Inteligência Documental, como layout, documento geral, fatura, recibo, documento de identidade (ID), cartão de seguro de saúde, documentos fiscais e modelos personalizados. Para obter mais informações, consulte Ler visão geral do modelo
- Layout: O modelo de layout permite extrair e analisar texto, tabelas, estrutura do documento e marcas de seleção (como botões de opção e caixas de seleção) de formulários e documentos.
- Documento geral: O modelo de documento geral permite a extração e análise de texto, estrutura do documento e pares chave-valor. Para obter mais informações, consulte Visão geral do modelo de documento
Nota
Código linguístico opcional
Os modelos universais baseados em aprendizagem profunda do Document Intelligence extraem todo o texto multilíngue em seus documentos, incluindo linhas de texto com idiomas mistos, e não exigem a especificação de um código de idioma.
Não forneça o código do idioma como parâmetro, a menos que tenha certeza do idioma e queira forçar o serviço a aplicar apenas o modelo relevante. Caso contrário, o serviço pode retornar texto incompleto e incorreto.
Além disso, não é necessário especificar uma localidade. Este é um parâmetro opcional. A tecnologia de aprendizagem profunda Document Intelligence irá detetar automaticamente a linguagem de texto na sua imagem.
Ler modelo
ID do modelo: leitura pré-embutida
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso .
Idioma | Código (opcional) |
---|---|
Abaza | abq |
Abcásia | ab |
Chinês | ace |
Acoli | ach |
Adangme | ada |
Adyghe | ady |
Afar | aa |
Afrikaans | af |
Akan | ak |
Albanês | sq |
Algonquin | alq |
Angika (Devanagari) | anp |
Árabe | ar |
Asturiano | ast |
Asu (Tanzânia) | asa |
Avaric | av |
Awadhi-Hindi (Devanagari) | awa |
Aymara | ay |
Azerbaijão (Latim) | az |
Máfia | ksf |
Bagheli | bfy |
Bambara | bm |
Basquir | ba |
Basco | eu |
Bielorrusso (cirílico) | be , be-cyrl |
Bielorrusso (Latim) | be , be-latn |
Bemba (Zâmbia) | bem |
Bena (Tanzânia) | bez |
Bhojpuri-Hindi (Devanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (Devanagari) | brx |
Bósnio (Latim) | bs |
Brajbha | bra |
Bretão | br |
Búlgaro | bg |
Bundeli | bns |
Buryat (cirílico) | bua |
Catalão | ca |
Cebuano | ceb |
Chamling | rab |
Chamorro | ch |
Checheno | ce |
Chhattisgarhi (Devanagari) | hne |
Chiga | cgg |
Chineses (Simplificado) | zh-Hans |
Chinês (Tradicional) | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Chuvash | cv |
Cornualha | kw |
Córsega | co |
Cree | cr |
Riacho | mus |
Tártaro da Crimeia (latim) | crh |
Croata | hr |
Corvo | cro |
Checo | cs |
Dinamarquês | da |
Dargwa | dar |
Dari | prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | doi |
Duala | dua |
Dungan | dng |
Neerlandês | nl |
Efik | efi |
Inglês | en |
Erzya (cirílico) | myv |
Estónio | et |
Faroense | fo |
Fijiano | fj |
Filipino | fil |
Finlandês | fi |
Idioma | Código (opcional) |
---|---|
Fon |
fon |
Francês | fr |
Friuliano | fur |
Ga |
gaa |
Gagauz (latim) | gag |
Galego | gl |
Ganda | lg |
Gayo | gay |
Alemão | de |
Gilbertese | gil |
Gondi (Devanagari) | gon |
Grego | el |
Gronelândia | kl |
Guarani | gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Crioulo haitiano | ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Havaiano | haw |
Hebraico | he |
Herero | hz |
Hiligaynon | hil |
Hindi | hi |
Hmong Daw (Latim) | mww |
Ho(Devanagiri) | hoc |
Húngaro | hu |
Iban | iba |
Islandês | is |
Igbo | ig |
Iloko | ilo |
Inari Sami | smn |
Indonésio | id |
Inguche | inh |
Interlíngua | ia |
Inuktitut (latim) | iu |
Irlandês | ga |
Italiano | it |
Japonês | ja |
Jaunsari (Devanagari) | Jns |
Javanês | jv |
Jola-Fonyi | dyo |
Kabardiano | kbd |
Kabuverdianu | kea |
Kachin (Latim) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | kr |
Karachay-Balkar | krc |
Kara-Kalpak (cirílico) | kaa-cyrl |
Kara-Kalpak (Latim) | kaa |
Kashubian | csb |
Cazaque (cirílico) | kk-cyrl |
Cazaque (Latim) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | kha |
K'iche» | quc |
Kikuyu | ki |
Kildin Sami | sjd |
Kinyarwanda | rw |
Komi | kv |
Kongo | kg |
Coreano | ko |
Korku | kfq |
Koryak | kpy |
Kosraean | kos |
Kpelle | kpe |
Kuanyama | kj |
Kumyk (cirílico) | kum |
Curdo (árabe) | ku-arab |
Curdo (latim) | ku-latn |
Kurukh (Devanagari) | kru |
Quirguistão (cirílico) | ky |
Lak |
lbe |
Lakota | lkt |
Idioma | Código (opcional) |
---|---|
Latim | la |
Letão | lv |
Lezghian | lex |
Lingala | ln |
Lituano | lt |
Baixo Sorbian | dsb |
Lozi | loz |
Lule Sami | smj |
Luo (Quênia e Tanzânia) | luo |
Luxemburguês | lb |
Luyia | luy |
Macedónio | mk |
Machame | jmc |
Madurese | mad |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | mgh |
Makonde | kde |
Malgaxe | mg |
Malaio (Latim) | ms |
Maltês | mt |
Malto (Devanagari) | kmj |
Mandinka | mnk |
Manx | gv |
Maori | mi |
Mapudungun | arn |
Marata | mr |
Mari (Rússia) | chm |
Masai | mas |
Mende (Serra Leoa) | men |
Meru | mer |
Meta» | mgo |
Minangkabau | min |
Mohawk | moh |
Mongol (cirílico) | mn |
Mongondow | mog |
Montenegrino (cirílico) | cnr-cyrl |
Montenegrino (Latim) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Napolitano | nap |
Nepalês | ne |
Ngomba | jgo |
Niuean | niu |
Nogay | nog |
Ndebele do Norte | nd |
Sami do Norte (Latim) | sme |
Norueguês | no |
Nyanja | ny |
Nyankole | nyn |
Nzima | nzi |
Occitano | oc |
Ojibwa | oj |
Oromo | om |
Ossético | os |
Pampanga | pam |
Pangasinan | pag |
Papiamento | pap |
Pashto | ps |
Pedi | nso |
Persa | fa |
Polaco | pl |
Português | pt |
Punjabi (árabe) | pa |
Quechua | qu |
Ripuariano | ksh |
Romeno | ro |
Romanche | rm |
Rundi | rn |
Russo | ru |
Rwa |
rwk |
Sadri (Devanagari) | sck |
Sakha | sah |
Samburu | saq |
Samoa (Latim) | sm |
Sango | sg |
Idioma | Código (opcional) |
---|---|
Sangu (Gabão) | snq |
Sânscrito (Devanagari) | sa |
Santali(Devanagiri) | sat |
Escoceses | sco |
Gaélico escocês | gd |
Sena | seh |
Sérvio (Cirílico) | sr-cyrl |
Sérvio (Latim) | sr , sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Devanagari) | srx |
Skolt Sami | sms |
Eslovaco | sk |
Esloveno | sl |
Soga | xog |
Somali (árabe) | so |
Somali (Latim) | so-latn |
Songhai | son |
Ndebele do Sul | nr |
Altai do Sul | alt |
Sami Meridional | sma |
Sotho do Sul | st |
Espanhol | es |
Sundanês | su |
Swahili (latim) | sw |
Suazilândia | ss |
Sueco | sv |
Tabassaran | tab |
Tachelhit | shi |
Taitiano | ty |
Taita | dav |
Tajique (cirílico) | tg |
Tâmil | ta |
Tártaro (cirílico) | tt-cyrl |
Tártaro (Latim) | tt |
Teso | teo |
Tétum | tet |
Tailandês | th |
Thangmi | thf |
Tok Pisin | tpi |
Tonga | to |
Tsonga | ts |
Tswana | tn |
Turco | tr |
Turquemeno (latim) | tk |
Tuvan | tyv |
Udmurt | udm |
Uigur (cirílico) | ug-cyrl |
Ucraniano | uk |
Alto Sorábio | hsb |
Urdu | ur |
Uigur (árabe) | ug |
Uzbeque (árabe) | uz-arab |
Usbeque (Cirílico) | uz-cyrl |
Uzbeque (Latim) | uz |
Vietnamita | vi |
Volapük | vo |
Vunjo | vun |
Walser | wae |
Galês | cy |
Frísio Ocidental | fy |
Wolof | wo |
Xhosa | xh |
Iucatego | yua |
Zapoteca | zap |
Zarma | dje |
Zhuang | za |
Zulu | zu |
A tabela a seguir lista o suporte à linguagem de modelo de leitura para extrair e analisar texto impresso .
Idioma | Código (opcional) |
---|---|
Afrikaans | af |
Angika | anp |
Árabe | ar |
Asturiano | ast |
Awadhi | awa |
Azerbaijanês | az |
Bielorrusso (cirílico) | be , be-cyrl |
Bielorrusso (Latim) | be-latn |
Bagheli | bfy |
Mahasu Pahari | bfz |
Búlgaro | bg |
Haryanvi | bgc |
Bhojpuri | bho |
Bislama | bi |
Bundeli | bns |
Bretão | br |
Braj | bra |
Bodo | brx |
Bósnio | bs |
Buriat | bua |
Catalão | ca |
Cebuano | ceb |
Chamorro | ch |
Montenegrino (Latim) | cnr , cnr-latn |
Montenegrino (cirílico) | cnr-cyrl |
Córsega | co |
Tártaro da Crimeia | crh |
Checo | cs |
Kashubian | csb |
Galês | cy |
Dinamarquês | da |
Alemão | de |
Dhimal | dhi |
Dogri | doi |
Baixo Sorbian | dsb |
Inglês | en |
Espanhol | es |
Estónio | et |
Basco | eu |
Persa | fa |
Finlandês | fi |
Filipino | fil |
Idioma | Código (opcional) |
---|---|
Fijiano | fj |
Faroense | fo |
Francês | fr |
Friuliano | fur |
Frísio Ocidental | fy |
Irlandês | ga |
Gagauz | gag |
Gaélico escocês | gd |
Gilbertese | gil |
Galego | gl |
Gondi | gon |
Manx | gv |
Gurung | gvr |
Havaiano | haw |
Hindi | hi |
Halbi | hlb |
Chhattisgarhi | hne |
Hani | hni |
Ho |
hoc |
Croata | hr |
Alto Sorábio | hsb |
Haitiano | ht |
Húngaro | hu |
Interlíngua | ia |
Indonésio | id |
Islandês | is |
Italiano | it |
Inuktitut | iu |
Japonês | |
Jaunsari | jns |
Javanês | jv |
Kara-Kalpak (Latim) | kaa , kaa-latn |
Kara-Kalpak (cirílico) | kaa-cyrl |
Kachin | kac |
Kabuverdianu | kea |
Korku | kfq |
Khasi | kha |
Cazaque (Latim) | kk , kk-latn |
Cazaque (cirílico) | kk-cyrl |
Kalaallisut | kl |
Khaling | klr |
Malto | kmj |
Idioma | Código (opcional) |
---|---|
Coreano | |
Kosraean | kos |
Koryak | kpy |
Karachay-Balkar | krc |
Kurukh | kru |
Kölsch | ksh |
Curdo (latim) | ku , ku-latn |
Curdo (árabe) | ku-arab |
Kumyk | kum |
Cornualha | kw |
Quirguiz | ky |
Latim | la |
Luxemburguês | lb |
Lakota | lkt |
Lituano | lt |
Maori | mi |
Mongol | mn |
Marata | mr |
Malaio | ms |
Maltês | mt |
Hmong Daw |
mww |
Erzya | myv |
Napolitano | nap |
Nepalês | ne |
Niuean | niu |
Neerlandês | nl |
Norueguês | no |
Nogai | nog |
Occitano | oc |
Ossétia | os |
Panjabi | pa |
Polaco | pl |
Dari | prs |
Pushto | ps |
Português | pt |
K'iche» | quc |
Camling | rab |
Romanche | rm |
Romeno | ro |
Russo | ru |
Sânscrito | sa |
Santali | sat |
Idioma | Código (opcional) |
---|---|
Sadri | sck |
Escoceses | sco |
Eslovaco | sk |
Esloveno | sl |
Samoano | sm |
Sami Meridional | sma |
Sami do Norte | sme |
Lule Sami | smj |
Inari Sami | smn |
Skolt Sami | sms |
Somália | so |
Albanês | sq |
Sérvio (Latim) | sr , sr-latn |
Sirmauri | srx |
Sueco | sv |
Suaíli | sw |
Tétum | tet |
Tajique | tg |
Thangmi | thf |
Turquemenistão | tk |
Tonga | to |
Turco | tr |
Tatar | tt |
Tuviniano | tyv |
Uigur | ug |
Urdu | ur |
Uzbeque (Latim) | uz , uz-latn |
Usbeque (Cirílico) | uz-cyrl |
Uzbeque (árabe) | uz-arab |
Volapük | vo |
Walser | wae |
Kangri | xnr |
Yucateco | yua |
Zhuang | za |
Chinês (Han (variante simplificada)) | zh , zh-hans |
Chinês (Han (variante tradicional)) | zh-hant |
Zulu | zu |
Esquema
ID do modelo: layout pré-construído
A tabela a seguir lista os idiomas suportados para texto impresso:
Idioma | Código (opcional) |
---|---|
Abaza | abq |
Abcásia | ab |
Chinês | ace |
Acoli | ach |
Adangme | ada |
Adyghe | ady |
Afar | aa |
Afrikaans | af |
Akan | ak |
Albanês | sq |
Algonquin | alq |
Angika (Devanagari) | anp |
Árabe | ar |
Asturiano | ast |
Asu (Tanzânia) | asa |
Avaric | av |
Awadhi-Hindi (Devanagari) | awa |
Aymara | ay |
Azerbaijão (Latim) | az |
Máfia | ksf |
Bagheli | bfy |
Bambara | bm |
Basquir | ba |
Basco | eu |
Bielorrusso (cirílico) | be , be-cyrl |
Bielorrusso (Latim) | be , be-latn |
Bemba (Zâmbia) | bem |
Bena (Tanzânia) | bez |
Bhojpuri-Hindi (Devanagari) | bho |
Bikol | bik |
Bini | bin |
Bislama | bi |
Bodo (Devanagari) | brx |
Bósnio (Latim) | bs |
Brajbha | bra |
Bretão | br |
Búlgaro | bg |
Bundeli | bns |
Buryat (cirílico) | bua |
Catalão | ca |
Cebuano | ceb |
Chamling | rab |
Chamorro | ch |
Checheno | ce |
Chhattisgarhi (Devanagari) | hne |
Chiga | cgg |
Chineses (Simplificado) | zh-Hans |
Chinês (Tradicional) | zh-Hant |
Choctaw | cho |
Chukot | ckt |
Chuvash | cv |
Cornualha | kw |
Córsega | co |
Cree | cr |
Riacho | mus |
Tártaro da Crimeia (latim) | crh |
Croata | hr |
Corvo | cro |
Checo | cs |
Dinamarquês | da |
Dargwa | dar |
Dari | prs |
Dhimal (Devanagari) | dhi |
Dogri (Devanagari) | doi |
Duala | dua |
Dungan | dng |
Neerlandês | nl |
Efik | efi |
Inglês | en |
Erzya (cirílico) | myv |
Estónio | et |
Faroense | fo |
Fijiano | fj |
Filipino | fil |
Finlandês | fi |
Idioma | Código (opcional) |
---|---|
Fon |
fon |
Francês | fr |
Friuliano | fur |
Ga |
gaa |
Gagauz (latim) | gag |
Galego | gl |
Ganda | lg |
Gayo | gay |
Alemão | de |
Gilbertese | gil |
Gondi (Devanagari) | gon |
Grego | el |
Gronelândia | kl |
Guarani | gn |
Gurung (Devanagari) | gvr |
Gusii | guz |
Crioulo haitiano | ht |
Halbi (Devanagari) | hlb |
Hani | hni |
Haryanvi | bgc |
Havaiano | haw |
Hebraico | he |
Herero | hz |
Hiligaynon | hil |
Hindi | hi |
Hmong Daw (Latim) | mww |
Ho(Devanagiri) | hoc |
Húngaro | hu |
Iban | iba |
Islandês | is |
Igbo | ig |
Iloko | ilo |
Inari Sami | smn |
Indonésio | id |
Inguche | inh |
Interlíngua | ia |
Inuktitut (latim) | iu |
Irlandês | ga |
Italiano | it |
Japonês | ja |
Jaunsari (Devanagari) | Jns |
Javanês | jv |
Jola-Fonyi | dyo |
Kabardiano | kbd |
Kabuverdianu | kea |
Kachin (Latim) | kac |
Kalenjin | kln |
Kalmyk | xal |
Kangri (Devanagari) | xnr |
Kanuri | kr |
Karachay-Balkar | krc |
Kara-Kalpak (cirílico) | kaa-cyrl |
Kara-Kalpak (Latim) | kaa |
Kashubian | csb |
Cazaque (cirílico) | kk-cyrl |
Cazaque (Latim) | kk-latn |
Khakas | kjh |
Khaling | klr |
Khasi | kha |
K'iche» | quc |
Kikuyu | ki |
Kildin Sami | sjd |
Kinyarwanda | rw |
Komi | kv |
Kongo | kg |
Coreano | ko |
Korku | kfq |
Koryak | kpy |
Kosraean | kos |
Kpelle | kpe |
Kuanyama | kj |
Kumyk (cirílico) | kum |
Curdo (árabe) | ku-arab |
Curdo (latim) | ku-latn |
Idioma | Código (opcional) |
---|---|
Kurukh (Devanagari) | kru |
Quirguistão (cirílico) | ky |
Lak |
lbe |
Lakota | lkt |
Latim | la |
Letão | lv |
Lezghian | lex |
Lingala | ln |
Lituano | lt |
Baixo Sorbian | dsb |
Lozi | loz |
Lule Sami | smj |
Luo (Quênia e Tanzânia) | luo |
Luxemburguês | lb |
Luyia | luy |
Macedónio | mk |
Machame | jmc |
Madurese | mad |
Mahasu Pahari (Devanagari) | bfz |
Makhuwa-Meetto | mgh |
Makonde | kde |
Malgaxe | mg |
Malaio (Latim) | ms |
Maltês | mt |
Malto (Devanagari) | kmj |
Mandinka | mnk |
Manx | gv |
Maori | mi |
Mapudungun | arn |
Marata | mr |
Mari (Rússia) | chm |
Masai | mas |
Mende (Serra Leoa) | men |
Meru | mer |
Meta» | mgo |
Minangkabau | min |
Mohawk | moh |
Mongol (cirílico) | mn |
Mongondow | mog |
Montenegrino (cirílico) | cnr-cyrl |
Montenegrino (Latim) | cnr-latn |
Morisyen | mfe |
Mundang | mua |
Nahuatl | nah |
Navajo | nv |
Ndonga | ng |
Napolitano | nap |
Nepalês | ne |
Ngomba | jgo |
Niuean | niu |
Nogay | nog |
Ndebele do Norte | nd |
Sami do Norte (Latim) | sme |
Norueguês | no |
Nyanja | ny |
Nyankole | nyn |
Nzima | nzi |
Occitano | oc |
Ojibwa | oj |
Oromo | om |
Ossético | os |
Pampanga | pam |
Pangasinan | pag |
Papiamento | pap |
Pashto | ps |
Pedi | nso |
Persa | fa |
Polaco | pl |
Português | pt |
Punjabi (árabe) | pa |
Quechua | qu |
Ripuariano | ksh |
Romeno | ro |
Romanche | rm |
Rundi | rn |
Russo | ru |
Idioma | Código (opcional) |
---|---|
Rwa |
rwk |
Sadri (Devanagari) | sck |
Sakha | sah |
Samburu | saq |
Samoa (Latim) | sm |
Sango | sg |
Sangu (Gabão) | snq |
Sânscrito (Devanagari) | sa |
Santali(Devanagiri) | sat |
Escoceses | sco |
Gaélico escocês | gd |
Sena | seh |
Sérvio (Cirílico) | sr-cyrl |
Sérvio (Latim) | sr , sr-latn |
Shambala | ksb |
Shona | sn |
Siksika | bla |
Sirmauri (Devanagari) | srx |
Skolt Sami | sms |
Eslovaco | sk |
Esloveno | sl |
Soga | xog |
Somali (árabe) | so |
Somali (Latim) | so-latn |
Songhai | son |
Ndebele do Sul | nr |
Altai do Sul | alt |
Sami Meridional | sma |
Sotho do Sul | st |
Espanhol | es |
Sundanês | su |
Swahili (latim) | sw |
Suazilândia | ss |
Sueco | sv |
Tabassaran | tab |
Tachelhit | shi |
Taitiano | ty |
Taita | dav |
Tajique (cirílico) | tg |
Tâmil | ta |
Tártaro (cirílico) | tt-cyrl |
Tártaro (Latim) | tt |
Teso | teo |
Tétum | tet |
Tailandês | th |
Thangmi | thf |
Tok Pisin | tpi |
Tonga | to |
Tsonga | ts |
Tswana | tn |
Turco | tr |
Turquemeno (latim) | tk |
Tuvan | tyv |
Udmurt | udm |
Uigur (cirílico) | ug-cyrl |
Ucraniano | uk |
Alto Sorábio | hsb |
Urdu | ur |
Uigur (árabe) | ug |
Uzbeque (árabe) | uz-arab |
Usbeque (Cirílico) | uz-cyrl |
Uzbeque (Latim) | uz |
Vietnamita | vi |
Volapük | vo |
Vunjo | vun |
Walser | wae |
Galês | cy |
Frísio Ocidental | fy |
Wolof | wo |
Xhosa | xh |
Iucatego | yua |
Zapoteca | zap |
Zarma | dje |
Zhuang | za |
Zulu | zu |
A tabela a seguir lista o suporte à linguagem do modelo de layout para extrair e analisar texto impresso .
Idioma | Código (opcional) |
---|---|
Afrikaans | af |
Angika | anp |
Árabe | ar |
Asturiano | ast |
Awadhi | awa |
Azerbaijanês | az |
Bielorrusso (cirílico) | be , be-cyrl |
Bielorrusso (Latim) | be-latn |
Bagheli | bfy |
Mahasu Pahari | bfz |
Búlgaro | bg |
Haryanvi | bgc |
Bhojpuri | bho |
Bislama | bi |
Bundeli | bns |
Bretão | br |
Braj | bra |
Bodo | brx |
Bósnio | bs |
Buriat | bua |
Catalão | ca |
Cebuano | ceb |
Chamorro | ch |
Montenegrino (Latim) | cnr , cnr-latn |
Montenegrino (cirílico) | cnr-cyrl |
Córsega | co |
Tártaro da Crimeia | crh |
Checo | cs |
Kashubian | csb |
Galês | cy |
Dinamarquês | da |
Alemão | de |
Dhimal | dhi |
Dogri | doi |
Baixo Sorbian | dsb |
Inglês | en |
Espanhol | es |
Estónio | et |
Basco | eu |
Persa | fa |
Finlandês | fi |
Filipino | fil |
Idioma | Código (opcional) |
---|---|
Fijiano | fj |
Faroense | fo |
Francês | fr |
Friuliano | fur |
Frísio Ocidental | fy |
Irlandês | ga |
Gagauz | gag |
Gaélico escocês | gd |
Gilbertese | gil |
Galego | gl |
Gondi | gon |
Manx | gv |
Gurung | gvr |
Havaiano | haw |
Hindi | hi |
Halbi | hlb |
Chhattisgarhi | hne |
Hani | hni |
Ho |
hoc |
Croata | hr |
Alto Sorábio | hsb |
Haitiano | ht |
Húngaro | hu |
Interlíngua | ia |
Indonésio | id |
Islandês | is |
Italiano | it |
Inuktitut | iu |
Japonês | |
Jaunsari | jns |
Javanês | jv |
Kara-Kalpak (Latim) | kaa , kaa-latn |
Kara-Kalpak (cirílico) | kaa-cyrl |
Kachin | kac |
Kabuverdianu | kea |
Korku | kfq |
Khasi | kha |
Cazaque (Latim) | kk , kk-latn |
Cazaque (cirílico) | kk-cyrl |
Kalaallisut | kl |
Khaling | klr |
Malto | kmj |
Idioma | Código (opcional) |
---|---|
Coreano | |
Kosraean | kos |
Koryak | kpy |
Karachay-Balkar | krc |
Kurukh | kru |
Kölsch | ksh |
Curdo (latim) | ku , ku-latn |
Curdo (árabe) | ku-arab |
Kumyk | kum |
Cornualha | kw |
Quirguiz | ky |
Latim | la |
Luxemburguês | lb |
Lakota | lkt |
Lituano | lt |
Maori | mi |
Mongol | mn |
Marata | mr |
Malaio | ms |
Maltês | mt |
Hmong Daw |
mww |
Erzya | myv |
Napolitano | nap |
Nepalês | ne |
Niuean | niu |
Neerlandês | nl |
Norueguês | no |
Nogai | nog |
Occitano | oc |
Ossétia | os |
Panjabi | pa |
Polaco | pl |
Dari | prs |
Pushto | ps |
Português | pt |
K'iche» | quc |
Camling | rab |
Romanche | rm |
Romeno | ro |
Russo | ru |
Sânscrito | sa |
Santali | sat |
Idioma | Código (opcional) |
---|---|
Sadri | sck |
Escoceses | sco |
Eslovaco | sk |
Esloveno | sl |
Samoano | sm |
Sami Meridional | sma |
Sami do Norte | sme |
Lule Sami | smj |
Inari Sami | smn |
Skolt Sami | sms |
Somália | so |
Albanês | sq |
Sérvio (Latim) | sr , sr-latn |
Sirmauri | srx |
Sueco | sv |
Suaíli | sw |
Tétum | tet |
Tajique | tg |
Thangmi | thf |
Turquemenistão | tk |
Tonga | to |
Turco | tr |
Tatar | tt |
Tuviniano | tyv |
Uigur | ug |
Urdu | ur |
Uzbeque (Latim) | uz , uz-latn |
Usbeque (Cirílico) | uz-cyrl |
Uzbeque (árabe) | uz-arab |
Volapük | vo |
Walser | wae |
Kangri | xnr |
Yucateco | yua |
Zhuang | za |
Chinês (Han (variante simplificada)) | zh , zh-hans |
Chinês (Han (variante tradicional)) | zh-hant |
Zulu | zu |
Linguagem | Código de idioma |
---|---|
Afrikaans | af |
Albanês | sq |
Asturiano | ast |
Basco | eu |
Bislama | bi |
Bretão | br |
Catalão | ca |
Cebuano | ceb |
Chamorro | ch |
Chinês (Simplificado) | zh-Hans |
Chinês (Tradicional) | zh-Hant |
Cornualha | kw |
Córsega | co |
Tártaro da Crimeia (latim) | crh |
Checo | cs |
Dinamarquês | da |
Neerlandês | nl |
Inglês (impresso e manuscrito) | en |
Estónio | et |
Fijiano | fj |
Filipino | fil |
Finlandês | fi |
Francês | fr |
Friuliano | fur |
Galego | gl |
Alemão | de |
Gilbertese | gil |
Gronelândia | kl |
Crioulo haitiano | ht |
Hani | hni |
Hmong Daw (Latim) | mww |
Húngaro | hu |
Indonésio | id |
Interlíngua | ia |
Inuktitut (latim) | iu |
Irlandês | ga |
Linguagem | Código de idioma |
---|---|
Italiano | it |
Japonês | ja |
Javanês | jv |
K'iche» | quc |
Kabuverdianu | kea |
Kachin (Latim) | kac |
Kara-Kalpak | kaa |
Kashubian | csb |
Khasi | kha |
Coreano | ko |
Curdo (latim) | kur |
Luxemburguês | lb |
Malaio (Latim) | ms |
Manx | gv |
Napolitano | nap |
Norueguês | no |
Occitano | oc |
Polaco | pl |
Português | pt |
Romanche | rm |
Escoceses | sco |
Gaélico escocês | gd |
Esloveno | slv |
Espanhol | es |
Swahili (latim) | sw |
Sueco | sv |
Tártaro (Latim) | tat |
Tétum | tet |
Turco | tr |
Alto Sorábio | hsb |
Uzbeque (Latim) | uz |
Volapük | vo |
Walser | wae |
Frísio Ocidental | fy |
Iucatego | yua |
Zhuang | za |
Zulu | zu |
Documento geral
Importante
Com o Document Intelligence v4.0:2024-02-29-preview, 2023-10-31-preview e no futuro, o modelo geral do documento (documento pré-construído) está sendo adicionado ao layout (layout pré-construído). Para extrair pares chave-valor, marcas de seleção, texto, tabelas e estrutura de documentos, use os seguintes modelos:
Pares de valores-chave | versão | Model ID |
---|---|---|
Modelo de layout com seqüência de caracteres de features=keyValuePairs consulta especificada. |
• v4:2024-02-29-pré-visualização, 2023-10-31-pré-visualização • v3.1:2023-07-31 (GA) |
prebuilt-layout |
Modelo de documento geral | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) |
prebuilt-document |
ID do modelo: documento pré-construído
A tabela a seguir lista o suporte geral ao idioma do modelo de documento.
Modelo ID |
Idioma—Código de localidade | Predefinido |
---|---|---|
documento pré-construído | Inglês (Estados Unidos)—en-US |
Inglês (Estados Unidos)—en-US |
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários