Compartir a través de


Compatibilidad con la región y el idioma de Content Understanding de Azure AI

Azure AI Content Understanding proporciona compatibilidad multilingüe en varias regiones geográficas para permitir a los usuarios comunicarse con las aplicaciones de Content Understanding de maneras naturales y capacitar a la alcance global. En las secciones siguientes se describen las regiones disponibles y los idiomas o configuraciones regionales admitidos.

Regiones admitidas

Para usar Azure AI Content Understanding, cree el recurso del servicio Azure AI en una región admitida. Todos los datos en reposo se almacenan en la región seleccionada. Para reducir la latencia o aumentar la capacidad, puede especificar la ubicación de procesamiento donde se produce el análisis. Content Understanding está disponible en las siguientes regiones. Cuando la ubicación de procesamiento se establece geography en o data zone, se muestran las ubicaciones correspondientes.

Identificador Región Zona geográfica Zona de datos
westus Oeste de EE. UU. Estados Unidos Estados Unidos
swedencentral Centro de Suecia Suecia Unión Europea
australiaeast Este de Australia Australia N/A †

† Este de Australia no admite la zona de datos como ubicación de procesamiento.

Nota:

El modo Pro solo admite actualmente la zona de datos y global como ubicación de procesamiento.

Compatibilidad con idiomas

Azure AI Content Understanding permite procesar datos en varios idiomas simultáneamente. Nuestras funcionalidades de soporte de lenguaje permiten a los usuarios comunicarse con sus aplicaciones de forma natural y capacitar al alcance global.

Content Understanding aplica modelos de Azure OpenAI que admiten una amplia variedad de lenguajes. Aunque no hay ninguna lista definitiva de idiomas admitidos, los usuarios pueden esperar funcionalidades de lenguaje sólidas en los lenguajes más comunes. Para obtener compatibilidad específica con idiomas relacionados con OCR la transcripción de voz y , consulte las secciones respectivas que detallan los idiomas admitidos para estas modalidades.

Reconocimiento óptico de caracteres de texto (OCR)

Importante

  • La siguiente lista de idiomas admitidos tiene normalización compatible con la configuración regional para las palabras habilitadas en el posprocesamiento.
  • Content Understanding admite diferentes idiomas, por lo que le animamos a probarlo y centrarse en el contenido y no en el propio valor.
Idioma Código de idioma Idioma Código de idioma
Afrikaans af Kazajo (latino) kk, kk-latn
Albanés sq Khaling klr
Angika anp Jasí kha
Árabe ar Kirghiz ky
Asturiano ast Coreano ko
Awadhi awa Korku kfq
Azerbaiyano az Koriakia kpy
Bagheli bfy Kosreano kos
Vasco eu Kurdo (árabe) ku-arab
Bielorruso (cirílico) be, be-cyrl Kurdo (latino) ku, ku-latn
Bielorruso (latino) be-latn Kurukh kru
Bhojpurí bho Kölsch ksh
Bislama bi Lakota lkt
Bodo brx Latín la
Bosnio/a bs Lituano lt
Braj bra Bajo sorbio dsb
Bretón br Volapük smj
Búlgaro bg Luxemburgués lb
Bundeli bns Mahasu Pahari bfz
Buriat bua Malayo ms
Camling rab Malto kmj
Catalán ca Manés gv
Cebuano ceb Maorí mi
Chamorro ch Marathi mr
Chhattisgarhi hne Mongol mn
Chino (simplificado) zh, zh-hans Montenegrino (cirílico) cnr-cyrl
Chino (tradicional) zh-hant Montenegrino (latino) cnr, cnr-latn
Córnico kw Napolitano nap
Corso co Nepalí ne
Tártaro de Crimea crh Niueano niu
Croata hr Nogai nog
Checo cs Sami del Norte sme
Danés da Noruego no
Darí prs Occitano oc
Dhimal dhi Osetia os
Dogri doi Panyabí pa
Holandés nl Persa fa
Inglés en-US, en-AU, en-CA,en-GB, en-IN Polaco pl
Erzya myv Portugués pt
Estonio et Pushto ps
Feroés fo Rumano ro
Fiyiano fj Romanche rm
Filipino fil Ruso ru
Finlandés fi Sadri sck
Francés fr Samoano sm
Friulano fur Sánscrito sa
Gagauzo gag Santali sat
Gallego gl Escocés sco
Alemán de Gaélico escocés gd
Gilbertés gil Serbio (latino) sr, sr-latn
Gondi gon Sirmauri srx
Gurung gvr Sami skolt sms
Haitiano ht Eslovaco sk
Halbi hlb Esloveno sl
Hani hni Somalí so
Haryanvi bgc Sami meridional sma
Hawaiano haw Español es
hindi hi Suajili sw
Hmong Daw mww Sueco sv
HO hoc Tayiko tg
Húngaro hu Tártaro tt
Islandés is Tetun tet
Inari Sami smn Thangmi thf
Indonesio id Tailandés th
Interlingua ia Tonga to
Inuktitut iu Turco tr
Irlandés ga Tuvinian tyv
Italiano it Uigur ug
Japonés ja Alto sorbio hsb
Jaunsari jns Urdú ur
Javanés jv Uzbeko (árabe) uz-arab
K'iche' quc Uzbeko (cirílico) uz-cyrl
Caboverdiano kea Uzbeko (latín) uz, uz-latn
Kachin kac Volapük vo
Groenlandés kl Walser wae
Kangri xnr Galés cy
Karakalpako (cirílico) kaa-cyrl Frisiano occidental fy
Karakalpako (latino) kaa, kaa-latn Yucateco yua
Karachái-bálkaro krc Zhuang za
Casubio csb Zulú zu
Kazajo (cirílico) kk-cyrl

En la tabla siguiente se enumeran los idiomas o configuraciones regionales admitidos para el texto manuscrito .

Idioma Código de idioma Idioma Código de idioma
Inglés en Japonés ja
Chino simplificado zh-Hans Coreano ko
Francés fr Portugués pt
Alemán de Español es
Italiano it Ruso ru
Tailandés th Árabe ar

Transcripción de voz

Content Understanding aplica la voz de Azure AI al texto para transcribir palabras habladas en la entrada. Para un subconjunto de lenguajes admitidos, usa una transcripción rápida para reducir la latencia de procesamiento.

En la tabla siguiente se enumeran los idiomas o configuraciones regionales admitidos para la transcripción rápida.

Idioma Código de idioma Idioma Código de idioma
Chino (mandarín, simplificado) zh-CN Indonesio (Indonesia) id-ID
Danés (Dinamarca) da-DK Italiano (Italia) it-IT
Inglés (India) en-IN Japonés (Japón) ja-JP
Inglés (Reino Unido) en-GB Coreano (Corea) ko-KR
Inglés (Estados Unidos) en-US Polaco/a (Polonia) pl-PL
Finés (Finlandia) fi-FI Portugués (Brasil) pt-BR
Francés (Francia) fr-FR Portugués (Portugal) pt-PT
Alemán (Alemania) de-DE Español (México) es-MX
Hebreo (Israel) he-IL Español (España) es-ES
Hindi (India) hi-IN Sueco (Suecia) sv-SE

En la tabla siguiente se enumeran todos los idiomas o configuraciones regionales admitidos.

Idioma Código de idioma Idioma Código de idioma
Afrikáans (Sudáfrica) af-ZA Húngaro (Hungría) hu-HU
Albanés (Albania) sq-AL Islandés (Islandia) is-IS
Amárico (Etiopía) am-ET Indonesio (Indonesia) id-ID
Árabe (Argelia) ar-DZ Irlandés (Irlanda) ga-IE
Árabe (Bahréin) ar-BH Zulú (Sudáfrica) zu-ZA
Árabe (Egipto) ar-EG Italiano (Italia) it-IT
Árabe (Irak) ar-IQ Italiano (Suiza) it-CH
Árabe (Israel) ar-IL Japonés (Japón) ja-JP
Árabe (Jordania) ar-JO Javanés (latino, Indonesia) jv-ID
Árabe (Kuwait) ar-KW Canarés (India) kn-IN
Árabe (Líbano) ar-LB Kazajo (Kazajistán) kk-KZ
Árabe (Libia) ar-LY Jemer (Camboya) km-KH
Árabe (Marruecos) ar-MA Kiswahili (Kenia) sw-KE
Árabe (Omán) ar-OM Suajili (Tanzania) sw-TZ
Árabe (Autoridad Palestina) ar-PS Coreano (Corea) ko-KR
Árabe (Qatar) ar-QA Lao (Laos) lo-LA
Árabe (Arabia Saudí) ar-SA Letón (Letonia) lv-LV
Árabe (Siria) ar-SY Lituano (Lituania) lt-LT
Árabe (Túnez) ar-TN Macedonio (Macedonia del Norte) mk-MK
Árabe (Emiratos Árabes Unidos) ar-AE Malayo (Malasia) ms-MY
Árabe (Yemen) ar-YE Malayalam (India) ml-IN
Armenio (Armenia) hy-AM Maltés (Malta) mt-MT
Asamés (India) as-IN Maratí (India) mr-IN
Azerbaiyano - Azerbaiyán (latino) az-AZ Mongol (Mongolia) mn-MN
Vasco eu-ES Nepalí (Nepal) ne-NP
Bengalí (India) bn-IN Bokmål noruego (Noruega) nb-NO
Bosnio (Bosnia y Herzegovina) bs-BA Odia (India) or-IN
Búlgaro (Bulgaria) bg-BG Pastún (Afganistán) ps-AF
Birmano (Myanmar) my-MM Persa (Irán) fa-IR
Catalán ca-ES Polaco/a (Polonia) pl-PL
Chino (cantonés, simplificado) yue-CN Portugués (Brasil) pt-BR
Chino (cantonés, tradicional) zh-HK Portugués (Portugal) pt-PT
Chino (mandarín jilu, simplificado) zh-CN-shandong Punjabi (India) pa-IN
Chino (mandarín, simplificado) zh-CN Rumano (Rumanía) ro-RO
Chino (mandarín suroeste, simplificado) zh-CN-sichuan Ruso (Rusia) ru-RU
Chino (mandarín taiwanés, tradicional) zh-TW Serbio (cirílico, Serbia) sr-RS
Chino (wu, simplificado) wuu-CN Cingalés (Sri Lanka) si-LK
Croata (Croacia) hr-HR Eslovaco (Eslovaquia) sk-SK
Checo (Chequia) cs-CZ Esloveno (Eslovenia) sl-SI
Danés (Dinamarca) da-DK Somalí (Somalia) so-SO
Neerlandés (Bélgica) nl-BE Español (Argentina) es-AR
Neerlandés (Países Bajos) nl-NL Español (Bolivia) es-BO
Inglés (Australia) en-AU Español (Chile) es-CL
Inglés (Canadá) en-CA Español (Colombia) es-CO
Inglés (Ghana) en-GH Español (Costa Rica) es-CR
Inglés (RAE de Hong Kong) en-HK Español (Cuba) es-CU
Inglés (India) en-IN Español (República Dominicana) es-DO
Inglés (Irlanda) en-IE Español (Ecuador) es-EC
Inglés (Kenia) en-KE Español (El Salvador) es-SV
Inglés (Nueva Zelanda) en-NZ Español (Guinea Ecuatorial) es-GQ
Inglés (Nigeria) en-NG Español (Guatemala) es-GT
Inglés (Filipinas) en-PH Español (Honduras) es-HN
Inglés (Singapur) en-SG Español (México) es-MX
Inglés (Sudáfrica) en-ZA Español (Nicaragua) es-NI
Inglés (Tanzania) en-TZ Español (Panamá) es-PA
Inglés (Reino Unido) en-GB Español (Paraguay) es-PY
Inglés (Estados Unidos) en-US Español (Perú) es-PE
Estonio (Estonia) et-EE Español (Puerto Rico) es-PR
Filipino (Filipinas) fil-PH Español (España) es-ES
Finés (Finlandia) fi-FI Español (Estados Unidos)1 es-US
Francés (Bélgica) fr-BE Español (Uruguay) es-UY
Francés (Canadá)1 fr-CA Español (Venezuela) es-VE
Francés (Francia) fr-FR Sueco (Suecia) sv-SE
Francés (Suiza) fr-CH Tamil (India) ta-IN
Gallego gl-ES Telugu (India) te-IN
Georgiano (Georgia) ka-GE Tailandés (Tailandia) th-TH
Alemán (Austria) de-AT Turco (Turquía) tr-TR
Alemán (Alemania) de-DE Ucraniano (Ucrania) uk-UA
Alemán (Suiza) de-CH Urdu (India) ur-IN
Griego (Grecia) el-GR Uzbeko (latino, Uzbekistán) uz-UZ
Gujarati (India) gu-IN Vietnamita (Vietnam) vi-VN
Hebreo (Israel) he-IL Galés (Reino Unido) cy-GB
Hindi (India) hi-IN

Normalización de valores de campo

Las distintas configuraciones regionales tienen diferentes maneras de representar números, fecha y hora. Content Understanding admite la normalización de estas diferentes representaciones en formularios ISO estandarizados para las siguientes configuraciones regionales.

Idioma Código de idioma Idioma Código de idioma
Árabe ar-AE, , ar-EG, ar-SA Japonés ja-JP
Bengla bn-IN Coreano ko-KR
Búlgaro bg-BG Letón lv-LV
Catalán ca-ES Lituano lt-LT
Chino (simplificado) zh-CN Malayo ms-MY
Chino (tradicional) zh-TW Marathi mr-IN
Croata hr-HR Nepalí ne-IN
Checo cs-CZ Noruego no-NO
Danés da-DK Polaco pl-PL
Holandés nl-NL Portugués pt-BR, pt-PT
Inglés en-AU, en-CA, en-GB, en-IL, en-IN, , en-MYen-US Rumano ro-RO
Estonio et-EE Ruso ru-RU
Finlandés fi-FI Serbio sr-RS
Francés fr-CA, fr-FR Eslovaco sk-SK
Gallego gl-ES Esloveno sl-SI
Alemán de-DE Español es-AR, , es-ES, es-MX
Griego el-GR Sueco sv-SE
Hebreo he-IL Tamil ta-IN
hindi hi-IN Tailandés th-TH
Húngaro hu-HU Turco tr-TR
Islandés is-IS Ucraniano uk-UA
Indonesio id-ID Vietnamita vi-VN
Italiano it-IT