Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Azure AI Content Understanding proporciona compatibilidad multilingüe en varias regiones geográficas para permitir a los usuarios comunicarse con las aplicaciones de Content Understanding de maneras naturales y capacitar a la alcance global. En las secciones siguientes se describen las regiones disponibles y los idiomas o configuraciones regionales admitidos.
Regiones admitidas
Para usar Azure AI Content Understanding, cree el recurso del servicio Azure AI en una región admitida. Todos los datos en reposo se almacenan en la región seleccionada. Para reducir la latencia o aumentar la capacidad, puede especificar la ubicación de procesamiento donde se produce el análisis. Content Understanding está disponible en las siguientes regiones. Cuando la ubicación de procesamiento se establece geography
en o data zone
, se muestran las ubicaciones correspondientes.
Identificador | Región | Zona geográfica | Zona de datos |
---|---|---|---|
westus |
Oeste de EE. UU. | Estados Unidos | Estados Unidos |
swedencentral |
Centro de Suecia | Suecia | Unión Europea |
australiaeast |
Este de Australia | Australia | N/A † |
† Este de Australia no admite la zona de datos como ubicación de procesamiento.
Nota:
El modo Pro solo admite actualmente la zona de datos y global como ubicación de procesamiento.
Compatibilidad con idiomas
Azure AI Content Understanding permite procesar datos en varios idiomas simultáneamente. Nuestras funcionalidades de soporte de lenguaje permiten a los usuarios comunicarse con sus aplicaciones de forma natural y capacitar al alcance global.
Content Understanding aplica modelos de Azure OpenAI que admiten una amplia variedad de lenguajes. Aunque no hay ninguna lista definitiva de idiomas admitidos, los usuarios pueden esperar funcionalidades de lenguaje sólidas en los lenguajes más comunes. Para obtener compatibilidad específica con idiomas relacionados con OCR
la transcripción de voz y , consulte las secciones respectivas que detallan los idiomas admitidos para estas modalidades.
Reconocimiento óptico de caracteres de texto (OCR)
Importante
- La siguiente lista de idiomas admitidos tiene normalización compatible con la configuración regional para las palabras habilitadas en el posprocesamiento.
- Content Understanding admite diferentes idiomas, por lo que le animamos a probarlo y centrarse en el contenido y no en el propio valor.
Idioma | Código de idioma | Idioma | Código de idioma |
---|---|---|---|
Afrikaans | af |
Kazajo (latino) | kk, kk-latn |
Albanés | sq |
Khaling | klr |
Angika | anp |
Jasí | kha |
Árabe | ar |
Kirghiz | ky |
Asturiano | ast |
Coreano | ko |
Awadhi | awa |
Korku | kfq |
Azerbaiyano | az |
Koriakia | kpy |
Bagheli | bfy |
Kosreano | kos |
Vasco | eu |
Kurdo (árabe) | ku-arab |
Bielorruso (cirílico) | be, be-cyrl |
Kurdo (latino) | ku, ku-latn |
Bielorruso (latino) | be-latn |
Kurukh | kru |
Bhojpurí | bho |
Kölsch | ksh |
Bislama | bi |
Lakota | lkt |
Bodo | brx |
Latín | la |
Bosnio/a | bs |
Lituano | lt |
Braj | bra |
Bajo sorbio | dsb |
Bretón | br |
Volapük | smj |
Búlgaro | bg |
Luxemburgués | lb |
Bundeli | bns |
Mahasu Pahari | bfz |
Buriat | bua |
Malayo | ms |
Camling | rab |
Malto | kmj |
Catalán | ca |
Manés | gv |
Cebuano | ceb |
Maorí | mi |
Chamorro | ch |
Marathi | mr |
Chhattisgarhi | hne |
Mongol | mn |
Chino (simplificado) | zh, zh-hans |
Montenegrino (cirílico) | cnr-cyrl |
Chino (tradicional) | zh-hant |
Montenegrino (latino) | cnr, cnr-latn |
Córnico | kw |
Napolitano | nap |
Corso | co |
Nepalí | ne |
Tártaro de Crimea | crh |
Niueano | niu |
Croata | hr |
Nogai | nog |
Checo | cs |
Sami del Norte | sme |
Danés | da |
Noruego | no |
Darí | prs |
Occitano | oc |
Dhimal | dhi |
Osetia | os |
Dogri | doi |
Panyabí | pa |
Holandés | nl |
Persa | fa |
Inglés | en-US, en-AU, en-CA,en-GB, en-IN |
Polaco | pl |
Erzya | myv |
Portugués | pt |
Estonio | et |
Pushto | ps |
Feroés | fo |
Rumano | ro |
Fiyiano | fj |
Romanche | rm |
Filipino | fil |
Ruso | ru |
Finlandés | fi |
Sadri | sck |
Francés | fr |
Samoano | sm |
Friulano | fur |
Sánscrito | sa |
Gagauzo | gag |
Santali | sat |
Gallego | gl |
Escocés | sco |
Alemán | de |
Gaélico escocés | gd |
Gilbertés | gil |
Serbio (latino) | sr, sr-latn |
Gondi | gon |
Sirmauri | srx |
Gurung | gvr |
Sami skolt | sms |
Haitiano | ht |
Eslovaco | sk |
Halbi | hlb |
Esloveno | sl |
Hani | hni |
Somalí | so |
Haryanvi | bgc |
Sami meridional | sma |
Hawaiano | haw |
Español | es |
hindi | hi |
Suajili | sw |
Hmong Daw | mww |
Sueco | sv |
HO | hoc |
Tayiko | tg |
Húngaro | hu |
Tártaro | tt |
Islandés | is |
Tetun | tet |
Inari Sami | smn |
Thangmi | thf |
Indonesio | id |
Tailandés | th |
Interlingua | ia |
Tonga | to |
Inuktitut | iu |
Turco | tr |
Irlandés | ga |
Tuvinian | tyv |
Italiano | it |
Uigur | ug |
Japonés | ja |
Alto sorbio | hsb |
Jaunsari | jns |
Urdú | ur |
Javanés | jv |
Uzbeko (árabe) | uz-arab |
K'iche' | quc |
Uzbeko (cirílico) | uz-cyrl |
Caboverdiano | kea |
Uzbeko (latín) | uz, uz-latn |
Kachin | kac |
Volapük | vo |
Groenlandés | kl |
Walser | wae |
Kangri | xnr |
Galés | cy |
Karakalpako (cirílico) | kaa-cyrl |
Frisiano occidental | fy |
Karakalpako (latino) | kaa, kaa-latn |
Yucateco | yua |
Karachái-bálkaro | krc |
Zhuang | za |
Casubio | csb |
Zulú | zu |
Kazajo (cirílico) | kk-cyrl |
En la tabla siguiente se enumeran los idiomas o configuraciones regionales admitidos para el texto manuscrito .
Idioma | Código de idioma | Idioma | Código de idioma |
---|---|---|---|
Inglés | en |
Japonés | ja |
Chino simplificado | zh-Hans |
Coreano | ko |
Francés | fr |
Portugués | pt |
Alemán | de |
Español | es |
Italiano | it |
Ruso | ru |
Tailandés | th |
Árabe | ar |
Transcripción de voz
Content Understanding aplica la voz de Azure AI al texto para transcribir palabras habladas en la entrada. Para un subconjunto de lenguajes admitidos, usa una transcripción rápida para reducir la latencia de procesamiento.
En la tabla siguiente se enumeran los idiomas o configuraciones regionales admitidos para la transcripción rápida.
Idioma | Código de idioma | Idioma | Código de idioma |
---|---|---|---|
Chino (mandarín, simplificado) | zh-CN |
Indonesio (Indonesia) | id-ID |
Danés (Dinamarca) | da-DK |
Italiano (Italia) | it-IT |
Inglés (India) | en-IN |
Japonés (Japón) | ja-JP |
Inglés (Reino Unido) | en-GB |
Coreano (Corea) | ko-KR |
Inglés (Estados Unidos) | en-US |
Polaco/a (Polonia) | pl-PL |
Finés (Finlandia) | fi-FI |
Portugués (Brasil) | pt-BR |
Francés (Francia) | fr-FR |
Portugués (Portugal) | pt-PT |
Alemán (Alemania) | de-DE |
Español (México) | es-MX |
Hebreo (Israel) | he-IL |
Español (España) | es-ES |
Hindi (India) | hi-IN |
Sueco (Suecia) | sv-SE |
En la tabla siguiente se enumeran todos los idiomas o configuraciones regionales admitidos.
Idioma | Código de idioma | Idioma | Código de idioma |
---|---|---|---|
Afrikáans (Sudáfrica) | af-ZA |
Húngaro (Hungría) | hu-HU |
Albanés (Albania) | sq-AL |
Islandés (Islandia) | is-IS |
Amárico (Etiopía) | am-ET |
Indonesio (Indonesia) | id-ID |
Árabe (Argelia) | ar-DZ |
Irlandés (Irlanda) | ga-IE |
Árabe (Bahréin) | ar-BH |
Zulú (Sudáfrica) | zu-ZA |
Árabe (Egipto) | ar-EG |
Italiano (Italia) | it-IT |
Árabe (Irak) | ar-IQ |
Italiano (Suiza) | it-CH |
Árabe (Israel) | ar-IL |
Japonés (Japón) | ja-JP |
Árabe (Jordania) | ar-JO |
Javanés (latino, Indonesia) | jv-ID |
Árabe (Kuwait) | ar-KW |
Canarés (India) | kn-IN |
Árabe (Líbano) | ar-LB |
Kazajo (Kazajistán) | kk-KZ |
Árabe (Libia) | ar-LY |
Jemer (Camboya) | km-KH |
Árabe (Marruecos) | ar-MA |
Kiswahili (Kenia) | sw-KE |
Árabe (Omán) | ar-OM |
Suajili (Tanzania) | sw-TZ |
Árabe (Autoridad Palestina) | ar-PS |
Coreano (Corea) | ko-KR |
Árabe (Qatar) | ar-QA |
Lao (Laos) | lo-LA |
Árabe (Arabia Saudí) | ar-SA |
Letón (Letonia) | lv-LV |
Árabe (Siria) | ar-SY |
Lituano (Lituania) | lt-LT |
Árabe (Túnez) | ar-TN |
Macedonio (Macedonia del Norte) | mk-MK |
Árabe (Emiratos Árabes Unidos) | ar-AE |
Malayo (Malasia) | ms-MY |
Árabe (Yemen) | ar-YE |
Malayalam (India) | ml-IN |
Armenio (Armenia) | hy-AM |
Maltés (Malta) | mt-MT |
Asamés (India) | as-IN |
Maratí (India) | mr-IN |
Azerbaiyano - Azerbaiyán (latino) | az-AZ |
Mongol (Mongolia) | mn-MN |
Vasco | eu-ES |
Nepalí (Nepal) | ne-NP |
Bengalí (India) | bn-IN |
Bokmål noruego (Noruega) | nb-NO |
Bosnio (Bosnia y Herzegovina) | bs-BA |
Odia (India) | or-IN |
Búlgaro (Bulgaria) | bg-BG |
Pastún (Afganistán) | ps-AF |
Birmano (Myanmar) | my-MM |
Persa (Irán) | fa-IR |
Catalán | ca-ES |
Polaco/a (Polonia) | pl-PL |
Chino (cantonés, simplificado) | yue-CN |
Portugués (Brasil) | pt-BR |
Chino (cantonés, tradicional) | zh-HK |
Portugués (Portugal) | pt-PT |
Chino (mandarín jilu, simplificado) | zh-CN-shandong |
Punjabi (India) | pa-IN |
Chino (mandarín, simplificado) | zh-CN |
Rumano (Rumanía) | ro-RO |
Chino (mandarín suroeste, simplificado) | zh-CN-sichuan |
Ruso (Rusia) | ru-RU |
Chino (mandarín taiwanés, tradicional) | zh-TW |
Serbio (cirílico, Serbia) | sr-RS |
Chino (wu, simplificado) | wuu-CN |
Cingalés (Sri Lanka) | si-LK |
Croata (Croacia) | hr-HR |
Eslovaco (Eslovaquia) | sk-SK |
Checo (Chequia) | cs-CZ |
Esloveno (Eslovenia) | sl-SI |
Danés (Dinamarca) | da-DK |
Somalí (Somalia) | so-SO |
Neerlandés (Bélgica) | nl-BE |
Español (Argentina) | es-AR |
Neerlandés (Países Bajos) | nl-NL |
Español (Bolivia) | es-BO |
Inglés (Australia) | en-AU |
Español (Chile) | es-CL |
Inglés (Canadá) | en-CA |
Español (Colombia) | es-CO |
Inglés (Ghana) | en-GH |
Español (Costa Rica) | es-CR |
Inglés (RAE de Hong Kong) | en-HK |
Español (Cuba) | es-CU |
Inglés (India) | en-IN |
Español (República Dominicana) | es-DO |
Inglés (Irlanda) | en-IE |
Español (Ecuador) | es-EC |
Inglés (Kenia) | en-KE |
Español (El Salvador) | es-SV |
Inglés (Nueva Zelanda) | en-NZ |
Español (Guinea Ecuatorial) | es-GQ |
Inglés (Nigeria) | en-NG |
Español (Guatemala) | es-GT |
Inglés (Filipinas) | en-PH |
Español (Honduras) | es-HN |
Inglés (Singapur) | en-SG |
Español (México) | es-MX |
Inglés (Sudáfrica) | en-ZA |
Español (Nicaragua) | es-NI |
Inglés (Tanzania) | en-TZ |
Español (Panamá) | es-PA |
Inglés (Reino Unido) | en-GB |
Español (Paraguay) | es-PY |
Inglés (Estados Unidos) | en-US |
Español (Perú) | es-PE |
Estonio (Estonia) | et-EE |
Español (Puerto Rico) | es-PR |
Filipino (Filipinas) | fil-PH |
Español (España) | es-ES |
Finés (Finlandia) | fi-FI |
Español (Estados Unidos)1 | es-US |
Francés (Bélgica) | fr-BE |
Español (Uruguay) | es-UY |
Francés (Canadá)1 | fr-CA |
Español (Venezuela) | es-VE |
Francés (Francia) | fr-FR |
Sueco (Suecia) | sv-SE |
Francés (Suiza) | fr-CH |
Tamil (India) | ta-IN |
Gallego | gl-ES |
Telugu (India) | te-IN |
Georgiano (Georgia) | ka-GE |
Tailandés (Tailandia) | th-TH |
Alemán (Austria) | de-AT |
Turco (Turquía) | tr-TR |
Alemán (Alemania) | de-DE |
Ucraniano (Ucrania) | uk-UA |
Alemán (Suiza) | de-CH |
Urdu (India) | ur-IN |
Griego (Grecia) | el-GR |
Uzbeko (latino, Uzbekistán) | uz-UZ |
Gujarati (India) | gu-IN |
Vietnamita (Vietnam) | vi-VN |
Hebreo (Israel) | he-IL |
Galés (Reino Unido) | cy-GB |
Hindi (India) | hi-IN |
Normalización de valores de campo
Las distintas configuraciones regionales tienen diferentes maneras de representar números, fecha y hora. Content Understanding admite la normalización de estas diferentes representaciones en formularios ISO estandarizados para las siguientes configuraciones regionales.
Idioma | Código de idioma | Idioma | Código de idioma |
---|---|---|---|
Árabe |
ar-AE , , ar-EG , ar-SA |
Japonés | ja-JP |
Bengla | bn-IN |
Coreano | ko-KR |
Búlgaro | bg-BG |
Letón | lv-LV |
Catalán | ca-ES |
Lituano | lt-LT |
Chino (simplificado) | zh-CN |
Malayo | ms-MY |
Chino (tradicional) | zh-TW |
Marathi | mr-IN |
Croata | hr-HR |
Nepalí | ne-IN |
Checo | cs-CZ |
Noruego | no-NO |
Danés | da-DK |
Polaco | pl-PL |
Holandés | nl-NL |
Portugués |
pt-BR , pt-PT |
Inglés |
en-AU , en-CA , en-GB , en-IL , en-IN , , en-MY en-US |
Rumano | ro-RO |
Estonio | et-EE |
Ruso | ru-RU |
Finlandés | fi-FI |
Serbio | sr-RS |
Francés |
fr-CA , fr-FR |
Eslovaco | sk-SK |
Gallego | gl-ES |
Esloveno | sl-SI |
Alemán | de-DE |
Español |
es-AR , , es-ES , es-MX |
Griego | el-GR |
Sueco | sv-SE |
Hebreo | he-IL |
Tamil | ta-IN |
hindi | hi-IN |
Tailandés | th-TH |
Húngaro | hu-HU |
Turco | tr-TR |
Islandés | is-IS |
Ucraniano | uk-UA |
Indonesio | id-ID |
Vietnamita | vi-VN |
Italiano | it-IT |