你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure AI 内容理解区域和语言支持

Azure AI 内容理解在多个地理区域中提供多语言支持,使用户能够以自然的方式与内容理解应用程序进行通信,并增强全球外展能力。 以下部分介绍可用区域和支持的语言/区域设置。

区域支持

若要使用 Azure AI 内容理解,请在受支持的区域中创建 Azure AI 服务资源。 静态所有数据都存储在所选区域中。 为了降低延迟或增加容量,可以指定分析所在的处理位置。 内容理解在以下区域中可用。 当处理位置设置为 geographydata zone显示相应的位置时。

标识符 区域 地区 数据区域
westus 美国西部 美国 美国
swedencentral 瑞典中部 瑞典 欧盟
australiaeast 澳大利亚东部 澳大利亚 N/A †

†澳大利亚东部不支持数据区域作为处理位置。

注释

Pro 模式 目前仅支持数据区域和全局作为处理位置。

语言支持

借助 Azure AI 内容理解,可以同时处理多种语言的数据。 我们的语言支持功能使用户能够以自然的方式与应用程序进行通信,并触达全球用户。

内容理解应用支持各种语言的 Azure OpenAI 模型 。 虽然没有明确的受支持语言列表,但用户可以期望大多数常用语言具有强大的语言功能。 有关与语音听录相关的 OCR 特定语言支持和语音听录,请参阅有关这些形式支持的语言的相应部分。

文本光学字符识别(OCR)

重要

  • 以下受支持语言列表对在处理后启用的单词具有区域设置感知规范化。
  • 内容理解支持不同的语言,因此我们鼓励你尝试它,专注于内容,而不是值本身。
语言 语言代码 语言 语言代码
阿非利卡语 af 哈萨克语(拉丁语) kk, kk-latn
阿尔巴尼亚语 sq 哈林语 klr
Angika anp 卡西语 kha
阿拉伯语 ar 吉尔吉斯语 ky
阿斯图里亚斯语 ast 韩语 ko
阿瓦德语 awa 科尔库语 kfq
阿塞拜疆语 az 科里亚克语 kpy
巴格里语 bfy 科斯拉伊语 kos
巴斯克语 eu 库尔德语(阿拉伯语) ku-arab
白俄罗斯语(西里尔语) be, be-cyrl 库尔德语 (拉丁语) ku, ku-latn
白俄罗斯语(拉丁语) be-latn Kurukh kru
比哈尔语 bho Kölsch ksh
比斯拉马语 bi 拉科塔语 lkt
博多语 brx 拉丁语 la
波斯尼亚语 bs 立陶宛语 lt
Braj bra 下索布语 dsb
布列塔尼语 br 沃拉普克语 smj
保加利亚语 bg 卢森堡语 lb
本德利语 bns 马哈苏·帕哈里 bfz
Buriat bua 马来语 ms
Camling rab 马尔托 kmj
加泰隆语 ca 马恩岛语 gv
宿雾语 ceb 毛利语 mi
查莫罗语 ch 马拉地语 mr
恰蒂斯加尔语 hne 蒙古语 mn
中文(简体) zh, zh-hans 蒙特内哥罗语(西里尔语) cnr-cyrl
中文(传统) zh-hant 蒙特内哥罗语(拉丁语) cnr, cnr-latn
康沃尔语 kw 那不勒斯语 nap
柯西嘉语 co 尼泊尔语 ne
克里米亚鞑靼语 crh 纽埃语 niu
克罗地亚语 hr Nogai nog
捷克语 cs 北萨米 sme
丹麦语 da 挪威语 no
达里语 prs 奥克西唐语 oc
Dhimal dhi 奥塞梯 os
Dogri doi 旁遮普语 pa
荷兰语 nl 波斯语 fa
英语 en-US, en-AU, en-CA,en-GB, en-IN 波兰语 pl
Erzya myv 葡萄牙语 pt
爱沙尼亚语 et Pushto ps
法罗语 fo 罗马尼亚语 ro
斐济语 fj 罗曼什语 rm
菲律宾语 fil 俄语 ru
芬兰语 fi 萨德里 sck
法语 fr 萨摩亚语 sm
弗留利语 fur 梵语 sa
Gagauz gag 桑塔利语 sat
加利西亚语 gl 苏格兰语 sco
德语 de 苏格兰盖尔语 gd
吉尔伯特斯语 gil 塞尔维亚语(拉丁语) sr, sr-latn
冈迪 gon Sirmauri srx
古隆 gvr 斯科特萨米语 sms
海地语 ht 斯洛伐克语 sk
哈尔比 hlb 斯洛文尼亚语 sl
哈尼语 hni 索马里语 so
哈里亚维 bgc 南萨米语 sma
夏威夷语 haw 西班牙语 es
印地语 hi 斯瓦希里语 sw
白苗文 mww 瑞典语 sv
HO hoc 塔吉克语 tg
匈牙利语 hu 鞑靼语 tt
冰岛语 is 德顿语 tet
伊纳里萨米语 smn 唐米 thf
印度尼西亚语 id 泰语 th
国际语 ia 汤加 to
因纽特语 iu 土耳其语 tr
爱尔兰语 ga 图维尼亚语 tyv
意大利语 it 维吾尔语 ug
日语 ja 上索布语 hsb
Jaunsari jns 乌尔都语 ur
爪哇语 jv 乌兹别克语(阿拉伯语) uz-arab
基切 quc 乌兹别克语 (西里尔文) uz-cyrl
卡布维尔第亚努 kea 乌兹别克语(拉丁语) uz, uz-latn
卡钦 kac 沃拉普克语 vo
格陵兰语 kl 瓦尔瑟 wae
康里 xnr 威尔士语 cy
卡拉卡巴克语(西里尔语) kaa-cyrl 西弗里斯兰语 fy
卡拉卡巴克语(拉丁语) kaa, kaa-latn Yucateco yua
卡拉恰伊-巴尔卡尔语 krc 壮族 za
卡舒比语 csb 祖鲁语 zu
哈萨克语(西里尔语) kk-cyrl

下表列出了 手写 文本支持的语言/区域设置。

语言 语言代码 语言 语言代码
英语 en 日语 ja
简体中文 zh-Hans 韩语 ko
法语 fr 葡萄牙语 pt
德语 de 西班牙语 es
意大利语 it 俄语 ru
泰语 th 阿拉伯语 ar

语音听录

内容理解将 Azure AI 语音应用于文本 以转录输入中的口语。 对于受支持语言的子集,它使用 快速听录 来减少处理延迟。

下表列出了快速听录支持的语言/区域设置。

语言 语言代码 语言 语言代码
中文(普通话,简体) zh-CN 印度尼西亚语(印度尼西亚) id-ID
丹麦语(丹麦) da-DK 意大利语(意大利) it-IT
英语(印度) en-IN 日语(日本) ja-JP
英语(英国) en-GB 韩语(韩国) ko-KR
英语(美国) en-US 波兰语(波兰) pl-PL
芬兰语(芬兰) fi-FI 葡萄牙语(巴西) pt-BR
法语(法国) fr-FR 葡萄牙语(葡萄牙) pt-PT
德语(德国) de-DE 西班牙语(墨西哥) es-MX
希伯来语(以色列) he-IL 西班牙语(西班牙) es-ES
印地语(印度) hi-IN 瑞典语(瑞典) sv-SE

下表列出了所有支持的语言/区域设置。

语言 语言代码 语言 语言代码
南非语(南非) af-ZA 匈牙利语(匈牙利) hu-HU
阿尔巴尼亚语(阿尔巴尼亚) sq-AL 冰岛语(冰岛) is-IS
阿姆哈拉语(埃塞俄比亚) am-ET 印度尼西亚语(印度尼西亚) id-ID
阿拉伯语(阿尔及利亚) ar-DZ 爱尔兰语(爱尔兰) ga-IE
阿拉伯语(巴林) ar-BH 祖鲁语(南非) zu-ZA
阿拉伯语(埃及) ar-EG 意大利语(意大利) it-IT
阿拉伯语(伊拉克) ar-IQ 意大利语(瑞士) it-CH
阿拉伯语(以色列) ar-IL 日语(日本) ja-JP
阿拉伯语(约旦) ar-JO 爪哇语(拉丁语、印度尼西亚) jv-ID
阿拉伯语(科威特) ar-KW 卡纳达语(印度) kn-IN
阿拉伯语(黎巴嫩) ar-LB 哈萨克语(哈萨克斯坦) kk-KZ
阿拉伯语(利比亚) ar-LY 高棉语(柬埔寨) km-KH
阿拉伯语(摩洛哥) ar-MA 斯瓦希里语(肯尼亚) sw-KE
阿拉伯语(阿曼) ar-OM 斯瓦希里语(坦桑尼亚) sw-TZ
阿拉伯语(巴勒斯坦权力机构) ar-PS 韩语(韩国) ko-KR
阿拉伯语(卡塔尔) ar-QA 老挝 (老挝) lo-LA
阿拉伯语(沙特阿拉伯) ar-SA 拉脱维亚语(拉脱维亚) lv-LV
阿拉伯语(叙利亚) ar-SY 立陶宛语(立陶宛) lt-LT
阿拉伯语(突尼斯) ar-TN 马其顿语(北马其顿) mk-MK
阿拉伯语(阿拉伯联合酋长国) ar-AE 马来语(马来西亚) ms-MY
阿拉伯语(也门) ar-YE 马拉雅拉姆语(印度) ml-IN
亚美尼亚语(亚美尼亚) hy-AM 马耳他语(马耳他) mt-MT
阿萨姆语(印度) as-IN 马拉地语(印度) mr-IN
阿塞拜疆语(拉丁语,阿塞拜疆) az-AZ 蒙古语(蒙古) mn-MN
巴斯克语 eu-ES 尼泊尔语(尼泊尔) ne-NP
孟加拉语(印度) bn-IN 挪威博克mål nb-NO
波斯尼亚语(波斯尼亚和黑塞哥维那) bs-BA 奥迪亚 (印度) or-IN
保加利亚语(保加利亚) bg-BG 普什图语(阿富汗) ps-AF
缅甸语(缅甸) my-MM 波斯语(伊朗) fa-IR
加泰隆语 ca-ES 波兰语(波兰) pl-PL
中文(粤语,简体) yue-CN 葡萄牙语(巴西) pt-BR
中文(粤语,繁体) zh-HK 葡萄牙语(葡萄牙) pt-PT
中文(冀鲁官话,简体) zh-CN-shandong 旁遮普语(印度) pa-IN
中文(普通话,简体) zh-CN 罗马尼亚语(罗马尼亚) ro-RO
中文(西南普通话,简体) zh-CN-sichuan 俄语(俄罗斯) ru-RU
中文(台湾普通话,繁体) zh-TW 塞尔维亚语(西里尔文,塞尔维亚) sr-RS
汉语(吴方言,简体) wuu-CN 僧伽罗语(斯里兰卡) si-LK
克罗地亚语(克罗地亚) hr-HR 斯洛伐克语(斯洛伐克) sk-SK
捷克语(捷克) cs-CZ 斯洛文尼亚语(斯洛文尼亚) sl-SI
丹麦语(丹麦) da-DK 索马里语(索马里) so-SO
荷兰语(比利时) nl-BE 西班牙语(阿根廷) es-AR
荷兰语(荷兰) nl-NL 西班牙语(玻利维亚) es-BO
英语(澳大利亚) en-AU 西班牙语(智利) es-CL
英语(加拿大) en-CA 西班牙语(哥伦比亚) es-CO
英语(加纳) en-GH 西班牙语(哥斯达黎加) es-CR
英语(香港特別行政区) en-HK 西班牙语(古巴) es-CU
英语(印度) en-IN 西班牙语(多米尼加共和国) es-DO
英语(爱尔兰) en-IE 西班牙语(厄瓜多尔) es-EC
英语(肯尼亚) en-KE 西班牙语(萨尔瓦多) es-SV
英语(新西兰) en-NZ 西班牙语(赤道几内亚) es-GQ
英语(尼日利亚) en-NG 西班牙语(危地马拉) es-GT
英语(菲律宾) en-PH 西班牙语(洪都拉斯) es-HN
英语(新加坡) en-SG 西班牙语(墨西哥) es-MX
英语(南非) en-ZA 西班牙(尼加拉瓜) es-NI
英语(坦桑尼亚) en-TZ 西班牙语(巴拿马) es-PA
英语(英国) en-GB 西班牙语(巴拉圭) es-PY
英语(美国) en-US 西班牙语(秘鲁) es-PE
爱沙尼亚语(爱沙尼亚) et-EE 西班牙语(波多黎各) es-PR
菲律宾语(菲律宾) fil-PH 西班牙语(西班牙) es-ES
芬兰语(芬兰) fi-FI 西班牙语(美国)1 es-US
法语(比利时) fr-BE 西班牙语(乌拉圭) es-UY
法语(加拿大)1 fr-CA 西班牙语(委内瑞拉) es-VE
法语(法国) fr-FR 瑞典语(瑞典) sv-SE
法语(瑞士) fr-CH 泰米尔语(印度) ta-IN
加利西亚语 gl-ES 泰卢固语(印度) te-IN
格鲁吉亚语(格鲁吉亚) ka-GE 泰语(泰国) th-TH
德语(奥地利) de-AT 土耳其语 (Türkiye) tr-TR
德语(德国) de-DE 乌克兰语(乌克兰) uk-UA
德语(瑞士) de-CH 乌尔都语(印度) ur-IN
希腊语(希腊) el-GR 乌兹别克语(拉丁语,乌兹别克斯坦) uz-UZ
古吉拉特语(印度) gu-IN 越南语(越南) vi-VN
希伯来语(以色列) he-IL 威尔士语(英国) cy-GB
印地语(印度) hi-IN

字段值规范化

不同的区域设置有不同的方法来表示数字、日期和时间。 内容理解支持将这些不同的表示形式规范化为以下区域设置的标准化 ISO 表单。

语言 语言代码 语言 语言代码
阿拉伯语 ar-AEar-EGar-SA 日语 ja-JP
孟加拉语 bn-IN 韩语 ko-KR
保加利亚语 bg-BG 拉脱维亚语 lv-LV
加泰隆语 ca-ES 立陶宛语 lt-LT
中文(简体) zh-CN 马来语 ms-MY
中文(传统) zh-TW 马拉地语 mr-IN
克罗地亚语 hr-HR 尼泊尔语 ne-IN
捷克语 cs-CZ 挪威语 no-NO
丹麦语 da-DK 波兰语 pl-PL
荷兰语 nl-NL 葡萄牙语 pt-BRpt-PT
英语 en-AUen-CAen-GBen-ILen-INen-MYen-US 罗马尼亚语 ro-RO
爱沙尼亚语 et-EE 俄语 ru-RU
芬兰语 fi-FI 塞尔维亚语 sr-RS
法语 fr-CAfr-FR 斯洛伐克语 sk-SK
加利西亚语 gl-ES 斯洛文尼亚语 sl-SI
德语 de-DE 西班牙语 es-ARes-ESes-MX
希腊语 el-GR 瑞典语 sv-SE
希伯来语 he-IL 泰米尔语 ta-IN
印地语 hi-IN 泰语 th-TH
匈牙利语 hu-HU 土耳其语 tr-TR
冰岛语 is-IS 乌克兰语 uk-UA
印度尼西亚语 id-ID 越南语 vi-VN
意大利语 it-IT