Azure AI Video Indexer 中的語言支援
本文說明 Video Indexer 的語言選項,並提供每個選項的語言支援清單。 包含 Video Indexer 功能、翻譯、語言識別、自訂的語言支援,以及 Video Indexer 網站的語言設定。
每個案例的支援語言
本節說明 Video Indexer 語言選項,而且每個選項都有支援語言資料表。
重要
列出的所有語言在透過 API 編製索引時都支援翻譯。
資料行說明
支援的來源語言 - 媒體檔案中支援轉譯、翻譯和搜尋的口語語言。
語言識別 - 當語言識別用於編製索引時,Video Indexer 是否可以自動偵測語言。 若要深入了解,請參閱使用 Azure AI Video Indexer 自動識別口語語言和語言識別一節。
自訂 (語言模型) - 在 Video Indexer 中自訂語言模型時,是否可以使用語言。 若要深入了解,請參閱在 Azure AI Video Indexer 中自訂語言模型。
發音 (語言模型) - 語言是否可用於建立發音資料集,作為自訂語音模型的一部分。 若要深入了解,請參閱使用 Azure AI Video Indexer 自訂語音模型。
網站翻譯 - 使用 Azure AI Video Indexer 網站時,語言是否支援翻譯。 在語言下拉式功能表中選取翻譯的語言。
下列深入解析會翻譯:
- 文字記錄
- 關鍵字
- 主題
- 標籤
- 框架模式 (目前只有希伯來文)
使用翻譯時,所有其他深入解析都會以英文顯示。
網站語言 - 是否可以選取語言以用於 Azure AI Video Indexer 網站。 選取 [設定] 圖示,然後在 [語言設定] 下拉式清單中選取語言。
語言 | 程式碼 | 已支援 來源語言 |
語言 識別 |
自訂 (語言模型) |
發音 (語言模型) |
網站 翻譯 |
網站 語言 |
---|---|---|---|---|---|---|---|
南非荷蘭文 | af-ZA | ✔ | |||||
阿拉伯文 (以色列) | ar-IL | ✔ | ✔ | ||||
阿拉伯文 (伊拉克) | ar-IQ | ✔ | ✔ | ||||
阿拉伯文 (約旦) | ar-JO | ✔ | ✔ | ✔ | |||
阿拉伯文 (科威特) | ar-KW | ✔ | ✔ | ✔ | |||
阿拉伯文 (黎巴嫩) | ar-LB | ✔ | ✔ | ||||
阿拉伯文 (阿曼) | ar-OM | ✔ | ✔ | ✔ | |||
阿拉伯文 (巴勒斯坦民族權力機構) | ar-PS | ✔ | ✔ | ||||
阿拉伯文 (卡達) | ar-QA | ✔ | ✔ | ✔ | |||
阿拉伯文 (沙烏地阿拉伯) | ar-SA | ✔ | ✔ | ✔ | |||
阿拉伯文 (阿拉伯聯合大公國) | ar-AE | ✔ | ✔ | ✔ | |||
阿拉伯文埃及 | ar-EG | ✔ | ✔ | ✔ | ✔ | ||
阿拉伯文現代標準 (巴林) | ar-BH | ✔ | ✔ | ✔ | |||
阿拉伯文敘利亞阿拉伯共和國 | ar-SY | ✔ | ✔ | ✔ | |||
亞美尼亞文 | hy-AM | ✔ | |||||
孟加拉文 | bn-BD | ✔ | |||||
波士尼亞文 | bs-Latn | ✔ | |||||
保加利亞文 | bg-BG | ✔ | ✔ | ✔ | |||
加泰蘭文 | ca-ES | ✔ | ✔ | ✔ | ✔ | ✔ | |
繁體中文 (廣東話) | zh-HK | ✔ | ✔ | ✔ | ✔ | ✔ | |
中文 (簡體) | zh-Hans | ✔ | ✔ | ✔ | ✔ | ||
中文 (簡體) | zh-CK | ✔ | ✔ | ✔ | ✔ | ||
中文 (繁體) | zh-Hant | ✔ | |||||
克羅埃西亞文 | hr-HR | ✔ | ✔ | ✔ | ✔ | ||
捷克文 | cs-CZ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
丹麥文 | da-DK | ✔ | ✔ | ✔ | ✔ | ✔ | |
荷蘭文 | nl-NL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
英文澳大利亞 | en-AU | ✔ | ✔ | ✔ | ✔ | ✔ | |
英文英國 | en-GB | ✔ | ✔ | ✔ | ✔ | ✔ | |
英文美國 | zh-TW | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
愛沙尼亞文 | et-EE | ✔ | ✔ | ✔ | ✔ | ✔ | |
斐濟文 | en-FJ | ✔ | |||||
菲律賓文 | fil-PH | ✔ | |||||
芬蘭文 | fi-FI | ✔ | ✔ | ✔ | ✔ | ✔ | |
法文 | fr-FR | ✔ | ✔ | ✔ | ✔ | ✔ | |
法文 (加拿大) | fr-CA | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
德文 | de-DE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
希臘文 | el-GR | ✔ | ✔ | ✔ | |||
古吉拉特文 | gu-IN | ✔ | ✔ | ✔ | |||
海地文 | fr-HT | ✔ | |||||
希伯來文 | he-IL | ✔ | ✔ | ✔ | ✔ | ||
印度文 | hi-IN | ✔ | ✔ | ✔ | ✔ | ✔ | |
匈牙利文 | hu-HU | ✔ | ✔ | ✔ | ✔ | ✔ | |
冰島文 | is-IS | ✔ | |||||
印尼文 | id-ID | ✔ | ✔ | ✔ | |||
愛爾蘭文 | ga-IE | ✔ | ✔ | ✔ | ✔ | ||
義大利文 | it-IT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
日文 | ja-JP | ✔ | ✔ | ✔ | ✔ | ✔ | |
坎那達文 | kn-IN | ✔ | ✔ | ||||
史瓦希里文 | sw-KE | ✔ | |||||
韓文 | ko-KR | ✔ | ✔ | ✔ | ✔ | ✔ | |
拉脫維亞文 | lv-LV | ✔ | ✔ | ✔ | ✔ | ✔ | |
立陶宛文 | lt-LT | ✔ | ✔ | ✔ | |||
馬達加斯加文 | mg-MG | ✔ | |||||
馬來文 | ms-MY | ✔ | ✔ | ||||
馬來亞拉姆文 | ml-IN | ✔ | ✔ | ||||
馬爾他文 | mt-MT | ✔ | |||||
挪威文 | nb-NO | ✔ | ✔ | ✔ | ✔ | ||
波斯文 | fa-IR | ✔ | ✔ | ✔ | |||
波蘭文 | pl-PL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
葡萄牙文 | pt-BR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
葡萄牙文 (葡萄牙) | pt-PT | ✔ | ✔ | ✔ | ✔ | ✔ | |
羅馬尼亞文 | ro-RO | ✔ | ✔ | ✔ | ✔ | ✔ | |
俄文 | ru-RU | ✔ | ✔ | ✔ | ✔ | ✔ | |
薩摩亞文 | en-WS | ||||||
塞爾維亞文 (斯拉夫) | sr-Cyrl-RS | ✔ | |||||
塞爾維亞文 (拉丁) | sr-Latn-RS | ✔ | |||||
斯洛伐克文 | sk-SK | ✔ | ✔ | ✔ | ✔ | ✔ | |
斯洛維尼亞文 | sl-SI | ✔ | ✔ | ✔ | ✔ | ✔ | |
西班牙文 | es-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
西班牙文 (墨西哥) | es-MX | ✔ | ✔ | ✔ | ✔ | ✔ | |
瑞典文 | sv-SE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
坦米爾文 | ta-IN | ✔ | ✔ | ✔ | |||
泰盧固文 | te-IN | ✔ | ✔ | ||||
泰文 | th-TH | ✔ | ✔ | ✔ | ✔ | ||
東加文 | to-TO | ✔ | |||||
土耳其文 | tr-TR | ✔ | ✔ | ✔ | ✔ | ✔ | |
烏克蘭文 | uk-UA | ✔ | ✔ | ✔ | |||
烏都文 | ur-PK | ✔ | |||||
越南文 | vi-VN | ✔ | ✔ | ✔ |
透過 API 取得支援的語言
使用取得支援的語言 API 呼叫來提取每個區域支援語言的完整清單。 如需詳細資訊,請參閱取得支援的語言。
API 會傳回具有下列值的支援語言清單:
{
"name": "Language",
"languageCode": "Code",
"isRightToLeft": true/false,
"isSourceLanguage": true/false,
"isAutoDetect": true/false
}
支援的來源語言:
如果
isSourceLanguage
為 False,則語言僅支援翻譯。 如果isSourceLanguage
為 True,則語言支援作為轉譯、翻譯和搜尋的來源。語言識別 (自動偵測):
如果
isAutoDetect
為 True,語言支援語言識別 (LID) 和多語言識別 (MLID)。
語言識別
將媒體檔案上傳至 Video Indexer 時,您可以指定媒體檔案的來源語言。 如果透過 Video Indexer 網站為檔案編製索引,則可以在檔案上傳期間選取語言來完成。 如果您要透過 API 提交編製索引作業,則可使用語言參數來完成。 接著會使用選取的語言來產生檔案的轉譯。
如果您不確定媒體檔案的來源語言,或可能包含多種語言,Video Indexer 可以偵測口語語言。 如果您針對媒體檔案的來源語言選取自動偵測單一語言 (LID) 或多語言 (MLID),則會使用已偵測語言來轉譯媒體檔案。 若要深入了解 LID 和 MLID,請參閱使用 Azure AI Video Indexer 自動識別口語語言,請參閱使用語言識別模型自動識別口語語言和自動識別並轉譯多語言內容
在 LID 和 MLID 的媒體檔案編製索引期間,允許識別的語言限制為 10 種語言。 以下是語言識別 (LID) 和多語言識別 (MILD) 的 9 個預設語言:
- 德文 (de-DE)
- 英文 (美國) (en-US)
- 西班牙文 (es-ES)
- 法文 (fr-FR)
- 義大利文 (it-IT)
- 日文 (ja-JP)
- 葡萄牙文 (pt-BR)
- 俄文 (ru-RU)
- 簡體中文 (zh-Hans)
如何變更預設語言的清單
如果您需要使用語言來識別預設未使用的語言,您可以將清單自訂為透過網站或 API 支援自訂的任何 10 種語言:
使用網站來變更清單
選取模型自訂底下的 [語言識別碼] 索引標籤。 語言清單專屬於您所使用的 Video Indexer 帳戶,以及適用於登入的使用者。 預設語言清單會根據每個使用者 (在本機裝置上)、每部裝置和瀏覽器進行儲存。 因此,每個使用者都可以設定自己的預設識別語言清單。
使用 [新增語言] 來搜尋和新增更多語言。 如果已選取 10 種語言,您必須先移除其中一個現有已偵測語言,再新增語言。
使用 API 來變更清單
當您上傳檔案時,Video Indexer 語言模型預設會交叉參考 9 種語言。 如果有相符項目,模型會使用已偵測語言來產生檔案的轉譯。
使用語言參數來指定 multi
(MLID) 或 auto
(LID) 參數。 使用 customLanguages
參數來指定最多 10 種語言。 (只有在語言參數設定為 multi
或 auto
時,才會使用此參數。)若要深入了解如何使用 API,請參閱使用 Azure AI Video Indexer API。