LUIS 支援的語言與區域

重要

LUIS 將於 2025 年 10 月 1 日淘汰,而自 2023 年 4 月 1 日開始,您將無法建立新的 LUIS 資源。 建議移轉 LUIS 應用程式交談語言理解,以繼續享有產品支援和多重語言功能的好處。

LUIS 在服務內有各種不同的功能。 並非所有功能都有相同的語言地位。 請確定您有興趣的功能支援您所針對的語言文化特性。 LUIS 應用程式是特定文化特性,一旦設定就無法變更。

多語系 LUIS 應用程式

如果您需要多語言 LUIS 用戶端應用程式 (例如聊天機器人),您有幾個選項可用。 如果 LUIS 支援所有語言,請針對每種語言開發 LUIS 應用程式。 每個 LUIS 應用程式都有唯一的應用程式識別碼和端點記錄。 如果您必須為 LUIS 不支援的語言提供語言理解,您可以使用翻譯工具服務將表達翻譯成支援的語言、將表達提交至 LUIS 端點,以及接收所產生的分數。

注意

Azure AI 語言現在提供較新版本的Language Understanding功能。 如需詳細資訊,請參閱 Azure AI 語言檔。 如需支援語言服務內多種語言的語言理解功能,請參閱交談語言理解

支援的語言

LUIS 可理解下列語言的語句:

語言 Locale 預建網域 預建實體 片語清單建議 **情感分析關鍵片語擷取
阿拉伯文 (預覽 - 新式標準阿拉伯文) ar-AR - - - -
*中文 zh-CN -
荷蘭文 nl-NL - -
英文 (美國) en-US
英文 (英國) en-GB
法文 (加拿大) fr-CA - - -
法文 (法國) fr-FR
德文 de-DE
古吉拉特文 (預覽) gu-IN - - - -
印地文 (預覽) hi-IN - - -
義大利文 it-IT
*日文 ja-JP 僅限關鍵片語
韓文 ko-KR - - 僅限關鍵片語
馬拉地文 (預覽) mr-IN - - - -
葡萄牙文 (巴西) pt-BR 並非所有的次文化特性
西班牙文 (墨西哥) es-MX -
西班牙文 (西班牙) es-ES
坦米爾文 (預覽) ta-IN - - - -
泰盧固文 (預覽) te-IN - - - -
土耳其文 tr-TR - 僅限情感

語言支援會因預建實體網域而有所不同。

*中文支援注意事項

  • zh-CN 文化特性中,LUIS 預期會有簡體中文字元集,而不是繁體字元集。
  • 意圖、實體、功能和規則運算式的名稱可能採用中文或羅馬字元。
  • 如需 zh-CN 文化特性中支援哪些預建網域的相關資訊,請參閱預建網域參考

*日文支援注意事項

  • 因為 LUIS 不提供語法分析而無法理解 Keigo (敬語) 與非正式日文之間的差異,所以您必須將不同的正式層級合併為您應用程式的訓練範例。
    • でございます 與 です 不同。
    • です 與 だ 不同。

**語言服務支援注意事項

語言服務包含 keyPhrase 預建實體和情感分析。 只有葡萄牙文支援次文化特性:pt-PTpt-BR。 主要文化特性層級支援其他所有的文化特性。

語音 API 支援的語言

請參閱語音支援的語言,以取得語音聽寫模式語言。

Bing 拼字檢查支援的語言

如需支援的語言清單和狀態,請參閱 Bing 拼字檢查支援的語言

應用程式中的罕見或外來字

en-us 文化特性中,LUIS 會學習辨識大部分的英文字,包括俚語。 在 zh-cn 文化特性中,LUIS 會學習辨識大部分的中文字元。 如果您使用 en-us 中的罕見字組或 zh-cn 中的字元,而且您發現 LUIS 似乎無法辨識該字組或字元,您可以將該字組或字元新增到片語清單功能。 例如,應用程式文化特性外部的字組 (也就是外來字組) 應新增至片語清單功能。

混合式語言

混合式語言結合來自兩個文化特性 (例如英文和中文) 的文字。 LUIS 中不支援這些語言,因為應用程式是以單一文化特性為基礎。

Token 化

為了執行機器學習,LUIS 根據文化特性將語句分成數個語彙基元

語言 每個空格或特殊字元 字元層級 複合字組
阿拉伯文
中文
荷蘭文
英文 (en-us)
英文 (en-GB)
法文 (fr-FR)
法文 (fr-CA)
德文
古吉拉特文
Hindi
義大利文
日文
韓文
馬拉地文
葡萄牙文 (巴西)
西班牙文 (es-ES)
西班牙文 (es-MX)
坦米爾文
泰盧固文
土耳其文

自訂權杖化工具版本

下列文化特性具有自訂權杖化工具版本:

文化特性 版本 目的
德文
de-de
1.0.0 將字組 Token 化;方法是使用以機器學習為基礎的權杖化工具來分割字組,嘗試將複合字細分成單一元件。
如果使用者輸入 Ich fahre einen krankenwagen 作為表達,則會轉變成 Ich fahre einen kranken wagen。 可將 krankenwagen 獨立標記為不同的實體。
德文
de-de
1.0.2 依據空格分割字組以將其 Token 化。
如果使用者輸入 Ich fahre einen krankenwagen 作為表達,其會維持單一 Token (語彙基元)。 因此,krankenwagen 會標示為單一實體。
荷蘭文
nl-nl
1.0.0 將字組 Token 化;方法是使用以機器學習為基礎的權杖化工具來分割字組,嘗試將複合字細分成單一元件。
如果使用者輸入 Ik ga naar de kleuterschool 作為表達,則會轉變成 Ik ga naar de kleuter school。 可將 kleuterschool 獨立標記為不同的實體。
荷蘭文
nl-nl
1.0.1 依據空格分割字組以將其 Token 化。
如果使用者輸入 Ik ga naar de kleuterschool 作為表達,其會維持單一 Token (語彙基元)。 因此,kleuterschool 會標示為單一實體。

在權杖化工具版本之間進行移轉

Token 化會在應用層級進行。 不支援版本層級的 Token 化。

以新應用程式的形式匯入檔案,而不是版本。 此動作表示新的應用程式有不同應用程式識別碼,但會使用檔案中指定的權杖化工具版本。