表達

重要

LUIS 將於 2025 年 10 月 1 日淘汰,而自 2023 年 4 月 1 日開始,您將無法建立新的 LUIS 資源。 建議移轉 LUIS 應用程式交談語言理解,以享有產品持續支援和多語言功能的優點。

語句是您的應用程式需要解譯的用戶輸入。 若要將 LUIS 定型以從這些輸入擷取意圖和實體,請務必擷取每個意圖的各種不同範例語句。 主動式學習或繼續訓練新語句的程序,對於 LUIS 所提供的機器學習智能至關重要。

收集您認為使用者將輸入的語句。 包含語句,這表示相同專案,但以各種方式建構:

  • 語句長度 - 用戶端應用程式的短、中和長
  • 單字和片語長度
  • 字組放置 - 語句開頭、中間和結尾的實體
  • 文法
  • 複數表示
  • 詞幹分析
  • 名詞和動詞選擇
  • 標點符號 - 同時使用正確和不正確的文法

選擇不同的語句

當您開始 將範例語句 新增至 LUIS 模型時,有數個要記住的原則:

語句的格式不一定正確

您的應用程式可能需要處理句子,例如「為我預訂巴黎機票」或句子片段,例如「預訂」或「巴黎航班」用戶也經常犯拼字錯誤。 規劃應用程式時,請考慮是否要使用 Bing 拼字檢查 來更正使用者輸入,再將它傳遞至 LUIS。

如果您沒有拼字檢查使用者語句,您應該在包含錯字和拼字拼字的語句上訓練 LUIS。

使用使用者的代表語言

選擇語句時,請注意您認為是常見詞彙或片語對於用戶端應用程式的一般使用者而言可能並不常見。 他們可能沒有網域體驗或使用不同的術語。 使用使用者只有在是專家時才會說的字詞或片語時,請小心。

選擇不同的術語和片語

您會發現,即使您努力建立不同的句子模式,您仍會重複一些詞彙。 例如,下列語句具有類似的意義,但不同的術語和片語:

  • 如何? 取得計算機?
  • 我在哪裡取得計算機?
  • 我想得到一部電腦,我要怎麼做?
  • 何時可以有計算機?

此處 的核心詞彙電腦並無不同。 使用桌面電腦、膝上型計算機、工作站,甚至是計算機等替代方案。 LUIS 可以從內容智慧推斷同義字,但當您建立定型語句時,最好改變它們。

每個意圖中的範例語句

每個意圖都必須有範例語句 - 至少 15 個。 如果您有沒有任何範例語句的意圖,您將無法定型 LUIS。 如果您有一或幾個範例語句的意圖,LUIS 可能無法準確地預測意圖。

新增一小群語句

每次逐一查看模型來改善模型時,請勿新增大量的語句。 請考慮新增15個數量的語句。 然後 再次訓練發佈測試

LUIS 會使用 LUIS 模型作者仔細選取的語句來建置有效的模型。 新增太多語句並不重要,因為它會造成混淆。

最好從幾個語句開始,然後 檢閱端點語句 ,以取得正確的意圖預測和實體擷取。

語句正規化

語句正規化是忽略定型和預測期間文字類型效果的程式,例如標點符號和讀音符號。

語句正規化設定預設會關閉。 這些設定包括:

  • Word 表單
  • 變音符號
  • 標點符號

如果您開啟正規化設定,[測試] 窗格中的分數、批次測試和端點查詢將會針對該正規化設定的所有語句變更。

當您在 LUIS 入口網站中複製版本時,版本設定會保留在新的複製版本中。

在 [應用程式 設定] 頁面中,從頂端導覽功能表中選取 [管理],使用 LUIS 入口網站設定應用程式的版本設定。 您也可以使用更新版本 設定 API。 如需詳細資訊, 請參閱參考 檔。

Word 表單

正規化 文字形式 會忽略超出根目錄的字組差異。

變音符號

變音符號是文字中的標記或符號,例如:

İ ı Ş Ğ ş ğ ö ü

標點符號

正規化 標點符號 表示,在定型模型之前,以及在預測端點查詢之前,會從語句中移除標點符號。

標點符號是 LUIS 中的個別令牌。 在結尾包含句點的語句是一個不同的語句,而不是在結尾不包含句點的語句,而且可能會取得兩個不同的預測。

如果未正規化標點符號,LUIS 預設不會忽略標點符號,因為某些用戶端應用程式可能會在這些標記上具有意義。 請務必包含使用標點符號的範例語句,以及兩個樣式的語句,以傳回相同的相對分數。

請確定模型會在範例語句中處理標點符號(同時具有和沒有標點符號),或在更容易忽略標點符號的模式處理標點符號。 例如:我申請 {Job} 職位[.]

如果您的用戶端應用程式中標點符號沒有特定意義,請考慮 透過正規化標點符號來忽略標 點符號。

忽略單字和標點符號

如果您要忽略模式中的特定單字或標點符號,請使用具有方括號的忽略語法的模式[]

使用所有語句進行定型

定型不具決定性:語句預測可能會因版本或應用程式而略有不同。 您可以使用UseAllTrainingData名稱/值組來更新 版本設定 API,以使用所有定型數據來移除非決定性定型。

測試語句

開發人員應該藉由將語句傳送至 預測端點 URL,開始測試其 LUIS 應用程式與實際數據。 這些語句可用來使用檢閱語句來改善意圖和實體的效能。 使用 LUIS 入口網站中測試窗格提交的測試不會透過端點傳送,也不會參與主動式學習。

檢閱語句

在模型定型、發佈和接收 端點 查詢之後, 請檢閱 LUIS 建議的語句 。 LUIS 會選取意圖或實體分數低的端點語句。

最佳作法

文字意義的標籤

如果單字選擇或單字排列相同,但並不表示相同,請勿將它加上實體的標籤。

在下列語句中,公平字是同義字,這表示其拼字相同,但意義不同:

  • 今年夏天西雅圖地區發生了什麼樣的縣展?
  • 目前餐廳博覽會的2星級評級是嗎?

如果您想要讓事件實體尋找所有事件數據,請在第一個語句中標示文字公平,但不在第二個語句中加上標籤。

不要忽略可能的語句變化

LUIS 預期意圖語句的變化。 語句可能會有所不同,同時具有相同的整體意義。 變化可以包含語句長度、單字選擇和字組放置。

請勿使用相同的格式 使用各種格式
購買西雅圖的門票 購買 1 張票到西雅圖
購買巴黎的機票 在下週一前往巴黎的紅眼預訂兩張門票
購買奧蘭多的門票 我想預訂 3 張前往奧蘭多的春假門票

第二欄使用不同的動詞(購買,儲備,書籍),不同的數量(1,&“兩”,3),和不同的措辭安排,但都有相同的意圖購買機票旅行。

不要將太多範例語句新增至意圖

發佈應用程式之後,只會在開發生命週期程式中新增主動式學習的語句。 如果語句太類似,請新增模式。

下一步