通用詞彙和概念的語言理解詞彙
重要
LUIS 將於 2025 年 10 月 1 日淘汰,而自 2023 年 4 月 1 日開始,您將無法建立新的 LUIS 資源。 建議移轉 LUIS 應用程式至交談語言理解,以享有產品持續支援和多語言功能的優點。
Language Understanding (LUIS) 詞彙說明您在使用 LUIS 服務時可能會遇到的詞彙。
使用中版本
使用中版本是 使用 LUIS 入口網站對模型進行變更時所更新的應用程式版本 。 在 LUIS 入口網站中,如果您想要變更非使用中版本的版本,您必須先將該版本設定為作用中。
主動式學習
主動式學習是機器學習技術,其中機器學習模型用來識別要標記的資訊性新範例。 在 LUIS 中,主動式學習是指從目前預測不清楚以改善模型的端點流量新增語句。 選取 [檢閱端點語句],即可檢視要加上標籤的語句。
另請參閱:
應用程式(應用程式)
在 LUIS 中,您的應用程式或應用程式是一組以相同數據集為基礎的機器學習模型集合,可共同預測特定案例的意圖和實體。 每個應用程式都有個別的預測端點。
如果您要建置 HR Bot,您可能會有一組意圖,例如「排程休假時間」、「查詢權益」和「更新個人資訊」,以及您群組至單一應用程式的每個意圖的實體。
編寫
撰寫是使用 LUIS 入口網站或撰寫 API 來建立、管理及部署 LUIS 應用程式的能力。
製作金鑰
撰寫 金鑰 是用來撰寫應用程式。 不適用於生產層級端點查詢。 如需詳細資訊,請參閱 資源限制。
製作資源
您的 LUIS 撰寫資源 是可管理的專案,可透過 Azure 取得。 資源是您存取 Azure 服務的相關撰寫、定型和發佈能力。 資源包含存取相關聯 Azure 服務所需的驗證、授權和安全性資訊。
撰寫資源具有 Azure 的「種類」 LUIS-Authoring
。
批次測試
批次測試是能夠使用一致且已知的使用者語句測試集來驗證目前LUIS應用程式的模型。 批次測試是以 JSON 格式的檔案定義。
另請參閱:
F-measure
在批次測試中,測量測試的正確性。
偽陰性 (FN)
在批次測試中,數據點代表應用程式錯誤地預測目標意圖/實體不存在的語句。
偽陽性 (FP)
在批次測試中,數據點代表應用程式錯誤地預測目標意圖/實體是否存在的語句。
精確度
在批次測試中,精確度(也稱為正預測值)是所擷取語句中相關語句的分數。
動物批次測試的範例是預測的綿羊數目除以動物總數(綿羊和非羊一樣)。
召回率
在批次測試中,召回率(也稱為敏感度),是 LUIS 一般化的能力。
動物批次測試的範例是預測的綿羊數目除以可用的綿羊總數。
真陰性 (TN)
真正的負數是當您的應用程式正確預測不相符時。 在批次測試中,當您的 app 預測意圖或實體時,會發生真正的負數,例如尚未使用該意圖或實體加上標籤的範例。
真陽性 (TP)
True positive (TP) 當應用程式正確預測相符專案時,即為真陽性。 在批次測試中,當您的應用程式預測意圖或實體時,就會發生真陽性,以取得已使用該意圖或實體加上標籤的範例。
分類器
分類器是一種機器學習模型,可預測輸入適用的類別或類別。
共同作業者
共同作業者在概念上與參與者相同。 當擁有者將共同作業者的電子郵件位址新增至未使用 Azure 角色型存取控制 (Azure RBAC) 控制的應用程式時,即會授與共同作業者存取權。 如果您仍在使用共同作業者,您應該移轉 LUIS 帳戶,並使用 LUIS 撰寫資源來管理 Azure RBAC 的參與者。
參與者
參與者不是 應用程式的擁有者 ,但具有新增、編輯和刪除意圖、實體、語句的相同許可權。 參與者會將 Azure 角色型存取控制 (Azure RBAC) 提供給 LUIS 應用程式。
另請參閱:
- 如何 新增參與者
描述項
描述元是先前用於機器學習 功能的詞彙。
網域
在 LUIS 內容中,定義域是知識領域。 您的網域專屬於您的案例。 不同的網域會使用在定義域內容中具有意義的特定語言和術語。 例如,如果您要建置應用程式來播放音樂,您的應用程式會有音樂特有的詞彙和語言,例如“歌曲、曲目、專輯、歌詞、b 邊、藝術家”。 如需網域的範例,請參閱 預先建置的網域。
端點
撰寫端點
LUIS 撰寫端點 URL 是您撰寫、定型及發佈應用程式的位置。 端點 URL 包含已發佈應用程式的區域或自定義子域,以及應用程式識別碼。
深入瞭解如何以程式設計方式從 開發人員參考撰寫您的應用程式
預測端點
LUIS 預測端點 URL 是在 LUIS 應用程式撰寫和發佈之後提交 LUIS 查詢的位置。 端點 URL 包含已發佈應用程式的區域或自定義子域,以及應用程式識別碼。 您可以在應用程式的 Azure 資源頁面上找到端點,也可以從取得應用程式資訊 API 取得端點 URL。
您對預測端點的存取會獲得 LUIS 預測金鑰的授權。
Entity
實體 是語句中的單字,描述用來履行或識別意圖的資訊。 如果您的實體很複雜,而且您想要模型識別特定部分,您可以將模型分成子實體。 例如,您可能會想要讓模型預測地址,以及街道、城市、州和郵遞區號等子實體。 實體也可以當做模型的功能使用。 來自 LUIS 應用程式的回應同時包含預測意圖和所有實體。
實體擷取器
實體擷取器有時只稱為擷取器,是 LUIS 用來預測實體的機器學習模型類型。
實體架構
實體架構是您針對具有子實體之機器學習實體所定義的結構。 預測端點會傳回架構中定義的所有擷取實體和子實體。
實體的子實體
子實體是機器學習實體的子實體。
非機器學習實體
使用文字比對來擷取數據的實體:
- 清單實體
- 規則運算式實體
清單實體
清單實體代表一組固定且封閉的相關單字及其同義字。 清單實體是完全相符的項目,與機器學習實體不同。
如果清單實體中的單字包含在清單中,則會預測實體。 例如,如果您有名為 「size」 的清單實體,而且清單中有 「small, medium, large」 字組,則不論內容為何,都會針對所有語句預測大小實體。
規則運算式
正 則表達式實體 代表正則表達式。 正則表達式實體與機器學習實體不同,完全相符。
預建實體
如需預先建置的實體,請參閱預先建置模型的專案。
功能
在機器學習中,功能是可協助模型辨識特定概念的特性。 這是 LUIS 可以使用但不是硬式規則的提示。
此詞彙也稱為機器學習功能。
這些提示會與標籤搭配使用,以瞭解如何預測新數據。 LUIS 支援片語清單,並使用其他模型作為功能。
必要功能
必要的功能是限制 LUIS 模型的輸出的方法。 當實體的功能標示為必要時,不論機器學習模型所預測的內容為何,都必須出現在要預測之實體的範例中。
假設您有預先建置的數位功能,您已在功能表排序 Bot 的數量實體上標示為必要。 當您的 I want a bajillion large pizzas?
Bot 看到 時,不論其出現的內容為何,都會將 bajillion 預測為數量。 Bajillion 不是有效的數位,而且不會由預先建置的數位實體預測。
Intent
意圖代表使用者想要執行的工作或動作。 其是使用者輸入中表達的目的或目標,例如預訂班機或支付帳單。 在 LUIS 中,整體語句會分類為意圖,但語句的部分會擷取為實體。
卷標範例
卷標或標記是將正或負範例與模型產生關聯的程式。
意圖的標籤
在 LUIS 中,應用程式內的意圖互斥。 這表示當您將語句新增至意圖時,它會被視為 該意圖的正面 範例,以及 所有其他意圖的負面 範例。 負面範例不應與 「None」 意圖混淆,這代表應用程式範圍外的語句。
實體的標籤
在 LUIS 中,您會 將意圖範例語句中的單字或片語標示 為 正 範例。 標籤會顯示該語句應該預測的意圖。 加上標籤的語句可用來定型意圖。
LUIS 應用程式
請參閱應用程式 (app) 的定義。
Model
「機器學習」模型是一個函式,可預測輸入數據。 在 LUIS 中,我們會將意圖分類器和實體擷取器一般稱為「模型」,而我們將定型、發佈及查詢的模型集合稱為「應用程式」。
標準化值
您會將值新增至清單實體。 每個值都可以有一或多個同義字的清單。 回應中只會傳回正規化值。
過度學習
在特定範例上固定模型時,就會發生過度學習,而且無法充分一般化。
擁有者
每個應用程式都有一個擁有者,其為建立應用程式的人員。 擁有者會管理 Azure 入口網站 中應用程式的許可權。
片語清單
片語清單是特定類型的機器學習功能,其中包含屬於相同類別的值(單字或片語)群組,而且必須以類似方式處理(例如城市或產品的名稱)。
預先建置模型
預先建置的模型是兩者的意圖、實體或集合,以及加上卷標的範例。 這些常見的預先建置模型可以新增至您的應用程式,以減少應用程式所需的模型開發工作。
預建網域
預先建置的網域是針對特定網域設定的 LUIS 應用程式,例如家庭自動化(HomeAutomation)或餐廳預訂(RestaurantReservation)。 已為此網域設定意圖、語句和實體。
預建實體
預先建置的實體是 LUIS 提供的一般資訊類型,例如數位、URL 和電子郵件。 這些會根據公用數據建立。 您可以選擇將預先建置的實體新增為獨立實體,或新增為實體的功能。
預先建置的意圖
預先建置的意圖是 LUIS 提供一般資訊類型的意圖,並隨附自有標籤的範例語句。
預測
預測是 Azure LUIS 預測服務的 REST 要求,可接受新數據(用戶語句),並將定型和已發佈的應用程式套用至該數據,以判斷找到哪些意圖和實體。
預測金鑰
預測 金鑰 是與您在 Azure 中建立的 LUIS 服務相關聯的金鑰,可授權您使用預測端點。
此金鑰不是撰寫金鑰。 如果您有預測端點密鑰,則應該用於任何端點要求,而不是撰寫密鑰。 您可以在 LUIS 網站中 Azure 資源頁面底部的端點 URL 內看到目前的預測金鑰。 它是 subscription-key name/value pair 的值。
預測資源
您的 LUIS 預測資源是可管理的專案,可透過 Azure 取得。 資源是您存取 Azure 服務相關預測的存取權。 資源包含預測。
預測資源具有的 LUIS
Azure「種類」。
預測分數
分數是從 0 到 1 的數位,這是系統對特定輸入語句符合特定意圖有多自信的量值。 接近 1 的分數表示系統非常有信心其輸出,而分數接近 0 表示系統確信輸入不符合特定輸出。 中間的分數意味著系統非常不確定如何做出決定。
例如,採用用來識別某些客戶文字是否包含食品訂單的模型。 它可能會為“我想訂購一杯咖啡”提供1分(系統非常有信心,這是一個訂單)和0分的“我的球隊贏得了比賽昨晚”(系統非常有信心,這不是一個訂單)。 對於“讓我們喝一些茶”,它可能有0.5分 (不確定這是否是訂單)。
程序設計金鑰
已重新命名為 撰寫金鑰。
發佈
配額
LUIS 配額是 Azure 訂用帳戶層的限制。 LUIS 配額可以受到每秒要求數 (HTTP 狀態 429) 和一個月內的總要求限制 (HTTP 狀態 403)。
結構描述
您的架構包含您的意圖和實體,以及子實體。 架構一開始會進行規劃,然後經過一段時間的逐一查看。 架構不包含應用程式設定、功能或範例語句。
情感分析
情感分析提供語言服務所提供語句的正面或負面值。
語音預備
語音擷取可改善您案例中常搭配 語音服務使用的口語和片語組辨識。 針對已啟用語音啟動的應用程式,所有 LUIS 標籤範例都可用來建立此特定應用程式的自訂語音模型,以改善語音辨識精確度。 例如,在國際象棋遊戲中,您想要確定當使用者說「移動騎士」時,它不會解譯為「移動之夜」。 LUIS 應用程式應該包含「騎士」標示為實體的範例。
入門金鑰
第一次開始使用 LUIS 時要使用的免費金鑰。
同義字
在 LUIS 清單實體中,您可以建立標準化值,每個值都可以有同義字清單。 例如,如果您建立的大小實體,其正規化值為小型、中型、大型和超大型。 您可以為每個值建立同義字,如下所示:
無正規化值 | 同義字 |
---|---|
Small | 小一,8盎司 |
中 | 一般,12 盎司 |
大型 | 大,16 盎司 |
Xtra 大型 | 最大的一,24盎司 |
當輸入中看到任何同義字時,模型會傳回實體的正規化值。
Test
測試 LUIS 應用程式表示檢視模型預測。
時區位移
端點包含 時區Offset。 這是您想要從 datetimeV2 預先建置實體新增或移除的分鐘數。 例如,如果語句是「現在的時間為何?」,則傳回的 datetimeV2 是用戶端要求的目前時間。 如果您的用戶端要求來自 Bot 或其他與 Bot 使用者不同的應用程式,您應該傳入 Bot 與使用者之間的位移。
請參閱 變更預先建置 datetimeV2 實體的時區。
Token
令牌是 LUIS 可以辨識的最小文字單位。 這在語言之間稍有不同。
對於 英文,令牌是字母和數字的連續範圍(不含空格或標點符號)。 空間不是令牌。
片語 | 令牌計數 | 說明 |
---|---|---|
Dog |
1 | 沒有標點符號或空格的單一單字。 |
RMT33W |
1 | 記錄定位器編號。 它可能有數位和字母,但沒有標點符號。 |
425-555-5555 |
5 | 電話號碼。 每個標點符號都是單一標記,因此 425-555-5555 會是5個令牌:425 - 555 - 5555 |
https://luis.ai |
7 | https : / / luis . ai |
定型
訓練是自上次定 型以來,針對使用中版本所做的任何變更進行教學的程式。
訓練資料
定型資料是定型模型所需的一組資訊。 這包括架構、加上標籤的語句、功能和應用程式設定。
定型錯誤
定型錯誤是定型數據與標籤不相符的預測。
表達
語句是使用者輸入,代表交談中句子的簡短文字。 這是一種自然語言片語,例如「訂兩張機票下星期二到西雅圖」。 新增範例語句來定型模型,而模型會在運行時間預測新的語句。
版本
LUIS 版本 是與 LUIS 應用程式識別碼和已發佈端點相關聯的 LUIS 應用程式特定實例。 每個 LUIS 應用程式至少有一個版本。