一般的な用語や概念に関する Language Understanding の用語集

重要

LUIS は 2025 年 10 月 1 日に廃止され、2023 年 4 月 1 日から新しい LUIS リソースを作成できなくなります。 継続的な製品サポートと多言語機能のベネフィットを得るために、LUIS アプリケーション会話言語理解に移行することをお勧めします。

Language Understanding (LUIS) 用語集では、LUIS サービスの使用中に目にする可能性のある用語について説明します。

アクティブなバージョン

アクティブなバージョンとは、LUIS ポータルを使用してモデルに変更を加えたときに更新されるアプリのバージョンです。 LUIS ポータルで、アクティブなバージョンではないバージョンに変更を加える場合は、まずそのバージョンをアクティブとして設定する必要があります。

アクティブ ラーニング

アクティブ ラーニングは機械学習の手法であり、機械学習モデルを使用して、ラベル付けする有益な新しい例を識別するものです。 LUIS のアクティブ ラーニングとは、現在の予測が不明確なエンドポイント トラフィックから発話を追加してモデルを改善することを指します。 発話のラベルを確認するには、[review endpoint utterances](エンドポイント発話の確認) を選択します。

関連項目:

アプリケーション (アプリ)

LUIS では、アプリケーションまたはアプリは、同じデータ セットに基づいて構築された機械学習モデルのコレクションであり、特定のシナリオの意図とエンティティを予測するために連携します。 各アプリケーションには、個別の予測エンドポイントがあります。

HR ボットを構築している場合は、"休暇の予定を立てる"、"特典について問い合わせる"、"個人情報を更新する" などの一連の意図と、1 つのアプリケーションにグループ化する各意図のエンティティが存在する場合があります。

Authoring

作成は、LUIS ポータルまたはオーサリング API のいずれかを使用して、LUIS アプリを作成、管理、およびデプロイする機能です。

オーサリング キー

オーサリング キーはアプリの作成に使用されます。 運用レベルのエンドポイント クエリでは使用されません。 詳細については、リソースの制限に関するページを参照してください。

作成リソース

LUIS の作成リソースは、Azure を通じて利用できる管理可能な項目です。 リソースは、Azure サービスの関連する作成、トレーニング、および公開機能に対するアクセスです。 リソースには、関連する Azure サービスにアクセスするために必要な認証、承認、セキュリティ情報が含まれています。

作成 リソースには、LUIS-Authoring という Azure の "種類" があります。

バッチ テスト

バッチ テストは、ユーザー発話の一貫性のある既知のテスト セットを使用して、現在の LUIS アプリのモデルを検証する機能です。 バッチ テストは、JSON 形式のファイルに定義されます。

関連項目:

F メジャー

バッチ テストでは、テストの精度の測定値です。

検知漏れ (FN)

バッチ テストでは、このデータ ポイントは、アプリが誤ってターゲットの意図/エンティティの不在を予測した発話を表します。

誤検知 (FP)

バッチ テストでは、このデータ ポイントは、アプリが誤ってターゲットの意図/エンティティの存在を予測した発話を表します。

Precision

バッチ テストでは、精度 (陽性予測値とも呼ばれます) は、取得された発話の中にある関連する発話の割合です。

動物バッチ テストの例を使うと、予測された羊の数を動物の総数 (羊と羊以外の両方) で割ったものです。

再現率

バッチ テストでは、再現率 (感度とも呼ばれます) は、LUIS が一般化を行う能力です。

動物バッチ テストの例を使うと、予測された羊の数を使用可能な羊の総数で割ったものです。

真陰性 (TN)

真陰性とは、一致がないことがアプリで正しく予測される場合です。 バッチ テストでは、アプリがその意図またはエンティティでラベル付けされていない例の意図またはエンティティを予測すると、真の否定が発生します。

真陽性 (TP)

真陽性 (TP) 真陽性とは、一致があることがアプリで正しく予測される場合です。 バッチ テストでは、意図またはエンティティでラベル付けされた例について、アプリでその意図またはエンティティが予測される場合、真陽性が発生します。

分類子

分類子は、入力が適合するカテゴリまたはクラスを予測する機械学習モデルです。

分類子の例としては、意図があります。

コラボレーター

コラボレーターは、概念的には共同作成者と同じです。 所有者が Azure ロールベースのアクセス制御 (Azure RBAC) で制御されていないアプリにコラボレーターのメール アドレスを追加すると、コラボレーターにアクセスが許可されます。 引き続きコラボレーターを使用している場合は、LUIS アカウントを移行し、LUIS 作成リソースを使用して Azure RBAC で共同作成者を管理する必要があります。

Contributor

共同作成者はアプリの所有者ではありませんが、意図、エンティティ、発話を追加、編集、削除するための同じアクセス許可を持っています。 共同作成者は、LUIS アプリへの Azure ロールベースのアクセス制御 (Azure RBAC) を提供します。

関連項目:

  • 共同作成者の追加方法

記述子

記述子は、以前は機械学習の特徴に使用されていた用語です。

Domain

LUIS のコンテキストでは、ドメインとはナレッジの一領域です。 ドメインはシナリオに固有のものです。 ドメインによって、ドメインのコンテキストで意味のある特定の言語と用語が使用されます。 たとえば、音楽を再生するアプリケーションを構築している場合、アプリケーションには音楽に固有の用語と言語 ("歌、トラック、アルバム、歌詞、B 面、アーティスト" などの単語) があります。 ドメインの例については、「事前構築済みのドメイン」を参照してください。

エンドポイント

作成エンドポイント

LUIS 作成エンドポイント URL は、アプリを作成、トレーニング、公開する場所です。 エンドポイント URL には、公開されたアプリのリージョンまたはカスタム サブドメインとアプリ ID が含まれています。

プログラムでアプリを作成する方法の詳細については、開発者向けリファレンスを参照してください

予測エンドポイント

LUIS 予測エンドポイント URL は、LUIS アプリが作成および公開された後に、LUIS クエリを送信する場所です。 エンドポイント URL には、公開されたアプリのリージョンまたはカスタム サブドメインとアプリ ID が含まれています。 エンドポイントは、お使いのアプリの [Azure リソース] ページにあります。また、Get App Info API からエンドポイント URL を取得することもできます。

予測エンドポイントに対するアクセスは、LUIS 予測キーを使用して承認されます。

Entity

エンティティは、意図を達成または識別するために使用される情報を説明する発話内の単語です。 エンティティが複雑であり、モデルを使って特定の部分を識別できるようにする場合は、モデルをサブエンティティに分割できます。 たとえば、モデルで住所だけでなく、番地、市区町村、都道府県、郵便番号のサブエンティティも予測できます。 エンティティは、モデルの特徴としても使用できます。 LUIS アプリからの応答には、予測された意図とすべてのエンティティの両方が含まれます。

エンティティ抽出子

エンティティ抽出子は、単に抽出子と呼ばれることもあり、LUIS でエンティティの予測に使用される機械学習モデルの一種です。

エンティティ スキーマ

エンティティ スキーマは、サブエンティティを持つ機械学習エンティティに対して定義する構造です。 予測エンドポイントからは、スキーマで定義されているエンティティとサブエンティティのうち抽出されたものがすべて返されます。

エンティティのサブエンティティ

サブエンティティは、機械学習エンティティの子エンティティです。

非機械学習エンティティ

テキストのマッチングを使用してデータを抽出するエンティティ:

  • リスト エンティティ
  • 正規表現エンティティ

リスト エンティティ

リスト エンティティは、固定かつ限定された関連単語セットとそのシノニムを表します。 リスト エンティティは、機械学習エンティティとは異なり、完全一致です。

リスト エンティティの単語がリストに含まれている場合、エンティティは予測されます。 たとえば、"size" という名前のリスト エンティティがあり、リストに "small, medium, large" という単語がある場合、コンテキストに関係なく "small"、"medium"、または "large" という単語が使用されるすべての発話に対してサイズ エンティティが予測されます。

正規表現

正規表現エンティティは正規表現を表します。 正規表現エンティティは、機械学習エンティティとは異なり、完全一致です。

事前構築済みのエンティティ

事前構築済みエンティティについては、事前構築済みモデルのエントリを参照してください。

機能

機械学習の特徴とは、モデルで特定の概念を認識するために役立つ特性です。 これは LUIS に使用できるヒントですが、厳密な規則ではありません。

この用語は、 機械学習特徴 とも呼ばれます。

これらのヒントは、新しいデータを予測する方法を学習するためにラベルと共に使用されます。 LUIS は、フレーズ リストと他のモデルの使用の両方を特徴としてサポートしています。

必須の特徴

必須な特徴は、LUIS モデルの出力を制限する方法の 1 つです。 エンティティの特徴が必須とマークされている場合、機械学習モデルで何を予測するかに関係なく、そのエンティティを予測するには、その特徴が例に存在している必要があります。

メニュー注文ボットの数量エンティティで必須とマークした事前構築済みの数値の特徴がある例を考えてみましょう。 ボットで I want a bajillion large pizzas? が確認されると、出現するコンテキストに関係なく、bajillion は数量と予測されません。 バジリオンは有効な数値ではなく、事前構築済みのエンティティ数では予測されません。

Intent

意図は、ユーザーが実行しようとしているタスクまたはアクションを表します。 これは、フライトの予約や請求書の支払いなど、ユーザーの入力で表現される目的または目標です。 LUIS では、発話全体が意図として分類されますが、発話の一部はエンティティとして抽出されます。

ラベル付けの例

ラベル付け、またはマーキングは、正または負の例をモデルに関連付けるプロセスです。

意図のラベル付け

LUIS では、アプリ内の意図は相互に排他的です。 つまり、発話を意図に追加すると、その意図に対して "" の例と見なされ、他のすべての意図に対しては "" の例と見なされます。 否定的な例は、アプリの範囲外にある発話を表す "None" 意図と混同しないでください。

エンティティのラベル付け

LUIS では、エンティティを含む意図の例の発話に含まれる単語またはフレーズに、"" の例というラベル付けをします。 ラベル付けは、その発話に対して何を予測すべき意図を示しています。 ラベル付けされた発話は、意図のトレーニングに使用されます。

LUIS アプリ

アプリケーション (アプリ)」の定義を参照してください。

モデル

(機械学習された) モデルは、入力データに対して予測を行う関数です。 LUIS では、意図分類子とエンティティ抽出子を総称して "モデル" と呼び、トレーニング、公開、クエリの対象となるモデルのコレクションを "アプリ" と呼びます。

正規化された値

リスト エンティティに値を追加します。 これらの各値には、1 つ以上のシノニムのリストを含めることができます。 応答では、正規化された値のみが返されます。

オーバーフィット

オーバーフィットは、モデルが特定の例に固定され、うまく一般化できない場合に発生します。

Owner

各アプリに、そのアプリを作成した所有者が 1 人います。 所有者は、Azure portal でアプリケーションへのアクセス許可を管理します。

フレーズ リスト

フレーズ リストは、同じクラスに属し、同様に扱う必要がある値 (単語またはフレーズ) のグループを含む、特定の種類の機械学習特徴です (たとえば、都市や製品の名前)。

事前構築済みのモデル

事前構築済みのモデルは、意図、エンティティ、またはその両方のコレクションと、ラベル付けされた例です。 これらの一般的な事前構築済みのモデルをアプリに追加すると、アプリに必要なモデル開発作業を減らすことができます。

事前構築済みのドメイン

事前構築済みのドメインは、ホーム オートメーション (HomeAutomation)、レストランの予約 (RestaurantReservation) など、特定のドメイン用に構成された LUIS アプリです。 意図、発話、およびエンティティは、このドメインに対して構成されています。

事前構築済みのエンティティ

事前構成済みのエンティティは、数値、URL、電子メールなど、一般的な情報の種類のエンティティで、LUIS によって提供されます。 これらは、公開データに基づいて作成されます。 事前構築済みエンティティをスタンドアロン エンティティとして、または機能としてエンティティに追加することを選択できます。

事前構築済みの意図

事前構築済みの意図は、一般的な種類の情報に対して LUIS で提供され、独自のラベル付けされた発話例が付属している意図です。

予測

予測は、新しいデータ (ユーザーの発話) を取り込み、トレーニングされ公開されたアプリケーションをそのデータに適用して、検出された意図とエンティティを特定するという、Azure LUIS 予測サービスに対する REST 要求です。

予測キー

予測キーは、予測エンドポイントの使用を承認する、Azure で作成した LUIS サービスに関連付けられたキーです。

このキーはオーサリング キーではありません。 予測エンドポイント キーがある場合は、それをオーサリング キーの代わりに、すべてのエンドポイント要求に対して使用してください。 現在の予測キーは、LUIS Web サイトの Azure リソース ページの下部にあるエンドポイント URL 内に表示されます。 これは、subscription-key の名前/値ペアの値です。

予測リソース

LUIS 予測リソースは、Azure を通じて利用できる管理可能な項目です。 リソースは、Azure サービスの関連する予測に対するアクセスです。 リソースには予測が含まれています。

予測 リソースには、LUIS という Azure の "種類" があります。

予測スコア

スコアは 0 から 1 の数値であり、システムによって特定の入力発話が特定の意図に一致することの確度がどの程度と判断されているを示す尺度です。 1 に近いスコアは、システムが出力に対して非常に自信を持っていることを意味し、スコアが 0 に近いほど、システムは入力が特定の出力と一致しないことを確信していることを意味します。 中間のスコアは、システムでその判断を下す方法が非常に不確かであることを意味します。

たとえば、一部の顧客のテキストに食品の注文が含まれているかどうかを識別するために使用されるモデルがあるとします。 "1 杯のコーヒーを注文したい" のスコアは 1 (これが注文である確度が高いというシステムの判断)、"私のチームは昨夜ゲームに勝った" のスコアは 0 (これは注文では "ない" 確度が高いというシステムの判断) になる可能性があります。 また、"お茶を飲もう" のスコアは 0.5 (これが注文かどうか不明) になる可能性があります。

プログラム キー

オーサリング キーに名前が変更されました。

発行

公開とは、LUIS のアクティブ バージョンを、ステージングまたは運用エンドポイントのいずれかで使用できるようにすることです。

Quota

LUIS クォータとは、Azure サブスクリプション レベルの制限です。 LUIS クォータは、1 秒あたりの要求数 (HTTP 状態 429) と 1 か月の要求数合計 (HTTP 状態 403) の両方によって制限できます。

スキーマ

スキーマには、意図とエンティティがサブエンティティと共に含まれています。 スキーマは最初に計画され、その後、長期にわたって反復処理されます。 スキーマには、アプリの設定、特徴、発話の例は含まれていません。

感情分析

感情分析では、Language service によって得られる発話の正または負の値が提供されます。

音声認識の準備

音声認識の準備により、Speech Services を使用したシナリオで一般的に使用される話し言葉やフレーズの認識が向上します。 音声認識の準備対応アプリケーションの場合、LUIS のラベル付けされたすべての例は、その特定のアプリケーション用にカスタマイズされた音声モデルを作成することで音声認識の精度を向上させるために使用されます。 たとえば、チェス ゲームでは、ユーザーが「Move knight」(ナイトを動かして) と言った場合に、「Move night」(夜を動かして) と解釈されないようにします。 LUIS アプリには、"knight" (ナイト) がエンティティとしてラベル付けした例を含める必要があります。

スターター キー

初めて LUIS の使用を開始するときに使用する無料のキー。

シノニム

LUIS のリスト エンティティでは、それぞれシノニムのリストを持つ可能性がある正規化された値を作成できます。 たとえば、小、中、大、特大の正規化された値を持つサイズ エンティティを作成するとします。 次のように、各値のシノニムを作成できます。

正規化された値 シノニム
Small 小さな1、8オンス
Medium 通常、12 オンス
Large 大きい, 16 オンス
Xtra large 最大の 24 オンス

入力にシノニムのいずれかが表示されると、モデルはエンティティの正規化された値を返します。

テスト

LUIS アプリのテストとは、モデル予測を表示することを意味します。

タイムゾーン オフセット

エンドポイントには、timezoneOffset が含まれています。 これは、事前構築済みエンティティ datetimeV2 から追加または削除する必要がある数値 (分) です。 たとえば、"今何時ですか?" という発話の場合、返される datetimeV2 は、クライアント要求の現在時刻です。 クライアント要求がボットまたはボットのユーザーと同じではない他のアプリケーションから送信される場合は、ボットとユーザーの間のオフセットを渡す必要があります。

事前構築済み datetimeV2 エンティティのタイム ゾーンの変更」を参照してください。

トークン

トークンは、LUIS で認識できるテキストの最小単位です。 これは、言語によって若干異なります。

英語の場合、トークンは、文字と数字の連続するスパン (スペースや句読点を含まない) です。 スペースはトークンでは "ありません"。

フレーズ トークン数 説明
Dog 1 句読点やスペースを含まない 1 つの単語。
RMT33W 1 レコードのロケーター番号。 数字と文字が含まれる可能性がありますが、句読点はありません。
425-555-5555 5 電話番号。 各区切り記号は 1 つのトークンであるため、425-555-5555 は次のように 5 つのトークンになります。
425
-
555
-
5555
https://luis.ai 7 https
:
/
/
luis
.
ai

トレーニング

トレーニングは、前回のトレーニング以降に行われたアクティブなバージョンに対する変更を LUIS に教えるプロセスです。

トレーニング データ

トレーニング データは、モデルのトレーニングに必要な一連の情報です。 これには、スキーマ、ラベル付けされた発話、特徴、およびアプリケーション設定が含まれます。

トレーニング エラー

トレーニング エラーは、ラベルと一致しないトレーニング データの予測です。

発話

発話は、会話内の文を表す短いテキストであるユーザー入力です。 これは、"次の火曜日にシアトルへのチケットを 2 枚予約する" などの自然言語のフレーズです。 発話の例を追加してモデルをトレーニングし、モデルは実行時に新しい発話を予測します。

バージョン

LUIS のバージョンは、LUIS アプリ ID と公開されたエンドポイントに関連付けられた LUIS アプリケーションの特定のインスタンスです。 LUIS アプリごとに、少なくとも 1 つのバージョンがあります。