一般的な用語や概念に関する Language Understanding の用語集

[アーティクル]
01/19/2024

重要

LUIS は 2025 年 10 月 1 日に廃止され、2023 年 4 月 1 日から新しい LUIS リソースを作成できなくなります。継続的な製品サポートと多言語機能のベネフィットを得るために、LUIS アプリケーションを会話言語理解に移行することをお勧めします。

Language Understanding (LUIS) 用語集では、LUIS サービスの使用中に目にする可能性のある用語について説明します。

アクティブなバージョン

アクティブなバージョンとは、LUIS ポータルを使用してモデルに変更を加えたときに更新されるアプリのバージョンです。 LUIS ポータルで、アクティブなバージョンではないバージョンに変更を加える場合は、まずそのバージョンをアクティブとして設定する必要があります。

アクティブラーニング

アクティブラーニングは機械学習の手法であり、機械学習モデルを使用して、ラベル付けする有益な新しい例を識別するものです。 LUIS のアクティブラーニングとは、現在の予測が不明確なエンドポイントトラフィックから発話を追加してモデルを改善することを指します。発話のラベルを確認するには、[review endpoint utterances](エンドポイント発話の確認) を選択します。

アプリケーション (アプリ)

LUIS では、アプリケーションまたはアプリは、同じデータセットに基づいて構築された機械学習モデルのコレクションであり、特定のシナリオの意図とエンティティを予測するために連携します。各アプリケーションには、個別の予測エンドポイントがあります。

HR ボットを構築している場合は、"休暇の予定を立てる"、"特典について問い合わせる"、"個人情報を更新する" などの一連の意図と、1 つのアプリケーションにグループ化する各意図のエンティティが存在する場合があります。

Authoring

作成は、LUIS ポータルまたはオーサリング API のいずれかを使用して、LUIS アプリを作成、管理、およびデプロイする機能です。

オーサリングキー

オーサリングキーはアプリの作成に使用されます。運用レベルのエンドポイントクエリでは使用されません。詳細については、リソースの制限に関するページを参照してください。

作成リソース

LUIS の作成リソースは、Azure を通じて利用できる管理可能な項目です。リソースは、Azure サービスの関連する作成、トレーニング、および公開機能に対するアクセスです。リソースには、関連する Azure サービスにアクセスするために必要な認証、承認、セキュリティ情報が含まれています。

作成リソースには、LUIS-Authoring という Azure の "種類" があります。

バッチテスト

バッチテストは、ユーザー発話の一貫性のある既知のテストセットを使用して、現在の LUIS アプリのモデルを検証する機能です。バッチテストは、JSON 形式のファイルに定義されます。

F メジャー

バッチテストでは、テストの精度の測定値です。

検知漏れ (FN)

バッチテストでは、このデータポイントは、アプリが誤ってターゲットの意図/エンティティの不在を予測した発話を表します。

誤検知 (FP)

バッチテストでは、このデータポイントは、アプリが誤ってターゲットの意図/エンティティの存在を予測した発話を表します。

Precision

バッチテストでは、精度 (陽性予測値とも呼ばれます) は、取得された発話の中にある関連する発話の割合です。

動物バッチテストの例を使うと、予測された羊の数を動物の総数 (羊と羊以外の両方) で割ったものです。

再現率

バッチテストでは、再現率 (感度とも呼ばれます) は、LUIS が一般化を行う能力です。

動物バッチテストの例を使うと、予測された羊の数を使用可能な羊の総数で割ったものです。

真陰性 (TN)

真陰性とは、一致がないことがアプリで正しく予測される場合です。バッチテストでは、アプリがその意図またはエンティティでラベル付けされていない例の意図またはエンティティを予測すると、真の否定が発生します。

真陽性 (TP)

真陽性 (TP) 真陽性とは、一致があることがアプリで正しく予測される場合です。バッチテストでは、意図またはエンティティでラベル付けされた例について、アプリでその意図またはエンティティが予測される場合、真陽性が発生します。

分類子

分類子は、入力が適合するカテゴリまたはクラスを予測する機械学習モデルです。

分類子の例としては、意図があります。

コラボレーター

コラボレーターは、概念的には共同作成者と同じです。所有者が Azure ロールベースのアクセス制御 (Azure RBAC) で制御されていないアプリにコラボレーターのメールアドレスを追加すると、コラボレーターにアクセスが許可されます。引き続きコラボレーターを使用している場合は、LUIS アカウントを移行し、LUIS 作成リソースを使用して Azure RBAC で共同作成者を管理する必要があります。

Contributor

共同作成者はアプリの所有者ではありませんが、意図、エンティティ、発話を追加、編集、削除するための同じアクセス許可を持っています。共同作成者は、LUIS アプリへの Azure ロールベースのアクセス制御 (Azure RBAC) を提供します。

記述子

記述子は、以前は機械学習の特徴に使用されていた用語です。

Domain

LUIS のコンテキストでは、ドメインとはナレッジの一領域です。ドメインはシナリオに固有のものです。ドメインによって、ドメインのコンテキストで意味のある特定の言語と用語が使用されます。たとえば、音楽を再生するアプリケーションを構築している場合、アプリケーションには音楽に固有の用語と言語 ("歌、トラック、アルバム、歌詞、B 面、アーティスト" などの単語) があります。ドメインの例については、「事前構築済みのドメイン」を参照してください。

エンドポイント

作成エンドポイント

LUIS 作成エンドポイント URL は、アプリを作成、トレーニング、公開する場所です。エンドポイント URL には、公開されたアプリのリージョンまたはカスタムサブドメインとアプリ ID が含まれています。

プログラムでアプリを作成する方法の詳細については、開発者向けリファレンスを参照してください

予測エンドポイント

LUIS 予測エンドポイント URL は、LUIS アプリが作成および公開された後に、LUIS クエリを送信する場所です。エンドポイント URL には、公開されたアプリのリージョンまたはカスタムサブドメインとアプリ ID が含まれています。エンドポイントは、お使いのアプリの [Azure リソース] ページにあります。また、Get App Info API からエンドポイント URL を取得することもできます。

予測エンドポイントに対するアクセスは、LUIS 予測キーを使用して承認されます。

Entity

エンティティは、意図を達成または識別するために使用される情報を説明する発話内の単語です。エンティティが複雑であり、モデルを使って特定の部分を識別できるようにする場合は、モデルをサブエンティティに分割できます。たとえば、モデルで住所だけでなく、番地、市区町村、都道府県、郵便番号のサブエンティティも予測できます。エンティティは、モデルの特徴としても使用できます。 LUIS アプリからの応答には、予測された意図とすべてのエンティティの両方が含まれます。

エンティティ抽出子

エンティティ抽出子は、単に抽出子と呼ばれることもあり、LUIS でエンティティの予測に使用される機械学習モデルの一種です。

エンティティスキーマ

エンティティスキーマは、サブエンティティを持つ機械学習エンティティに対して定義する構造です。予測エンドポイントからは、スキーマで定義されているエンティティとサブエンティティのうち抽出されたものがすべて返されます。

エンティティのサブエンティティ

サブエンティティは、機械学習エンティティの子エンティティです。

非機械学習エンティティ

テキストのマッチングを使用してデータを抽出するエンティティ:

リストエンティティ
正規表現エンティティ

リストエンティティ

リストエンティティは、固定かつ限定された関連単語セットとそのシノニムを表します。リストエンティティは、機械学習エンティティとは異なり、完全一致です。

リストエンティティの単語がリストに含まれている場合、エンティティは予測されます。たとえば、"size" という名前のリストエンティティがあり、リストに "small, medium, large" という単語がある場合、コンテキストに関係なく "small"、"medium"、または "large" という単語が使用されるすべての発話に対してサイズエンティティが予測されます。

正規表現

正規表現エンティティは正規表現を表します。正規表現エンティティは、機械学習エンティティとは異なり、完全一致です。

事前構築済みのエンティティ

事前構築済みエンティティについては、事前構築済みモデルのエントリを参照してください。

機能

機械学習の特徴とは、モデルで特定の概念を認識するために役立つ特性です。これは LUIS に使用できるヒントですが、厳密な規則ではありません。

この用語は、 機械学習特徴 とも呼ばれます。

これらのヒントは、新しいデータを予測する方法を学習するためにラベルと共に使用されます。 LUIS は、フレーズリストと他のモデルの使用の両方を特徴としてサポートしています。

必須の特徴

必須な特徴は、LUIS モデルの出力を制限する方法の 1 つです。エンティティの特徴が必須とマークされている場合、機械学習モデルで何を予測するかに関係なく、そのエンティティを予測するには、その特徴が例に存在している必要があります。

メニュー注文ボットの数量エンティティで必須とマークした事前構築済みの数値の特徴がある例を考えてみましょう。ボットで I want a bajillion large pizzas? が確認されると、出現するコンテキストに関係なく、bajillion は数量と予測されません。バジリオンは有効な数値ではなく、事前構築済みのエンティティ数では予測されません。

Intent

意図は、ユーザーが実行しようとしているタスクまたはアクションを表します。これは、フライトの予約や請求書の支払いなど、ユーザーの入力で表現される目的または目標です。 LUIS では、発話全体が意図として分類されますが、発話の一部はエンティティとして抽出されます。

ラベル付けの例

ラベル付け、またはマーキングは、正または負の例をモデルに関連付けるプロセスです。

意図のラベル付け

LUIS では、アプリ内の意図は相互に排他的です。つまり、発話を意図に追加すると、その意図に対して "正" の例と見なされ、他のすべての意図に対しては "負" の例と見なされます。否定的な例は、アプリの範囲外にある発話を表す "None" 意図と混同しないでください。

エンティティのラベル付け

LUIS では、エンティティを含む意図の例の発話に含まれる単語またはフレーズに、"正" の例というラベル付けをします。ラベル付けは、その発話に対して何を予測すべき意図を示しています。ラベル付けされた発話は、意図のトレーニングに使用されます。

LUIS アプリ

「アプリケーション (アプリ)」の定義を参照してください。

モデル

(機械学習された) モデルは、入力データに対して予測を行う関数です。 LUIS では、意図分類子とエンティティ抽出子を総称して "モデル" と呼び、トレーニング、公開、クエリの対象となるモデルのコレクションを "アプリ" と呼びます。

正規化された値

リストエンティティに値を追加します。これらの各値には、1 つ以上のシノニムのリストを含めることができます。応答では、正規化された値のみが返されます。

オーバーフィット

オーバーフィットは、モデルが特定の例に固定され、うまく一般化できない場合に発生します。

Owner

各アプリに、そのアプリを作成した所有者が 1 人います。所有者は、Azure portal でアプリケーションへのアクセス許可を管理します。

フレーズリスト

フレーズリストは、同じクラスに属し、同様に扱う必要がある値 (単語またはフレーズ) のグループを含む、特定の種類の機械学習特徴です (たとえば、都市や製品の名前)。

事前構築済みのモデル

事前構築済みのモデルは、意図、エンティティ、またはその両方のコレクションと、ラベル付けされた例です。これらの一般的な事前構築済みのモデルをアプリに追加すると、アプリに必要なモデル開発作業を減らすことができます。

事前構築済みのドメイン

事前構築済みのドメインは、ホームオートメーション (HomeAutomation)、レストランの予約 (RestaurantReservation) など、特定のドメイン用に構成された LUIS アプリです。意図、発話、およびエンティティは、このドメインに対して構成されています。

事前構築済みのエンティティ

事前構成済みのエンティティは、数値、URL、電子メールなど、一般的な情報の種類のエンティティで、LUIS によって提供されます。これらは、公開データに基づいて作成されます。事前構築済みエンティティをスタンドアロンエンティティとして、または機能としてエンティティに追加することを選択できます。

事前構築済みの意図

事前構築済みの意図は、一般的な種類の情報に対して LUIS で提供され、独自のラベル付けされた発話例が付属している意図です。

予測

予測は、新しいデータ (ユーザーの発話) を取り込み、トレーニングされ公開されたアプリケーションをそのデータに適用して、検出された意図とエンティティを特定するという、Azure LUIS 予測サービスに対する REST 要求です。

予測キー

予測キーは、予測エンドポイントの使用を承認する、Azure で作成した LUIS サービスに関連付けられたキーです。

このキーはオーサリングキーではありません。予測エンドポイントキーがある場合は、それをオーサリングキーの代わりに、すべてのエンドポイント要求に対して使用してください。現在の予測キーは、LUIS Web サイトの Azure リソースページの下部にあるエンドポイント URL 内に表示されます。これは、subscription-key の名前/値ペアの値です。

予測リソース

LUIS 予測リソースは、Azure を通じて利用できる管理可能な項目です。リソースは、Azure サービスの関連する予測に対するアクセスです。リソースには予測が含まれています。

予測リソースには、LUIS という Azure の "種類" があります。

予測スコア

スコアは 0 から 1 の数値であり、システムによって特定の入力発話が特定の意図に一致することの確度がどの程度と判断されているを示す尺度です。 1 に近いスコアは、システムが出力に対して非常に自信を持っていることを意味し、スコアが 0 に近いほど、システムは入力が特定の出力と一致しないことを確信していることを意味します。中間のスコアは、システムでその判断を下す方法が非常に不確かであることを意味します。

たとえば、一部の顧客のテキストに食品の注文が含まれているかどうかを識別するために使用されるモデルがあるとします。 "1 杯のコーヒーを注文したい" のスコアは 1 (これが注文である確度が高いというシステムの判断)、"私のチームは昨夜ゲームに勝った" のスコアは 0 (これは注文では "ない" 確度が高いというシステムの判断) になる可能性があります。また、"お茶を飲もう" のスコアは 0.5 (これが注文かどうか不明) になる可能性があります。

プログラムキー

オーサリングキーに名前が変更されました。

発行

公開とは、LUIS のアクティブバージョンを、ステージングまたは運用エンドポイントのいずれかで使用できるようにすることです。

Quota

LUIS クォータとは、Azure サブスクリプションレベルの制限です。 LUIS クォータは、1 秒あたりの要求数 (HTTP 状態 429) と 1 か月の要求数合計 (HTTP 状態 403) の両方によって制限できます。

スキーマ

スキーマには、意図とエンティティがサブエンティティと共に含まれています。スキーマは最初に計画され、その後、長期にわたって反復処理されます。スキーマには、アプリの設定、特徴、発話の例は含まれていません。

感情分析

感情分析では、Language service によって得られる発話の正または負の値が提供されます。

音声認識の準備

音声認識の準備により、Speech Services を使用したシナリオで一般的に使用される話し言葉やフレーズの認識が向上します。音声認識の準備対応アプリケーションの場合、LUIS のラベル付けされたすべての例は、その特定のアプリケーション用にカスタマイズされた音声モデルを作成することで音声認識の精度を向上させるために使用されます。たとえば、チェスゲームでは、ユーザーが「Move knight」(ナイトを動かして) と言った場合に、「Move night」(夜を動かして) と解釈されないようにします。 LUIS アプリには、"knight" (ナイト) がエンティティとしてラベル付けした例を含める必要があります。

スターターキー

初めて LUIS の使用を開始するときに使用する無料のキー。

シノニム

LUIS のリストエンティティでは、それぞれシノニムのリストを持つ可能性がある正規化された値を作成できます。たとえば、小、中、大、特大の正規化された値を持つサイズエンティティを作成するとします。次のように、各値のシノニムを作成できます。

正規化された値	シノニム
Small	小さな1、8オンス
Medium	通常、12 オンス
Large	大きい, 16 オンス
Xtra large	最大の 24 オンス

入力にシノニムのいずれかが表示されると、モデルはエンティティの正規化された値を返します。

テスト

LUIS アプリのテストとは、モデル予測を表示することを意味します。

タイムゾーンオフセット

エンドポイントには、timezoneOffset が含まれています。これは、事前構築済みエンティティ datetimeV2 から追加または削除する必要がある数値 (分) です。たとえば、"今何時ですか?" という発話の場合、返される datetimeV2 は、クライアント要求の現在時刻です。クライアント要求がボットまたはボットのユーザーと同じではない他のアプリケーションから送信される場合は、ボットとユーザーの間のオフセットを渡す必要があります。

「事前構築済み datetimeV2 エンティティのタイムゾーンの変更」を参照してください。

トークン

トークンは、LUIS で認識できるテキストの最小単位です。これは、言語によって若干異なります。

英語の場合、トークンは、文字と数字の連続するスパン (スペースや句読点を含まない) です。スペースはトークンでは "ありません"。

フレーズ	トークン数	説明
`Dog`	1	句読点やスペースを含まない 1 つの単語。
`RMT33W`	1	レコードのロケーター番号。数字と文字が含まれる可能性がありますが、句読点はありません。
`425-555-5555`	5	電話番号。各区切り記号は 1 つのトークンであるため、`425-555-5555` は次のように 5 つのトークンになります。 `425` `-` `555` `-` `5555`
`https://luis.ai`	7	`https` `:` `/` `/` `luis` `.` `ai`

トレーニング

トレーニングは、前回のトレーニング以降に行われたアクティブなバージョンに対する変更を LUIS に教えるプロセスです。

トレーニングデータ

トレーニングデータは、モデルのトレーニングに必要な一連の情報です。これには、スキーマ、ラベル付けされた発話、特徴、およびアプリケーション設定が含まれます。

トレーニングエラー

トレーニングエラーは、ラベルと一致しないトレーニングデータの予測です。

発話

発話は、会話内の文を表す短いテキストであるユーザー入力です。これは、"次の火曜日にシアトルへのチケットを 2 枚予約する" などの自然言語のフレーズです。発話の例を追加してモデルをトレーニングし、モデルは実行時に新しい発話を予測します。

バージョン

LUIS のバージョンは、LUIS アプリ ID と公開されたエンドポイントに関連付けられた LUIS アプリケーションの特定のインスタンスです。 LUIS アプリごとに、少なくとも 1 つのバージョンがあります。

一般的な用語や概念に関する Language Understanding の用語集

アクティブなバージョン

アクティブ ラーニング

アプリケーション (アプリ)

Authoring

オーサリング キー

作成リソース

バッチ テスト

F メジャー

検知漏れ (FN)

誤検知 (FP)

Precision

再現率

真陰性 (TN)

真陽性 (TP)

分類子

コラボレーター

Contributor

記述子

Domain

エンドポイント

作成エンドポイント

予測エンドポイント

Entity

エンティティ抽出子

エンティティ スキーマ

エンティティのサブエンティティ

非機械学習エンティティ

リスト エンティティ

正規表現

事前構築済みのエンティティ

機能

必須の特徴

Intent

ラベル付けの例

意図のラベル付け

エンティティのラベル付け

LUIS アプリ

モデル

正規化された値

オーバーフィット

Owner

フレーズ リスト

事前構築済みのモデル

事前構築済みのドメイン

事前構築済みのエンティティ

事前構築済みの意図

予測

予測キー

予測リソース

予測スコア

プログラム キー

発行

Quota

スキーマ

感情分析

音声認識の準備

スターター キー

シノニム

テスト

タイムゾーン オフセット

トークン

トレーニング

トレーニング データ

トレーニング エラー

発話

バージョン

その他のリソース

アクティブラーニング

オーサリングキー

バッチテスト

エンティティスキーマ

リストエンティティ

フレーズリスト

プログラムキー

スターターキー

タイムゾーンオフセット

トレーニングデータ

トレーニングエラー