次の質問と回答のペア一覧は、カスタムの質問応答で作成するときのベスト プラクティスを強調するプロジェクトを表すために使用されます。
Question | Answer |
---|---|
車を買いたい。 | 車の購入には 3 つのオプションがあります。 |
ソフトウェア ライセンスを購入したい。 | ソフトウェア ライセンスはオンラインで無料で取得できます。 |
WPA へのアクセス方法。 | WPA には、会社のポータルからアクセスできます。 |
Microsoft の株式の価格はいくらですか? | $200 です。 |
Microsoft サービスを購入するにはどうすればよいですか? | Microsoft サービスはオンラインで購入できます。 |
車を売りたい。 | 車の写真と書類を送信してください。 |
ID カードを取得するにはどうすればよいですか? | ID カードを取得するには、会社のポータル経由で申請します。 |
WPA はどのように使用しますか? | WPA は、付属のマニュアルを使用すると簡単に使用できます。 |
WPA のユーティリティは何ですか? | WPA は、会社のリソースにアクセスするための安全な方法を提供します。 |
QnA に代わりの質問を追加する必要がある場合
カスタム質問応答には、プロジェクト内の質問に意味的に似たユーザー クエリを処理するトランスフォーマー ベースのランカーが採用されています。 たとえば、次の質問と回答のペアについて考えてみます。
質問: "Microsoft 株式の価格はいくらですか?"
回答: "$200 です"。
サービスは、次のような意味的に類似したクエリに対して予期される応答を返すことができます。
"Microsoft の株式はどのくらいの価値がありますか?"
"Microsoft の株価はどれくらいですか?"
"Microsoft の株はいくらですか?"
"Microsoft の株式の市場価値はいくらですか?"
"Microsoft の株の市場価値はどれくらいですか?"
ただし、システムが正しい応答を返す信頼度スコアは、入力クエリによって、また、元の質問回答ペアとの違いによって異なることにご注意ください。
お客様が代わりの質問を追加する必要がある特定のシナリオがあります。 プロジェクト内に存在しているにもかかわらずクエリが正しい回答を返さない場合は、そのクエリを代わりの質問として目的の質問と回答のペアに追加することをお勧めします。
代わりの質問の最適な数は、QnA あたり何個ですか?
ユーザーは、シナリオに応じて最大 10 個の代わりの質問を追加できます。 最初の 10 個を超えた後の代わりの質問は、コア ランカーでは考慮されません。 ただし、これらは他の処理レイヤーで評価され、全体的な出力が向上します。 代わりの質問はすべて、完全一致を探す前処理の手順で考慮されます。
カスタム質問応答における意味的な解釈を通して、同様の代わりの質問を処理できます。
質問が 10 個を超えると、費用対効果は減少し始めます。 10 個を超える代わりの質問を追加する場合でも、最初の 10 個の質問を可能な限り意味的に異なるものにしてださい。そうすることで、回答に対するすべての意図が、これらの 10 個の質問によって取得されます。 上記のプロジェクトの QNA #1 では、"車を買うにはどうすればよいですか?"、"車を買いたい" などの代わりの質問を追加する必要はありません。 一方で、"車を購入する方法"、"自動車購入のオプションは何ですか?" などの代わりの質問を追加することで利便性を高めることができます。
プロジェクトに同意語を追加する場合
カスタム質問応答は、サービス全体のプロジェクト間で同意語が共有される QnA Maker とは異なり、プロジェクト レベルで同意語を使用する柔軟性を備えています。
関連性を高めたい場合、お客様は、エンド ユーザーが同じ意味で使用すると想定される頭字語の一覧を指定する必要があります。 たとえば、許容される頭字語の一覧を次に示します。
MSFT – Microsoft
ID – 識別
ETA – 到着予定時刻
頭字語とは別に、特定のドメインのコンテキストで類似していると思われる単語が、汎用的な言語モデルでは類似と見なされない場合には、それらをシノニムとして追加することをお勧めします。 たとえば、モデル X の自動車を生産している自動車会社が "車のオーディオが故障している" などのクエリを受け取り、プロジェクトに "自動車 X のオーディオの修理" に関する質問がある場合は、同意語として "X" と "自動車" を追加する必要があります。
トランスフォーマー ベースのモデルでは、一般的なシノニムのほとんどのケースが既に処理されています。購入 - 買う、販売 - アクション、価格 - 価値 などです。 たとえば、次の質問と回答のペアを考えてみます。Q: "Microsoft の株式の価格はいくらですか?" A: "$200 です"。
"Microsoft 株式価値"、"Microsoft 株価、"Microsoft 株式の価値"、"Microsoft 株の価値"、"株式価値" などのユーザー クエリを受け取った場合、これらのクエリに、もともとナレッジ ベースには存在しない株、価格、価値などの単語が含まれていても、正しい回答を得ることができます。
大文字と小文字の処理方法
カスタム質問応答は、大文字と小文字を区別しますが、それを無視すべき場合を理解できる十分なインテリジェンスを備えています。 大文字と小文字の区別が間違っていることによる、認識できるほどの違いは生じません。
複数ターンの質問に対して QnA の優先順位を決定する方法
ナレッジ ベースに階層リレーションシップ (手動または抽出による追加) が含まれていて、前の応答が他の QnA に関連する回答だった場合、次のクエリについては、子の QnA 、兄弟の QnA、孫の QnA のすべてを、この順序で少し優先します。 [カスタム質問応答 API] (/rest/api/cognitiveservices/questionanswering/question-answering/get-answers) では、クエリとともに、最後の最も多い回答を示すプロパティ "previousQnAId" を備える "context" オブジェクトを想定しています。 この直前の QnA ID に基づいて、関連するすべての QnA がブーストされます。
アクセントの処理方法
すべての主要なヨーロッパ言語について、アクセントがサポートされています。 クエリのアクセントが正しくない場合、信頼度スコアは若干異なる場合がありますが、サービスは関連する回答を返し、あいまい検索を利用して軽微なエラーに対処します。
ユーザー クエリでの句読点の処理方法
優先度付けスタックへの送信前、ユーザー クエリの句読点は無視されます。 関連性スコアに影響を与えないことが理想的です。 無視される句読点は、,?:;"'(){}[]-+。./!*؟ です。