セマンティックランク付けとは

5 分

セマンティックランク付けは、検索結果のランク付けを向上することを目的とした Azure AI 検索の機能です。セマンティックランク付けでは、言語理解を使用して元のクエリのコンテキストをより正確に一致させることで、検索結果のランク付けを向上させます。

BM25 ランキング関数

Azure AI 検索では、既定で BM25 順位付け関数を使用します。 BM25 ランキング関数は、検索語句がドキュメント内に出現する頻度に基づいて検索結果をランキングします。検索語句を頻繁に含むドキュメントが最も関連性があるとする BM25 ランキング関数では優れたランキング結果を得ることができることが多いですが、常にそうだとは限りません。 BM25 ランキングは、クエリのセマンティクスとの関連性は判別せず、言語理解を追加することによってランキングを改善できる場合があります。

セマンティックランク付け

セマンティックランク付けには、言語理解に基づいてクエリ結果のランク付けを向上させることと、結果にキャプションと回答を提供することでクエリへの応答を向上させるという 2 つの機能があります。

セマンティックランキングでは BM25 ランキングを使用し、元の BM25 ランキングと言語理解モデルを組み合わせて新しい関連性スコアを計算し、クエリのコンテキストと意味を抽出します。

セマンティックキャプションと回答

セマンティックキャプションと回答は、ランキングされた検索結果と共にユーザーが結果の理解を深めるために表示できる、追加の結果を提供します。

セマンティックキャプションは、ドキュメントから要約文を逐語的に抽出し、要約文の中で最も関連性の高いテキストを強調表示します。

セマンティック回答は、質問に対する回答を提供するセマンティックランク付けのオプションの追加機能です。検索クエリが質問のように見え、関連する回答と思われるテキストが検索結果に含まれる場合は、セマンティック回答が返されます。

セマンティックランク付けのしくみ

セマンティックランキングは、BM25 のランキングの結果から上位 50 の結果を取得します。その結果は、セマンティック構成で定義されている複数のフィールドに分割されます。このフィールドはテキスト文字列に変換され、256 個の一意のトークンにトリミングされます。トークンは、ドキュメント内の単語とほぼ同じです。

文字列が準備されると、機械読解モデルに渡され、クエリに最も一致するフレーズと文が検索されます。この要約句の結果がセマンティックキャプションであり、必要に応じてセマンティック回答になります。

セマンティックキャプションは、キャプションのセマンティックの関連性に基づいてランキングされるようになりました。その後、結果は関連性の降順で返されます。

セマンティックランキングの機能

AI 検索の機能の概要については、次の動画をご覧ください。

セマンティックランキングの利点

セマンティックランキングには、従来の検索結果より、主に次の 2 つの利点があります。

セマンティックランキングでは、結果を元のクエリのセマンティクスとより厳密に一致するようにランキングできます。これにより、最も役立つドキュメントが検索結果の上位に表示される可能性が高くなります。
セマンティックランキングでは、検索結果ページにキャプションとしてレンダリングし質問に対する回答を提供する、文字列を結果から検索できます。

セマンティックランク付けの制限

セマンティックランク付けは、BM25 順位付け関数から返された結果に適用されます。セマンティックランク付けでは、BM25 順位付け関数によって提供された結果を再ランク付けできますが、BM25 順位付け関数によって返されなかった追加のドキュメントは提供されません。

セマンティックランク付けでは、BM25 順位付け関数の上位 50 位の結果が使われます。 50 を超える結果が返された場合、上位 50 件の結果のみが考慮されます。

セマンティックランク付けの価格

セマンティックランク付けクエリは 1 か月あたり最大 1,000 件まで無料で使用できます。

クエリが 1 か月に 1,000 を超える場合は、Standard 価格を選択する必要があります。 Standard 価格のコストは、検索の量、検索の種類、および検索のリージョンに基づいています。

セマンティックランク付けの価格の詳細については、「Azure AI 検索の価格」を参照してください

続行

セマンティック ランク付けとは

BM25 ランキング関数

セマンティック ランク付け

セマンティック キャプションと回答

セマンティック ランク付けのしくみ

セマンティック ランキングの機能

セマンティック ランキングの利点

セマンティック ランク付けの制限

セマンティック ランク付けの価格

フィードバック