セマンティック ランク付けとは

完了

セマンティック ランク付けは、検索結果のランク付けを向上することを目的とした Azure AI 検索の機能です。 セマンティック ランク付けでは、言語理解を使用して元のクエリのコンテキストをより正確に一致させることで、検索結果のランク付けを向上させます。

BM25 ランキング関数

Azure AI 検索では、既定で BM25 順位付け関数を使用します。 BM25 ランキング関数は、検索語句がドキュメント内に出現する頻度に基づいて検索結果をランキングします。 検索語句を頻繁に含むドキュメントが最も関連性があるとする BM25 ランキング関数では優れたランキング結果を得ることができることが多いですが、常にそうだとは限りません。 BM25 ランキングは、クエリのセマンティクスとの関連性は判別せず、言語理解を追加することによってランキングを改善できる場合があります。

セマンティック ランク付け

セマンティック ランク付けには、言語理解に基づいてクエリ結果のランク付けを向上させることと、結果にキャプションと回答を提供することでクエリへの応答を向上させるという 2 つの機能があります。

セマンティック ランキングでは BM25 ランキングを使用し、元の BM25 ランキングと言語理解モデルを組み合わせて新しい関連性スコアを計算し、クエリのコンテキストと意味を抽出します。

セマンティック キャプションと回答

セマンティック キャプションと回答は、ランキングされた検索結果と共にユーザーが結果の理解を深めるために表示できる、追加の結果を提供します。

セマンティック キャプションは、ドキュメントから要約文を逐語的に抽出し、要約文の中で最も関連性の高いテキストを強調表示します。

セマンティック回答は、質問に対する回答を提供するセマンティック ランク付けのオプションの追加機能です。 検索クエリが質問のように見え、関連する回答と思われるテキストが検索結果に含まれる場合は、セマンティック回答が返されます。

セマンティック ランク付けのしくみ

セマンティック ランキングは、BM25 のランキングの結果から上位 50 の結果を取得します。 その結果は、セマンティック構成で定義されている複数のフィールドに分割されます。 このフィールドはテキスト文字列に変換され、256 個の一意のトークンにトリミングされます。 トークンは、ドキュメント内の単語とほぼ同じです。

文字列が準備されると、機械読解モデルに渡され、クエリに最も一致するフレーズと文が検索されます。 この要約句の結果がセマンティック キャプションであり、必要に応じてセマンティック回答になります。

セマンティック キャプションは、キャプションのセマンティックの関連性に基づいてランキングされるようになりました。 その後、結果は関連性の降順で返されます。

セマンティック ランキングの機能

AI 検索の機能の概要については、次の動画をご覧ください。

セマンティック ランキングの利点

セマンティック ランキングには、従来の検索結果より、主に次の 2 つの利点があります。

  • セマンティック ランキングでは、結果を元のクエリのセマンティクスとより厳密に一致するようにランキングできます。 これにより、最も役立つドキュメントが検索結果の上位に表示される可能性が高くなります。
  • セマンティック ランキングでは、検索結果ページにキャプションとしてレンダリングし質問に対する回答を提供する、文字列を結果から検索できます。

セマンティック ランク付けの制限

セマンティック ランク付けは、BM25 順位付け関数から返された結果に適用されます。 セマンティック ランク付けでは、BM25 順位付け関数によって提供された結果を再ランク付けできますが、BM25 順位付け関数によって返されなかった追加のドキュメントは提供されません。

セマンティック ランク付けでは、BM25 順位付け関数の上位 50 位の結果が使われます。 50 を超える結果が返された場合、上位 50 件の結果のみが考慮されます。

セマンティック ランク付けの価格

セマンティック ランク付けクエリは 1 か月あたり最大 1,000 件まで無料で使用できます。

クエリが 1 か月に 1,000 を超える場合は、Standard 価格を選択する必要があります。 Standard 価格のコストは、検索の量、検索の種類、および検索のリージョンに基づいています。

セマンティック ランク付けの価格の詳細については、「Azure AI 検索の価格」を参照してください