インデクサーを使用してインデックスを作成する

完了

Azure Storage でドキュメントのインデックスを作成するには、元のファイルの種類から JSON にエクスポートする必要があります。 任意の形式のデータを JSON にエクスポートしてインデックスに読み込むために、ここではインデクサーを使用します。

検索ドキュメントを作成するには、アプリケーションのコードで JSON ドキュメントを生成するか、Azure のインデクサーを使用して受信ドキュメントを JSON にエクスポートします。

Azure AI 検索では、次の 2 つの方法で JSON ドキュメントを作成し、インデックスに読み込むことができます。

  • プッシュ方法: JSON データは、REST API または .NET SDK によって、検索インデックスにプッシュされます。 データのプッシュは、データ ソースの種類、場所、または実行の頻度に制限がないため、最も柔軟性があります。

  • プル方法: Search Service インデクサーを使うと、一般的な Azure データ ソースからデータをプルし、データがまだ JSON 形式になっていない場合は、その形式にエクスポートできます。

プル方法を使用してインデクサーでデータを読み込む

Azure AI 検索のインデクサーはクローラーであり、外部の Azure データ ソースから検索可能なテキストとメタデータを抽出し、ソース データとインデックスの間のフィールド間マッピングを使用して検索インデックスを設定します。 インデクサーを使用すると、サービスによってデータがプルされ、ユーザーがインデックスにデータを追加するコードを記述する必要がないため、"プル モデル" アプローチと呼ばれることがあります。 インデクサーでは、ソース フィールドがインデックス内の対応するフィールドにマップされます。

データのインポートの監視と検証

Search サービスの概要ページには、Search サービスの正常性をすばやく確認できるダッシュボードがあります。 このダッシュボードでは、Search サービス内にあるドキュメントの数、使用されたインデックスの数、使用されているストレージの量を確認することができます。

インデックスに新しいドキュメントを読み込むときは、インデックスに関連付けられているインデクサーをクリックして、進行状況を監視できます。 ドキュメントがインデックスに読み込まれるのに伴い、ドキュメント数が増えます。 場合によっては、ポータル ページに最新のドキュメント数が表示されるまでに数分かかることがあります。 インデックスのクエリの準備ができたら、Search エクスプローラーを使って結果を検証できます。 最初のドキュメントが正常に読み込まれた時点で、インデックスの準備はできています。

インデクサーでは、新規のドキュメントまたは更新されたドキュメントのみがインポートされるため、インデックスが作成されたドキュメントの数が 0 と表示されるのは普通のことです。

Search エクスプローラーでクイック検索を実行してインデックスの内容をチェックし、予想される検索結果を取得していることを確認できます。 このツールをポータルで使用できるようにすると、JSON ドキュメントとして返される結果をレビューすることで、インデックスを簡単にチェックできるようになります。

インデックスの変更

フィールドの定義を変更する必要がある場合は、インデックスを削除して作り直す必要があります。 新しいフィールドの追加はサポートされていますが、既存のドキュメントはすべて null 値になります。 設計を反復するには、コードベースの方法を使う方が速いことがわかるでしょう。ポータルで作業する場合は、インデックスを削除して再作成し、スキーマの詳細を手動で入力する必要があります。

ユーザーに影響を与えることなくインデックスを更新する方法は、別の名前で新しいインデックスを作成することです。 同じインデクサーとデータ ソースを使用できます。 データをインポートした後、新しいインデックスを使用するようにアプリを切り替えることができます。