Azure AI マルチサービス リソースを Azure AI Search のスキルセットにアタッチする
Azure AI 検索でオプションの AI エンリッチメント パイプラインを構成すると、インデックスごとに 1 日あたり 20 トランザクションを上限として、少数のドキュメントを無料でエンリッチできます。 大規模で頻繁なワークロードの場合は、請求可能なAzure AI マルチサービス リソースをアタッチする必要があります。
マルチ サービス アカウントは、個々のサービスではなく、Azure AI サービスのコレクションを提供します。 アカウントには、関連付けられたリソース キーがあります。 このキーは Azure AI 検索スキルセットで指定され、Microsoft が次のサービスの使用に対して課金できるようにします。
- 画像分析、光学式文字認識 (OCR)、マルチモーダル テキストと画像の埋め込みのための Azure AI Vision。
- 言語検出、エンティティ認識、感情分析、およびキー フレーズ抽出のためのAzure AI 言語
- 音声テキスト変換およびテキスト読み上げのAzure AI 音声
- マシン テキスト翻訳のための Azure AI 翻訳
キーは接続ではなく、課金に使用されます。 接続でロールの割り当てやマネージド ID などの他のメカニズムを使用している場合でも、スキルセットにキーを指定する必要があります。
ヒント
Azure には、課金と予算を監視するためのインフラストラクチャが用意されています。 Azure AI サービスの監視の詳細については、「 Azure AI サービスのコストを計画および管理する」を参照してください。
Azure AI マルチサービス アカウントのリソース キーを取得する
Azure portal にサインインします。
検索サービスと同じリージョン で Azure AI マルチサービス リソースを作成します。
[リソース]>[キーとエンドポイント] ページからリソース キーを取得します。
スキルセットにリソース キーを追加する
Azure portal、REST API、または Azure SDK を使用して、スキルセットにキーを追加できます。
プロパティを未指定のままにすると、検索サービスでは、インデクサーが 1 日単位で利用できる無料のエンリッチメントの使用を試行します。 課金対象のスキルの実行は、インデクサーの呼び出しごとに 20 トランザクションで停止し、インデクサーの実行履歴に "タイムアウト" のメッセージが表示されます。
スキルセット定義にキーを追加します。
データ インポート ウィザードを使用する場合は、Azure AI アカウントを作成または選択します。 ウィザードによって、スキルセット定義にリソース キーが追加されます。
新規または既存のスキルセットの場合は、スキルセット定義でキーを指定します。
キーを削除します
エンリッチメントは課金対象の操作です。 Azure AI サービスを呼び出す必要がなくなった場合は、次の手順に従ってマルチサービス キーを削除し、外部リソースを使用できないようにします。 キーがないと、スキルセットは、インデクサーごとに 1 日あたり 20 個の無料トランザクションの既定の割り当てに戻ります。 課金対象のスキルの実行は、20 トランザクションで停止し、割り当てを使い切るとインデクサーの実行履歴に "タイムアウト" のメッセージが表示されます。
Azure portal にサインインします。
[検索管理] > [スキルセット] で、一覧からスキルセットを選択します。
"cognitiveServices"
を含むファイル内のセクションまでスクロールします。JSON からキー値を削除し、スキルセットを保存します。
キーの使用方法
キーベースの課金は、Azure AI サービス リソースへの API 呼び出しが、インデクサーごとに 1 日あたり 20 回を超えた場合に適用されます。 インデクサーをリセットして API 数をリセットできます。
キーは課金に使用されますが、エンリッチメント操作の接続には使用されません。 接続については、検索サービスは、同じ物理リージョンに配置されている Azure AI サービス リソースに内部ネットワーク経由で接続します。 Azure AI Search を提供するほとんどのリージョンでは、言語などの他の Azure AI サービスも提供されています。 両方のサービスがないリージョンで AI エンリッチメントを試行した場合、"Provided key is not a valid CognitiveServices type key for the region of your search service (指定されたキーは、検索サービスのリージョンに対して有効な CognitiveServices タイプのキーではありません)" というメッセージが表示されます。
現時点では、 組み込みのスキル の課金には、Azure AI Search から別の Azure AI サービスへのパブリック接続が必要です。 公衆ネットワークへのアクセスを無効にすると、課金ができなくなります。 パブリック ネットワークを無効にする必要がある場合は、 プライベート エンドポイント をサポートする Azure Functionを実装したカスタム Web API スキルを構成し、 同じ VNETに Azure AI サービス リソースを追加します。 この方法では、プライベート エンドポイントを使用して、カスタム スキルから直接 Azure AI サービス リソースを呼び出すことができます。
Note
一部の組み込みスキルは、非リージョンの Azure AI サービス (テキスト翻訳スキルなど) をベースとしています。 リージョン以外のスキルを使用すると、Azure AI Search リージョン以外のリージョンで要求が処理される可能性があります。 リージョン以外のサービスの詳細については、「リージョン別の Azure AI サービス製品 」ページを参照してください。
重要な要件の特別なケース
カスタム エンティティ検索 は、Azure AI サービスではなく Azure AI Search によって測定されますが、インデクサーあたりで 1 日あたり 20 を超えるトランザクションのロックを解除するには、Azure AI マルチサービス リソース キーが必要です。 このスキルの場合のみ、リソース キーによってトランザクション数のブロックが解除されますが、課金とは無関係です。
無料エンリッチメント
AI エンリッチメントでは、課金対象のエンリッチメントを少量無料で処理できるため、Azure AI マルチサービス リソースをアタッチしなくても短い演習を完了できます。 無料のエンリッチメントは、インデクサーごとに 1 日あたり 20 ドキュメントです。 演習を繰り返す場合は、インデクサーをリセットすることで、カウンターをリセットできます。
一部のエンリッチメントは常に無料です。
Azure AI サービスを呼び出さないユーティリティ スキル (つまり、 条件付き、 ドキュメント抽出、 Shaper、 テキストマージ、および テキスト分割スキル) は課金されません。
PDF ドキュメントやその他のアプリケーション ファイルからのテキスト抽出は、課金対象外です。 テキスト抽出はドキュメント解析中に発生します。テキスト抽出は AI エンリッチメントではありませんが、AI エンリッチメント中に発生するため、ここに記載します。
課金対象のエンリッチメント
AI エンリッチメント中、Azure AI Search は、Azure AI Vision、Translator、Azure AI Language に基づく 組み込みのスキル のために Azure AI サービス API を呼び出します。
Azure AI サービスへのバックエンド呼び出しを行う課金対象の組み込みスキルには、エンティティ リンク、エンティティ認識、画像分析、キー フレーズ抽出、言語検出、OCR、個人を特定できる情報 (PII) 検出、センチメント、テキスト翻訳があります。
画像抽出は、エンリッチメントの前にドキュメントが解読されたときに発生する Azure AI Search 操作です。 画像抽出は、Free レベルでの 1 日 20 回の無料抽出を除き、すべてのレベルで課金対象です。 画像抽出コストは、BLOB 内の画像ファイル、他のファイル (PDF および他のアプリ ファイル) に埋め込まれた画像、およびドキュメント抽出を使用して抽出された画像に適用されます。 画像抽出の価格については、Azure AI Search の 価格に関するページを参照してください。
ヒント
スキルセット処理のコストを削減するには、インクリメンタル エンリッチメントを有効にして、スキルセットに加えた変更の影響を受けないエンリッチメントをキャッシュして再利用します。 キャッシュには Azure Storage が必要です (価格を参照してください)。ただし、既存のエンリッチメントを再利用できる場合は、スキルセットの実行の累積コストが低くなります (特に画像の抽出と分析を使用するスキルセットの場合)。
例: コストの見積もり
Azure AI Search のインデックス作成に関連するコストを見積もるために、いくつかの数値を実行できるように、平均ドキュメントがどのように表示されるかを考え始めます。 たとえば、次のように概算することができます。
- 1000 PDF。
- それぞれ 6 ページ。
- 1 ページに 1 画像 (6000 画像)。
- 1 ページあたり 3,000 文字。
各 PDF のドキュメント解析、画像とテキストの抽出、画像の光学式文字認識 (OCR)、組織のエンティティ認識からなるパイプラインを想定します。
この記事に示されている価格は仮定上のものです。 これらは、見積もりプロセスを説明するために使用されています。 お客様のコストはこれより低い可能性があります。 トランザクションの実際の価格については、「Azure AI サービス価格」をご覧ください。
テキストと画像のコンテンツを含むドキュメント解読の場合、現在、テキスト抽出は無料です。 6,000 個の画像の場合、1,000 個の画像が抽出されるごとに 1 ドルと想定します。 このステップの場合、6.00 ドルのコストになります。
6,000 画像の英語での OCR については、OCR コグニティブ スキルでは最適なアルゴリズム (DescribeText) が使用されます。 1,000 個のイメージを分析するたびに $2.50 かかるとすると、この手順に対して $15.00 が課金されることになります。
エンティティの抽出では、1 ページごとに合計 3 個のテキスト レコードがあります。 各レコードは 1,000 文字です。 1 ページあたり 3 個のテキスト レコードに 6,000 ページを掛けると、18,000 個のテキスト レコードになります。 1,000 個のテキスト レコードごとに $2.00 かかるとすると、この手順のコストは $36.00 になります。
まとめると、示されたスキルセットでこの種類の PDF ドキュメントを 1,000 個取り込むには、約 $57.00 を支払うことなります。