この記事では、固定コストや変動コストなど、Azure AI Search の課金方法について説明し、コスト管理のガイダンスを提供します。
検索サービスを作成する前に、 Azure 料金計算ツール を使用して、計画された 容量 と機能に基づいてコストを見積もります。 もう 1 つのリソースは、予想されるインデックス サイズ、インデックス作成のスループット、インデックス作成のコストをモデル化する容量計画ワークシートです。
検索ワークロードが進化するにつれて、デプロイと運用の両方でコストを最小限に抑えるためのヒントに従ってください。 組み込みのメトリックを使用してクエリ要求を監視したり 、Cost Management を使用して予算、アラート、データエクスポートを作成したりすることもできます。
注
容量の大きいパーティションは、2024 年 4 月と 5 月以降に作成されたサービスで同じ課金レートで利用できます。 パーティション サイズのアップグレードの詳細については、「サービスの 制限」を参照してください。
課金モデルを確認する
Azure AI Search には、固定課金と従量課金制の両方があります。 検索サービスが存在する限り固定料金を支払い、Premium 機能は使用量に応じて課金されます。
Azure AI Search のコストは、Azure の請求書の月額料金の一部にすぎません。 この記事では Azure AI Search のコストの計画と管理に重点を置いていますが、Microsoft 以外のサービスを含め、Azure サブスクリプションで使用されているすべての Azure サービスとリソースに対して課金されます。
基本サービスに対する課金方法
検索リソースを作成または使用すると、必要最小限のレプリカとパーティションの組み合わせ (R × P) が 価格レベルの日割り時間単価で課金されます。 検索単位の増減に応じて、コストも増加します。 課金モデルの詳細と例については、「 課金レート」を参照してください。
Premium 機能に対する課金方法
Premium 機能は、検索サービスの基本コストに加えて課金されます。 次の表に、Premium 機能とその課金単位を示します。 これらの機能はすべて省略可能であるため、使用しない場合は料金は発生しません。
特徴 | 課金単位 |
---|---|
画像抽出 (AI エンリッチメント) 1 | 1,000 画像あたり。 価格に関するページを参照してください。 |
カスタム エンティティ参照スキル (AI エンリッチメント) | 1,000 テキスト レコードあたり。 価格に関するページ |
組み込みスキルまたはカスタム スキル (AI エンリッチメント) 2 | トランザクションの数。 モデル プロバイダー (Azure AI サービス、Azure OpenAI、または Azure AI Foundry) の料金で課金されます。 |
Vectorizers2 | ベクター化操作の数。 モデル プロバイダー (Azure AI Vision、Azure OpenAI、または Azure AI Foundry) の料金で課金されます。 |
セマンティック ランカー | queryType=semantic のクエリの数。 段階的な料金で課金されます。 価格に関するページを参照してください。 |
共有プライベート リンク | 共有プライベート リンクが存在し、使用されている限り、帯域幅に対して課金されます。 |
1 インデクサー パイプライン内のファイルから抽出されたイメージを参照します。 テキストの抽出は無料です。 イメージ抽出は、indexAction
パラメーターを有効にした場合、またはドキュメント抽出スキルを呼び出すときに課金されます。
これらのサービスの請求書には、Azure OpenAI モデルと Azure AI Foundry モデルの 2 つの料金が表示されます。
それ以外の課金方法
構成と使用状況によっては、次の料金が適用される場合があります。
データ トラフィックでは、ネットワーク コストが発生する可能性があります。 帯域幅の 価格を参照してください。
ナレッジ ストア、デバッグ セッション、エンリッチメント キャッシュなど、いくつかの Premium 機能は Azure Storage に依存し、ストレージ コストが発生します。 これらの機能の料金は、Azure Storage の請求書に表示されます。
機密コンテンツの二重暗号化を提供するカスタマー マネージド キーには、課金対象の Azure Key Vault が必要です。
スキルセットには、 課金対象の組み込みスキル、非ビルドの組み込みユーティリティ スキル、およびカスタム スキルを含めることができます。 課金対象でないユーティリティ スキルには、条件付き、シェ―パー、テキスト結合、テキスト分割が含まれます。 API キーの要件や 20 ドキュメントの制限はありません。
カスタム スキルは、自分が提供する機能です。 カスタム スキルは、他の課金対象サービスを呼び出す場合にのみ課金されます。 API キーの要件や 20 ドキュメントの制限はありません。
注
取り込まれたフルテキスト クエリまたはベクター クエリ、クエリ応答、またはドキュメントの数に対して課金されることはありません。 ただし、 サービスの制限は 各価格レベルに適用されます。
コストの見積もりと計画
Azure 料金計算ツールを使用して、Azure AI Search のベースライン コストを見積もります。 サービスの作成時に、[価格レベルの選択] ページで推定コストと レベル の比較を確認することもできます。
初期テストでは、容量計画ワークシートを作成することをお勧めします。 このワークシートは、インデックスとソースの比率、およびエンリッチメントまたはベクターの特徴が容量とコストの両方に及ぼす影響を理解するのに役立ちます。
容量計画ワークシートを作成するには:
データの小さなサンプル (1 ~ 5%) のインデックスを作成します。 使用する予定の OCR、エンリッチメント、または埋め込みスキルを含めます。
インデックス サイズ、インデックス作成のスループット、インデックス作成のコストを測定します。
結果を推定して、データの完全な要件を見積もります。
コストを最小限に抑える
Azure AI Search ソリューションのコストを最小限に抑えるには、次の戦略を使用します。
デプロイと構成
パーティションあたりのストレージ数が多いリージョンに検索サービスを作成します。
帯域幅の料金を最小限に抑えたり排除したりするために、関連するすべての Azure リソースを同じリージョン (または可能な限り少数のリージョン) に作成します。
ニーズに合った最も軽量な 価格レベル を選択します。 Basic と S1 では、最新の API へのフル アクセスが SU ごとに最低時間単位で提供されます。
フロントエンド アプリケーションに Azure Web Apps を使用して、要求と応答をデータ センターの境界内に保持します。
スケーリング
インデックス サイズまたはインジェスト スループットに必要な場合にのみ、パーティションを追加します。
レプリカを追加 するのは、1 秒あたりのクエリ数が増える場合、複雑なクエリによってサービスが調整されている場合、または高可用性が必要な場合のみです。
インデックス作成などのリソースを集中的に使用する操作に対してスケールアップし、通常のクエリ ワークロードに対して下方に再調整します。
予測可能なワークロード パターンのスケーリングを自動化するコードを記述します。
容量と価格は線形でないことを覚えておいてください。 容量を 2 倍にすると、同じレベルのコストが 2 倍以上になります。 同様の価格でパフォーマンスを向上させるには、 より高いレベルに切り替えることを検討してください。
インデックス作成とエンリッチメント
増分インデックス作成を使用して、新しいデータまたは変更されたデータのみを処理します。
エンリッチメント キャッシュとナレッジ ストアを使用して、以前にエンリッチされたコンテンツを再利用します。 キャッシュではストレージ料金が発生しますが、 AI エンリッチメントの累積コストが削減されます。
ベクター ペイロードをコンパクトに保ちます。 ベクター検索については、 ベクター圧縮のベスト プラクティスを参照してください。
コストを監視する
サービス レベルでは、1 秒あたりのクエリ (QPS)、検索待ち時間、調整されたクエリ、インデックス サイズの 組み込みメトリックを監視 できます。 その後、QPS、待機時間、コスト データをオーバーレイする Azure Monitor ダッシュボードを作成 して、レプリカを追加または削除するタイミングを決定できます。
Cost Management には、サブスクリプションまたはリソース グループ レベルで、 コスト を追跡、分析、および制御するためのツールが用意されています。 Cost Management を使用すると、次のことができます。
使用制限に対する進捗状況を定義して追跡する予算を作成します。 より詳細な監視を行う場合は、特定の Azure リソースまたはサービスの フィルター を使用して予算をカスタマイズします。 フィルターを使用すると、余分なコストが発生するリソースが誤って作成されるのを防ぐことができます。
支出の異常や過剰なリスクについて関係者に自動的に通知するアラートを作成します。 アラートは、予算とコストのしきい値と比較した支出に基づきます。 予算とアラートの両方がサブスクリプションとリソース グループに対して作成されるため、全体的なコストを監視するのに役立ちます。
コスト データ をストレージ アカウントにエクスポートします。 これは、ユーザーや他のユーザーがより多くのコスト分析を実行する必要がある場合に役立ちます。 たとえば、財務チームは、Excel や Power BI を使用してデータを分析できます。 日単位、週単位、または月単位のスケジュールでコストをエクスポートし、カスタムの日付範囲を設定することができます。 コスト データのエクスポートは、コスト データセットを取得するための推奨される方法です。
よく寄せられる質問
検索サービスを一時的にシャットダウンしてコストを節約することはできますか?
検索は継続的なサービスとして実行されます。 専用リソースは常に運用可能であり、サービスの有効期間中は排他的に使用するために割り当てられます。 課金を完全に停止するには、サービスを削除する必要があります。 サービスの削除は永続的なものであり、関連付けられているデータも削除されます。
既存の検索サービスの課金レート (レベル) を変更できますか?
既存のサービスは、Basic レベルと Standard レベル (S1、S2、S3) レベルを切り替えることができます。 現時点では、Basic から S1 に移行するなど、下位レベルから上位レベルにのみ切り替えることができます。 詳細については、「 価格レベルを変更する」を参照してください。