Azure AI Foundry ポータルのモデルカタログは、生成 AI アプリケーションを構築するための幅広いモデルを検索して使用するためのハブです。 モデルが推論要求を受け取れるようにするには、モデルをデプロイする必要があります。 Azure AI Foundry には、ニーズとモデルの要件に応じて、モデルの包括的なデプロイ オプションスイートが用意されています。
モデルのデプロイ
デプロイ オプションは、モデルオファリングによって異なります。
- Azure AI Foundry モデルの Azure OpenAI: 柔軟な課金オプションを備えた Azure のエンタープライズ機能を備えた最新の OpenAI モデル。
- 標準デプロイ: これらのモデルでは、サブスクリプションからのコンピューティング クォータは必要なく、トークン ごとにサーバーレスの支払いプランで課金されます。
- オープン モデルとカスタム モデル: モデル カタログでは、オープン アクセスのモデルを含め、モダリティ全体でさまざまなモデルにアクセスできます。 マネージド インフラストラクチャ、仮想マシン、容量管理用の多数のインスタンスを使用して、独自のサブスクリプションでオープン モデルをホストできます。
Azure AI Foundry には、次の 4 つの異なるデプロイ オプションが用意されています。
名前 | Azure OpenAI | Azure AI Foundry モデル | 標準の展開 | マネージド コンピューティング |
---|---|---|---|---|
デプロイできるモデルはどれですか? | Azure OpenAI のモデル | Azure OpenAI モデルと標準デプロイ | 標準デプロイ | オープン モデルとカスタム モデル |
デプロイ リソース | Azure OpenAI リソース | Azure AI サービス リソース | AI プロジェクト リソース | AI プロジェクト リソース |
ハブまたはプロジェクトが必要 | いいえ | いいえ | イエス | イエス |
データ処理オプション | リージョナル データゾーン グローバル |
グローバル | リージョン | リージョン |
プライベート ネットワーク | イエス | イエス | イエス | イエス |
コンテンツ フィルター | イエス | イエス | イエス | いいえ |
カスタム コンテンツのフィルター処理 | イエス | イエス | いいえ | いいえ |
キーレス認証 | イエス | イエス | いいえ | いいえ |
最適なタイミング | OpenAI モデルのみを使用することを計画している | OpenAI を含む Azure AI カタログのフラッグシップ モデルを利用する予定です。 | 特定のプロバイダー (OpenAI を除く) の 1 つのモデルを使用する予定です。 | オープン モデルを使用する予定であり、使用できるコンピューティング クォータがサブスクリプションに十分に残っている場合。 |
課金情報ベース | トークン使用量と プロビジョニング済みスループット ユニット | トークンの使用法 | トークンの使用法1 | コンピューティング コア時間2 |
デプロイの手順 | Azure OpenAI にデプロイする | Foundry モデルへのデプロイ | 標準デプロイメントへの展開 | マネージド コンピューティングにデプロイする |
1 最小エンドポイント インフラストラクチャは 1 分単位で課金されます。 標準デプロイでモデルをホストするインフラストラクチャには課金されません。 エンドポイントを削除したら、それ以上の料金は発生しません。
2 課金は、製品層と、作成時以降にデプロイで使用されたインスタンスの数に応じて分単位で行われます。 エンドポイントを削除したら、それ以上の料金は発生しません。
ヒント
コストを追跡する方法の詳細については、「Azure Marketplace を通じて提供されるモデルのコストを監視する」を参照してください。
デプロイ オプションはどのような考えで選択すればよいですか?
Azure AI Foundry では、さまざまなデプロイ オプションを調べて、ビジネスと技術的なニーズに最適なオプションを選択することをお勧めします。 一般に、次の方法を使用してデプロイ オプションを選択することを検討してください。
最も大きなスコープを持つオプションである Foundry モデルから始めます。 このオプションを使用すると、何かを変更するたびにアーキテクチャを再構築しなくても、アプリケーションで反復処理とプロトタイプの作成を高速化できます。 Azure AI Foundry ハブまたはプロジェクトを使用している場合は、 Foundry Models 機能を有効にしてこのオプションを有効にします。
特定のモデルを使用する場合:
Azure OpenAI モデルに関心がある場合は、Foundry モデルで Azure OpenAI を使用します。 このオプションは、Azure OpenAI モデル向けに設計されており、さまざまな機能を提供します。
サーバーレスのトークン単位のオファーの特定のモデルにご関心があり、他の種類のモデルを使用する予定がない場合は、Standard デプロイを使用します。 標準デプロイでは、エンドポイント URL とキーの一意のセットの下に 1 つのモデルをデプロイできます。
モデルが標準デプロイで使用できない場合に、サブスクリプションでコンピューティング クォータを使用できる場合は、オープン モデルとカスタム モデルのデプロイをサポートする Managed Compute を使用します。 また、デプロイ推論サーバー、プロトコル、および詳細な構成を高度にカスタマイズすることもできます。