次の方法で共有


Azure AI Studio のモデルカタログとモデルコレクション

重要

この記事で説明する機能の一部は、プレビューでのみ使用できる場合があります。 このプレビューはサービス レベル アグリーメントなしで提供されており、運用環境ではお勧めしません。 特定の機能はサポート対象ではなく、機能が制限されることがあります。 詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。

Azure AI studio のモデル カタログは、生成 AI アプリケーションの構築が可能となるさまざまなモデルを検索して使用するためのハブです。 モデル カタログでは、Azure OpenAI Service、Mistral、Meta、Cohere、Nvidia、Hugging Face などのモデル プロバイダーの数百ものモデルが提供されています (Microsoft によってトレーニングされたモデルを含む)。 Microsoft 以外のプロバイダーのモデルは、Microsoft の製品使用条件で定義されているとおり、Microsoft 製品ではないため、そのモデルで提供されている条件に従います。

モデル コレクション

モデル カタログでは、モデルをコレクションにまとめています。 モデル カタログには、次の 3 種類のコレクションがあります。

  • Azure AI によってキュレーションされたモデル: Azure AI プラットフォーム上でシームレスに動作するようにパッケージ化され、最適化された、最も一般的なサードパーティ製のオープン ウェイト モデルとプロプライエタリ モデル。 これらのモデルの使用は、モデルに付与されているモデル プロバイダーのライセンス条項に従います。 Azure AI Studio にデプロイする場合は、モデルの可用性は該当する Azure SLA の対象となり、Microsoft がデプロイの問題に関するサポートを提供します。 Meta、NVIDIA、Mistral AI などのパートナーのモデルが、カタログの "Azure AI によるキュレーション" コレクションで利用できるモデルの例です。 これらのモデルは、カタログ内のモデル タイルの緑色のチェックマークで識別できますし、"Azure AI によるキュレーション" コレクションでフィルタリングすることもできます。
  • Azure OpenAI モデル (Azure でのみ利用可能): Azure OpenAI Service との統合を通じた、"Azure OpenAI" コレクションで提供する主力の Azure OpenAI モデル。 Microsoft はこれらのモデルをサポートし、その使用は、製品使用条件と Azure OpenAI Service の SLA に従います。
  • Hugging Face ハブのオープン モデル: マネージド コンピューティングでのリアルタイム推論のために「Hugging Face」コレクション経由で、HuggingFace ハブの数百のモデルにアクセスできます。 Hugging Face は、HuggingFace コレクションに掲載しているモデルを作成および維持しています。 ヘルプについては、HuggingFace フォーラムまたは HuggingFace サポートをご利用ください。 詳細については、「オープン モデルをデプロイする」を参照してください。

モデル カタログへの追加の提案: このフォームを使用して、モデル カタログへのモデルの追加依頼を送信できます。

モデル カタログ機能の概要

Azure OpenAI モデルの詳細については、「Azure OpenAI Service」を参照してください。

Azure AI によるキュレーションおよび Hugging Face ハブのオープン モデルのモデルの一部はマネージド コンピューティング オプションでデプロイできます。また、従量課金制のサーバーレス API を使用してデプロイできるモデルもあります。 これらのモデルを検索、比較、評価、微調整 (サポートされている場合) し、大規模にデプロイして、エンタープライズ レベルのセキュリティとデータ ガバナンスのもとで、生成 AI アプリケーションに統合できます。

  • 検索: モデル カードを確認し、サンプル推論を試し、コード サンプルを参照して、モデルの評価や微調整、デプロイなどを行います。
  • 比較: 業界で利用可能なモデルとデータセットのベンチマークを比較して、どれが自社のビジネス シナリオに適合するかを評価できます。
  • 評価: 独自のテスト データを提供して、モデルが特定のワークロードに適しているかどうかを評価します。 評価メトリックを使用すると、選択したモデルがシナリオでどの程度適切に実行されているかを簡単に視覚化できます。
  • 微調整: 独自のトレーニング データを使用して微調整可能なモデルをカスタマイズし、すべての微調整ジョブのメトリックを比較して最適なモデルを選択します。 組み込みの最適化機能によって、微調整を高速化し、微調整に要するメモリとコンピューティングを削減できます。
  • デプロイ: 推論用に事前トレーニング済みモデルまたは微調整済みモデルをシームレスにデプロイします。 マネージド コンピューティングにデプロイできるモデルもダウンロードできます。

モデル デプロイ: マネージド コンピューティングとサーバーレス API (従量課金制)

モデル カタログには、カタログからモデルをデプロイして使用するための方法として、マネージド コンピューティングとサーバーレス API という異なる 2 つの方法が用意されています。 モデルごとに利用可能なデプロイ オプションは異なります。デプロイ オプションの機能と、特定のモデルで使用できるオプションの詳細については、次の表を参照してください。 デプロイ オプションでのデータ処理の詳細をご確認ください。

機能 マネージド コンピューティング サーバーレス API (従量課金制)
デプロイ エクスペリエンスと課金 モデルの重みは、マネージド オンライン エンドポイントのある専用の仮想マシンにデプロイされます。 マネージド オンライン エンドポイントは、1 つ以上のデプロイを持つことができ、推論に REST API を使用できます。 利用者は、デプロイに使用された仮想マシン コア時間に対して課金されます。 モデルへのアクセスは、モデルにアクセスするための API をプロビジョニングするデプロイを通じて行われます。 この API は、推論のために Microsoft によってホストされ、管理されているモデルへのアクセスを提供します。 このアクセス モードは、"サービスとしてのモデル" と呼ばれます。 利用者は、API への入力と出力 (通常はトークン数) に対して課金されます。この価格情報は、デプロイする前に提供されます。
API 認証 キーと Microsoft Entra ID 認証。 キーのみ。
コンテンツの安全性 Azure Content Safety サービス API を使用します。 Azure AI Content Safety フィルターを、推論 API と統合して使用できます。 Azure AI Content Safety フィルターは、個別に課金される場合があります。
ネットワークの分離 マネージド ネットワークを構成します。 詳細情報。
モデル マネージド コンピューティング サーバーレス API (従量課金制)
Llama ファミリ モデル Llama-2-7b
Llama-2-7b-chat
Llama-2-13b
Llama-2-13b-chat
Llama-2-70b
Llama-2-70b-chat
Llama-3-8B-Instruct
Llama-3-70B-Instruct
Llama-3-8B
Llama-3-70B
Llama-3-70B-Instruct
Llama-3-8B-Instruct
Llama-2-7b
Llama-2-7b-chat
Llama-2-13b
Llama-2-13b-chat
Llama-2-70b
Llama-2-70b-chat
Mistral ファミリ モデル mistralai-Mixtral-8x22B-v0-1
mistralai-Mixtral-8x22B-Instruct-v0-1
mistral-community-Mixtral-8x22B-v0-1
mistralai-Mixtral-8x7B-v01
mistralai-Mistral-7B-Instruct-v0-2
mistralai-Mistral-7B-v01
mistralai-Mixtral-8x7B-Instruct-v01
mistralai-Mistral-7B-Instruct-v01
Mistral-large
Mistral-small
Cohere ファミリ モデル 使用不可 Cohere-command-r-plus
Cohere-command-r
Cohere-embed-v3-english
Cohere-embed-v3-multilingual
JAIS 使用不可 jais-30b-chat
Phi3 family models Phi-3-small-128k-Instruct
Phi-3-small-8k-Instruct
Phi-3-mini-4k-Instruct
Phi-3-mini-128k-Instruct
Phi3-medium-128k-instruct
Phi3-medium-4k-instruct
Phi-3-mini-4k-Instruct
Phi-3-mini-128k-Instruct
Phi3-medium-128k-instruct
Phi3-medium-4k-instruct
Nixtla 使用不可 TimeGEN-1
その他のモデル 使用可能 使用不可

サービスとしてのモデルおよびリアル タイム エンド ポイント サービスのサイクルを示す図。

マネージド コンピューティング

モデルをマネージド コンピューティングとしてデプロイする機能は、Azure Machine Learning のプラットフォーム機能に基づいて構築され、モデル カタログの幅広いモデル コレクションの LLMOps ライフサイクル全体においてシームレスな統合を実現します。

LLMops のライフ サイクルを示す図。

モデルをマネージド コンピューティングとしてデプロイするにはどうすればよいですか?

モデルは、Azure Machine Learning レジストリを介して利用可能にできます。これは、機械学習資産のホスティングおよび配布のための ML ファーストの方法を有効にするためのものであり、このような資産には、モデルの重み付け、モデルを実行するためのコンテナー ランタイム、ベンチマークとサンプルのモデルとデータセットを評価および微調整するためのパイプラインなどがあります。 これらの ML レジストリは、高度にスケーラブルでエンタープライズ対応のインフラストラクチャの上に構築されます。

  • geo レプリケーションが組み込まれているすべての Azure リージョンに、待機時間の短いアクセス モデル成果物を提供します。

  • エンタープライズ セキュリティ要件をサポートします (Azure Policy によるモデルへのアクセス制限およびマネージド仮想ネットワークを使用したセキュアなデプロイ)。

マネージド コンピューティングを使用して推論用のモデルをデプロイする

マネージド コンピューティングにデプロイ可能なモデルは、Azure Machine Learning のオンライン エンドポイントにデプロイして、リアルタイム推論に利用できます。 マネージド コンピューティングにデプロイするには、モデルの最適な実行に必要な特定の SKU のための仮想マシン クォータが Azure サブスクリプションに必要です。 一部のモデルでは、モデルをテストするための一時的な共有クォータへのデプロイが可能です。 モデルのデプロイの詳細については、次を参照してください。

マネージド コンピューティングを使用して生成 AI アプリを構築する

プロンプト フローは、プロトタイプ作成において優れたエクスペリエンスを提供します。 マネージド コンピューティングでデプロイされたモデルは、Open Model LLM ツールを使用することで、プロンプト フローで利用できます。 また、Azure Machine Learning 拡張機能を使用して、LangChain などの一般的な LLM ツールでマネージド コンピューティングによって公開される REST API を使用することもできます。

マネージド コンピューティングとしてデプロイされたモデルのコンテンツの安全性

Azure AI Content Safety (AACS) サービスは、マネージド コンピューティングで使用し、性的コンテンツ、暴力、ヘイト、自傷行為、高度な脅威 (脱獄リスク検出や保護済み素材テキスト検出など) などのさまざまなカテゴリの有害なコンテンツをスクリーニングするために利用できます。 Llama 2 の AACS との統合に関してはこのノートブックを参照できます。また、プロンプト フローで Content Safety (テキスト) ツールを使用して、モデルから AACS に応答を渡してスクリーニングを行えます。 このようなサービスの使用には、AACS の価格に従って個別に課金されます。

従量課金制のサーバーレス API

モデル カタログ内の特定のモデルは、従量課金制の課金のサーバーレス API としてデプロイできます。このデプロイ方法はサービスとしてのモデル (MaaS) と呼ばれ、サブスクリプションでホストせずに API として使用する方法が提供されます。 MaaS を介して使用できるモデルは、Microsoft によって管理されるインフラストラクチャでホストされます。これにより、モデル プロバイダーのモデルへの API ベースのアクセスが可能になります。 API ベースのアクセスにより、モデルへのアクセス コストが大幅に削減され、プロビジョニング エクスペリエンスは大変、シンプルなものになります。 ほとんどの MaaS モデルは、トークンベースの価格で使用できます。

MaaS でサード パーティ製モデルを利用可能にする方法

モデル パブリッシャー サービス サイクルを示す図。

従量課金制のサーバーレス API としてデプロイできるモデルは、モデル プロバイダーによって提供されますが、Microsoft が管理する Azure インフラストラクチャでホストされ、API を介してアクセスされます。 モデル プロバイダーがライセンス条項を定義し、モデルの使用価格を設定する一方、Azure Machine Learning service はホスティング インフラストラクチャを管理し、推論 API を使用できるようにします。また、MaaS 経由でデプロイされたモデルによって送信されるプロンプトとコンテンツ出力のデータ プロセッサとして機能します。 MaaS のデータ処理の詳細については、データのプライバシーに関する記事を参照してください。

MaaS でのモデル使用量に対する支払い

MaaS を介してデプロイされたモデルの検索、サブスクリプション、従量課金エクスペリエンスは、Azure AI Studio と Azure Machine Learning スタジオにあります。 ユーザーはモデルの使用に関するライセンス条項に同意し、デプロイ時に従量課金に関する価格情報が提供されます。 サード パーティ プロバイダーのモデルは、商用マーケットプレースの使用条件に従って Azure Marketplace を通じて課金されます。Microsoft のモデルは、ファースト パーティの従量課金サービスとして、Azure メーターを使用して課金されます。 製品条項で説明されているように、ファースト パーティの従量課金サービスは Azure メーターを使用して購入されますが、Azure サービスのご契約条件の対象ではありません。これらのモデルの使用には、提供されるライセンス条項が適用されます。

MaaS を使用して推論用のモデルをデプロイする

MaaS を使用してモデルをデプロイすると、ユーザーはインフラストラクチャの構成や GPU のプロビジョニングの必要なしに、推論 API を使用する準備が整い、エンジニアリング時間とリソースを節約できます。 これらの API は複数の LLM ツールと統合でき、前のセクションで説明したように、使用量に対して課金されます。

従量課金制で MaaS を使用してモデルを微調整する

MaaS を通じた利用が可能で微調整をサポートしているモデルの場合、ユーザーは、従量課金制でホストされたファインチューニングを活用し、ユーザー データを使用してモデルを調整することができます。 詳細については、ファインチューニングの概要に関するページを参照してください。

サーバーレス API としてデプロイされたモデルを使用した RAG

Azure AI Studio を使用すると、ユーザーはベクトル インデックスと検索拡張生成 (RAG) を利用できます。 サーバーレス API 経由でデプロイできるモデルを使用して、カスタム データに基づいて埋め込みと推論を生成し、ユース ケースに固有の回答を生成できます。 詳細については、「ベクトル インデックスの作成方法」を参照してください。

オファーとモデルのリージョン別の利用可能性

従量課金制は、モデル プロバイダーがオファーを利用可能にしている国の課金アカウントに属する Azure サブスクリプションを持つユーザーのみが利用できます (次のセクションの表の「オファーを利用できるリージョン」を参照)。 関連するリージョンでオファーを利用できる場合、ユーザーは Azure リージョン内にハブ/プロジェクトを持つ必要があります。このハブ/プロジェクトでは、該当する場合はモデルをデプロイまたは微調整できます (下の表の「ハブ/プロジェクト リージョン」列を参照)。

モデル オファーの利用可能リージョン デプロイ用のハブ/プロジェクト リージョン 微調整用のハブ/プロジェクトリージョン
Llama-3-70B-Instruct
Llama-3-8B-Instruct
Microsoft 管理対象国 米国東部、米国東部 2、米国中北部、米国中南部、スウェーデン中部、米国西部、米国西部 3 使用不可
Llama-2-7b
Llama-2-13b
Llama-2-70b
Microsoft 管理対象国 米国東部、米国東部 2、米国中北部、米国中南部、米国西部、米国西部 3 米国西部 3
Llama-2-7b-chat
Llama-2-13b-chat
Llama-2-70b-chat
Microsoft 管理対象国 米国東部、米国東部 2、米国中北部、米国中南部、米国西部、米国西部 3、 使用不可
Mistral Small Microsoft 管理対象国 米国東部、米国東部 2、米国中北部、米国中南部、スウェーデン中部、米国西部、米国西部 3 使用不可
Mistral-Large Microsoft 管理対象の国
ブラジル
香港特別行政区
イスラエル
米国東部、米国東部 2、フランス中部、米国中北部、米国中南部、スウェーデン中部、米国西部、米国西部 3 使用不可
Cohere-command-r-plus
Cohere-command-r
Cohere-embed-v3-english
Cohere-embed-v3-multilingual
Microsoft 管理対象国
日本
米国東部、米国東部 2、米国中北部、米国中南部、スウェーデン中部、米国西部、米国西部 3 使用不可
TimeGEN-1 Microsoft 管理対象国
メキシコ
イスラエル
米国東部、米国東部 2、米国中北部、米国中南部、スウェーデン中部、米国西部、米国西部 3 使用不可
jais-30b-chat Microsoft 管理対象国 米国東部、米国東部 2、米国中北部、米国中南部、スウェーデン中部、米国西部、米国西部 3 使用不可
Phi-3-mini-4k-instruct Microsoft 管理対象国 米国東部 2、カナダ中部、スウェーデン中部、米国西部 3 使用不可
Phi-3-mini-128k-instruct
Phi-3-medium-4k-instruct
Phi-3-medium-128k-instruct
Microsoft 管理対象国 米国東部 2、スウェーデン中部 使用不可

サーバーレス API を使用してデプロイされたモデルのコンテンツの安全性

重要

この記事で説明する機能の一部は、プレビューでのみ使用できる場合があります。 このプレビューはサービス レベル アグリーメントなしで提供されており、運用環境ではお勧めしません。 特定の機能はサポート対象ではなく、機能が制限されることがあります。 詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。

Azure AI Studio では、MaaS でデプロイされた言語モデルにおいて、有害なコンテンツ (ヘイト、自傷行為、性的、暴力など) に対する Azure AI Content Safety テキスト モデレーション フィルターのデフォルト構成が実装されています。 コンテンツのフィルター処理 (プレビュー) の詳細については、「Azure AI Content Safety の有害なカテゴリ」を参照してください。 コンテンツのフィルター処理 (プレビュー) は、サービスがプロンプトを処理してコンテンツを生成する際に同期的に行われ、フィルター処理等の使用には AACS の価格 に従って個別に課金される場合があります。 個々のサーバーレス エンドポイントのコンテンツのフィルター処理は、言語モデルを初めてデプロイするときに、またはデプロイの詳細ページでコンテンツのフィルター処理の切り替えをクリックして、無効にすることができます。 コンテンツ フィルターをオフにすると、ユーザーが有害なコンテンツにさらされるリスクが高まる可能性があります。

次のステップ