次の方法で共有


モザイク AI モデル サービスでサポートされている基礎モデル

この記事では、Mosaic AI Model Servingを使用して提供できる基本モデルについて説明します。

基盤モデルは、大規模なデータと広範なデータの両方でトレーニングされる、事前トレーニング済みの大規模なニューラル ネットワークです。 これらのモデルは、言語、画像、またはその他のデータ型の一般的なパターンを学習するように設計されており、追加のトレーニングを使用して特定のタスクに合わせて微調整できます。 特定の基盤モデルの使用には、モデル開発者のライセンスと許容される使用ポリシーが適用されます。 該当するモデル開発者のライセンスと用語を参照してください。

Model Serving には、ニーズに基づいて基盤モデルをホストおよびクエリするための柔軟なオプションが用意されています。

  • トークンごとの支払い: 実験や迅速な探索に最適です。 このオプションを使用すると、事前インフラストラクチャ コミットメントなしで Databricks ワークスペース内の事前構成済みエンドポイントに対してクエリを実行できます。
  • AI 関数 (バッチ推論): Databricks でホストされるモデルのサブセットは、AI 関数用に最適化されています。 これらの関数とサポートされているモデルを使用して、データに AI を適用し、バッチ推論運用ワークロードを大規模に実行できます。
  • プロビジョンドスループット: パフォーマンス保証が必要な運用環境での使用が推奨されます。 このオプションを使用すると、最適化されたサービス エンドポイントを使用して微調整された基盤モデルをデプロイできます。
  • 外部モデル: このオプションを使用すると、OpenAI や Anthropic によって提供されるものなど、Databricks の外部でホストされている基盤モデルにアクセスできます。 これらのモデルは、合理化されたガバナンスのために Databricks 内で一元的に管理できます。

Databricks でホストされている基礎モデル

Databricks は、Meta Llama のような最先端のオープン基盤モデルをホストします。 これらのモデルは、 Foundation Model API を使用して使用できます。

次の表は、モデル サービス機能に基づいて、各リージョンでサポートされている Databricks でホストされるモデルとモデル ファミリをまとめたものです。

重要

  • Anthropic Claude Opus 4.5 はグローバル エンドポイントでホストされており、すべてのリージョンで クロスジオグラフィルーティングを有効化する必要があります

  • Anthropic Claude 3.7 Sonnet は、2026 年 3 月 10 日に廃止されます。 推奨 される置換モデルについては廃止されたモデル を参照し、非推奨の間に移行する方法についてはガイダンスを参照してください。

  • Meta Llama 4 Maverick は、 パブリック プレビューでプロビジョニングされた Foundation Model API のスループット ワークロードで使用できます。

  • 2024 年 12 月 11 日より、Meta-Llama-3.3-70B-Instruct は、Foundation Model API のトークンごとの支払いエンドポイントでの Meta-Llama-3.1-70B-Instruct のサポートを置き換えます。

  • Meta-Llama-3.1-405B-Instruct は、Meta によって構築およびトレーニングされ、AzureML モデル カタログを使用して Azure Machine Learning によって配布される、オープンに利用可能な最新の大規模言語モデルです。

    • 2026 年 2 月 15 日より、Meta-Llama-3.1-405B-Instruct はトークンごとの支払いワークロードで廃止されます。
    • 2026 年 5 月 15 日より、Meta-Llama-3.1-405B-Instruct はプロビジョニングされたスループット ワークロードに対して廃止されます。
    • 推奨 される置換モデルについては廃止されたモデル を参照し、非推奨の間に移行する方法についてはガイダンスを参照してください。
  • 2026 年 2 月 15 日から、次のモデル ファミリに関連付けられているモデルは廃止され、モデル サービス機能領域で使用できなくなります。 推奨 される置換モデルについては、廃止されたモデル と、非推奨の間に移行する方法に関するガイダンスを参照してください。

    • ラマ 3 70B
    • ラマ 3 8B
    • ラマ 2 70B
    • ラマ2 13B
    • ミストラル 8x7B
    • Mixtral 8x7B
  • 2025 年 12 月 19 日から、次のモデル ファミリに関連付けられているモデルは廃止され、モデル サービス機能領域で使用できなくなります。 推奨 される置換モデルについては、廃止されたモデル と、非推奨の間に移行する方法に関するガイダンスを参照してください。

    • DBRX
    • MPT 30B
    • MPT 7B
リージョン Foundation Model API のトークンごとの支払い AI 関数 (バッチ推論) Foundation Model API プロビジョニング スループット
australiacentral サポートされていません サポートされていません サポートされていません
australiacentral2 サポートされていません サポートされていません サポートされていません
australiaeast 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick (プレビュー)*
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
australiasoutheast サポートされていません サポートされていません サポートされていません
brazilsouth 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (プレビュー)
    • メタ ラマ 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • メタ ラマ 3.1*
    • GTE v1.5 (英語)*
    • BGE v1.5 (英語)*
canadacentral 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (プレビュー)
    • メタ ラマ 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • メタ ラマ 3.1*
    • GTE v1.5 (英語)*
    • BGE v1.5 (英語)*
canadaeast サポートされていません サポートされていません サポートされていません
centralindia 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (プレビュー)
    • メタ ラマ 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • メタ ラマ 3.1*
    • GTE v1.5 (英語)*
    • BGE v1.5 (英語)*
centralus 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (プレビュー)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
chinaeast2 サポートされていません サポートされていません サポートされていません
chinaeast3 サポートされていません サポートされていません サポートされていません
chinanorth2 サポートされていません サポートされていません サポートされていません
chinanorth3 サポートされていません サポートされていません サポートされていません
eastasia 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (プレビュー)
    • メタ ラマ 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • メタ ラマ 3.1*
    • GTE v1.5 (英語)*
    • BGE v1.5 (英語)*
eastus 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (プレビュー)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
eastus2 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (プレビュー)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
francecentral 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (プレビュー)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
germanywestcentral 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (プレビュー)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
japaneast 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (プレビュー)
    • メタ ラマ 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • メタ ラマ 3.1*
    • GTE v1.5 (英語)*
    • BGE v1.5 (英語)*
japanwest サポートされていません サポートされていません サポートされていません
koreacentral 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • メタ ラマ 4 マーベリック*
    • メタ ラマ 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • メタ ラマ 3.1*
mexicocentral サポートされていません サポートされていません サポートされていません
northcentralus 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (プレビュー)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
northeurope 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (プレビュー)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
norwayeast サポートされていません サポートされていません サポートされていません
qatarcentral サポートされていません サポートされていません サポートされていません
southafricanorth サポートされていません サポートされていません サポートされていません
southcentralus 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (プレビュー)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
southeastasia 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (プレビュー)
    • メタ ラマ 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • メタ ラマ 3.1*
    • GTE v1.5 (英語)*
    • BGE v1.5 (英語)*
southindia サポートされていません サポートされていません サポートされていません
swedencentral 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (プレビュー)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
switzerlandnorth 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (プレビュー)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
switzerlandwest サポートされていません サポートされていません サポートされていません
uaenorth 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (プレビュー)
    • メタ ラマ 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • メタ ラマ 3.1*
    • GTE v1.5 (英語)*
    • BGE v1.5 (英語)*
uksouth 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (プレビュー)
    • メタ ラマ 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • メタ ラマ 3.1*
    • GTE v1.5 (英語)*
    • BGE v1.5 (英語)*
ukwest サポートされていません サポートされていません サポートされていません
westcentralus サポートされていません サポートされていません サポートされていません
westeurope 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (プレビュー)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
westindia サポートされていません サポートされていません サポートされていません
westus 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (プレビュー)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
westus2 次のモデルがサポートされています。
次のモデルがサポートされています。
  • リアルタイム推論では、次のモデル ファミリがサポートされています。
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (プレビュー)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • メタ・リャマ 3.1
    • GTE v1.5 (英語)
    • BGE v1.5 (英語)
westus3 サポートされていません サポートされていません サポートされていません

* このモデルは GPU の可用性に基づいてサポートされており、 クロス geography ルーティングを有効にする必要があります

Databricks の外部でホストされている Access 基盤モデル

OpenAI や Anthropic などの LLM プロバイダーによって作成された基礎モデルは、外部モデルを使用して Databricks でもアクセスできます。 これらのモデルは Databricks の外部でホストされており、クエリを実行するエンドポイントを作成できます。 これらのエンドポイントは、Azure Databricks から一元的に管理できます。これにより、組織内のさまざまな LLM プロバイダーの使用と管理が合理化されます。

次の表に、サポートされているモデルと、対応する エンドポイントの種類の一覧を示します。 一覧表示されているモデルの関連付けを利用することで、特定のプロバイダーで新しく利用可能になるモデルタイプのエンドポイントを構成するのに役立ちます。 お客様は、該当するモデル ライセンスへのコンプライアンスを遵守する責任を負います。

LLM の急速な開発により、このリストが常に最新であるという保証はありません。 一覧にない場合でも、通常、同じプロバイダーの新しいモデル バージョンがサポートされます。

モデル プロバイダー llm/v1/completions llm/v1/chat llm/v1/embeddings
OpenAI**
  • gpt-3.5-turbo-instruct
  • babbage-002
  • davinci-002
  • o1
  • o1-mini
  • o1-mini-2024-09-12
  • gpt-35-turbo
  • gpt-4
  • gpt-4-turbo
  • gpt-4-turbo-2024-04
  • gpt-4o
  • gpt-4o-2024-05-13
  • gpt-4o-mini
  • text-embedding-ada-002
  • text-embedding-3-large
  • text-embedding-3-small
Azure OpenAI**
  • text-davinci-003
  • gpt-3.5-turbo-instruct
  • o1
  • o1-mini
  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-4
  • gpt-4-turbo
  • gpt-4-32k
  • gpt-4o
  • gpt-4o-mini
  • text-embedding-ada-002
  • text-embedding-3-large
  • text-embedding-3-small
Anthropic
  • claude-1
  • claude-1.3-100k
  • claude-2
  • claude-2.1
  • claude-2.0
  • claude-instant-1.2
  • クロード-3-5-ソネット-最新
  • クロード-3-5-俳句-最新
  • claude-3-5-opus-latest
  • claude-3-5-sonnet-20241022
  • claude-3-5-haiku-20241022
  • クロード-3-5-ソネット-20240620
  • claude-3-haiku-20240307
  • claude-3-opus-20240229
  • claude-3-sonnet-20240229
Cohere**
  • コマンド
  • command-light
  • command-r7b-12-2024
  • コマンド-r-プラス-08-2024
  • command-r-08-2024
  • コマンド-r-プラス
  • command-r
  • コマンド
  • command-light-nightly
  • command-light
  • コマンド・ナイトリー
  • embed-english-v2.0
  • embed-multilingual-v2.0
  • embed-english-light-v2.0
  • embed-english-v3.0
  • embed-english-light-v3.0
  • embed-multilingual-v3.0 多言語埋め込み v3.0
  • embed-multilingual-light-v3.0
モザイク AI モデルの提供 Databricks サービス エンドポイント Databricks サービス エンドポイント Databricks サービス エンドポイント
Amazon Bedrock Anthropic:
  • claude-instant-v1
  • claude-v2

Cohere:
  • command-text-v14
  • command-light-text-v14

AI21 ラボ:
  • j2-grande-instruct
  • j2-jumbo-instruct
  • j2-mid
  • j2-mid-v1
  • j2-ultra
  • j2-ultra-v1
Anthropic:
  • claude-3-5-sonnet-20241022-v2:0
  • claude-3-5-haiku-20241022-v1:0
  • claude-3-opus-20240229-v1:0
  • claude-3-sonnet-20240229-v1:0
  • claude-3-5-sonnet-20240620-v1:0

Cohere:
  • command-r-plus-v1:0
  • command-r-v1:0

アマゾン:
  • nova-lite-v1:0
  • nova-micro-v1:0
  • nova-pro-v1:0
アマゾン:
  • titan-embed-text-v2:0
  • titan-embed-text-v1
  • titan-embed-g1-text-02

Cohere:
  • embed-english-v3
  • embed-multilingual-v3
AI21 ラボ
  • j2-mid
  • j2-light
  • j2-ultra
Google Cloud Vertex AI text-bison
  • チャットバイソン
  • gemini-pro
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-flash
  • gemini-2.0-flash
  • text-embedding-004
  • text-embedding-005
  • textembedding-gecko

** モデル プロバイダーでは、微調整された完了モデルとチャット モデルがサポートされます。 微調整されたモデルのクエリを実行するには、name 構成の external model フィールドに、微調整されたモデルの名前を設定します。

モデル プロバイダーでは、カスタム補完モデルがサポートされています。

エンドポイントを提供する基盤モデルを作成する

AI アプリケーションで基礎モデルのクエリを実行して使用するには、まず、エンドポイントを提供するモデルを作成する必要があります。 Model Serving では、統合 API と UI を使用して、エンドポイントを提供する基盤モデルを作成および更新します。

  • Foundation Model API のプロビジョニング済みスループットを使用して使用可能になった基盤モデルの微調整されたバリエーションを提供するエンドポイントを作成するには、「REST APIを使用してプロビジョニング済みスループット エンドポイントを作成する」を参照してください。
  • 外部モデル オファリングを使用して利用できる基盤モデルにアクセスするサービス エンドポイントの作成については、「エンドポイントを提供する外部モデルを作成する」を参照してください。

エンドポイントを提供するクエリ基盤モデル

サービス エンドポイントを作成したら、基盤モデルに対してクエリを実行できます。 Model Serving では、統合された OpenAI と互換性のある API と SDK を使用して、基盤モデルのクエリを実行します。 この統合されたエクスペリエンスにより、サポートされているクラウドとプロバイダー全体で運用用の基盤モデルを試してカスタマイズする方法が簡略化されます。

基礎モデルの使用を参照してください。