Model fondasi yang didukung pada Mosaic AI Model Serving

Artikel ini menjelaskan model fondasi yang dapat Anda layani menggunakan Mosaic AI Model Serving.

Model fondasi adalah jaringan neural besar yang telah dilatih sebelumnya pada berbagai rentang data yang beragam dan besar. Model ini dirancang untuk mempelajari pola umum dalam bahasa, gambar, atau jenis data lainnya, dan dapat disempurnakan untuk tugas tertentu dengan pelatihan tambahan. Penggunaan model fondasi tertentu tunduk pada ketentuan model dan kebijakan penggunaan yang dapat diterima. Lihat Ketentuan model yang berlaku.

Model Serving menawarkan opsi fleksibel untuk menghosting dan mengkueri model fondasi berdasarkan kebutuhan Anda:

  • Bayar per token: Ideal untuk eksperimen dan eksplorasi cepat. Opsi ini memungkinkan Anda untuk mengkueri titik akhir yang telah dikonfigurasi sebelumnya di ruang kerja Databricks Anda tanpa komitmen infrastruktur di muka.
  • Fungsi AI (inferensi batch): Beberapa model yang dihosting oleh Databricks telah dioptimalkan untuk Fungsi AI. Anda dapat menerapkan AI ke data Anda dan menjalankan beban kerja produksi inferensi batch dalam skala besar menggunakan fungsi-fungsi ini dan model yang didukung.
  • Throughput yang disediakan: Direkomendasikan untuk kasus penggunaan produksi yang memerlukan jaminan performa. Opsi ini memungkinkan penyebaran model fondasi yang disempurnakan dengan titik akhir penyajian yang dioptimalkan.
  • Model eksternal: Opsi ini memungkinkan akses ke model fondasi yang dihosting di luar Databricks, seperti yang disediakan oleh OpenAI atau Anthropic. Model-model ini dapat dikelola secara terpusat dalam Databricks untuk tata kelola yang disederhanakan.

Model dasar yang terhosting di Databricks

Databricks menghosting model-model dasar terbuka mutakhir, seperti Meta Llama. Model ini tersedia menggunakan API Model Foundation.

Tabel berikut ini meringkas model dan keluarga model yang dihosting Databricks mana yang didukung di setiap wilayah berdasarkan fitur Model Serving.

Penting

  • Anthropic Claude 3.7 Sonnet sudah tidak tersedia. Lihat Model yang sudah dihentikan untuk model penggantian yang direkomendasikan dan panduan tentang cara migrasi selama masa penghentian.
  • Meta Llama 4 Maverick tersedia untuk beban kerja API Model Foundation dengan throughput yang disediakan dalam mode Pratinjau Umum.
  • Meta-Llama-3.1-405B-Instruct tidak lagi tersedia untuk beban kerja bayar per token. Mulai 15 Mei 2026, beban kerja throughput yang disediakan juga akan dihentikan. Lihat Model yang sudah dihentikan untuk model penggantian yang direkomendasikan dan panduan tentang cara migrasi selama masa penghentian.
  • Beberapa keluarga model lama telah dipensiunkan. Lihat Model yang dihentikan untuk daftar lengkap model yang dihentikan dan penggantian yang direkomendasikan.
Wilayah API Model Dasar dengan pembayaran per token Fungsi AI (inferensi batch) Throughput yang dialokasikan untuk API Model Dasar
australiacentral Tidak didukung Tidak didukung Tidak didukung
australiacentral2 Tidak didukung Tidak didukung Tidak didukung
australiaeast Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
australiasoutheast Tidak didukung Tidak didukung Tidak didukung
brazilsouth Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (pratinjau)
    • Meta Llama 3.3⥂
    • Meta Llama 3,2 3B⥂
    • Meta Llama 3.2 1B
    • Meta Llama 3.1⥂
    • GTE v1.5 (English)⥂
    • BGE v1.5 (English)⥂
canadacentral Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (pratinjau)
    • Meta Llama 3.3⥂
    • Meta Llama 3,2 3B⥂
    • Meta Llama 3.2 1B
    • Meta Llama 3.1⥂
    • GTE v1.5 (English)⥂
    • BGE v1.5 (English)⥂
canadaeast Tidak didukung Tidak didukung Tidak didukung
centralindia Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (pratinjau)
    • Meta Llama 3.3⥂
    • Meta Llama 3,2 3B⥂
    • Meta Llama 3.2 1B
    • Meta Llama 3.1⥂
    • GTE v1.5 (English)⥂
    • BGE v1.5 (English)⥂
centralus Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
chinaeast2 Tidak didukung Tidak didukung Tidak didukung
chinaeast3 Tidak didukung Tidak didukung Tidak didukung
chinanorth2 Tidak didukung Tidak didukung Tidak didukung
chinanorth3 Tidak didukung Tidak didukung Tidak didukung
eastasia Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (pratinjau)
    • Meta Llama 3.3⥂
    • Meta Llama 3,2 3B⥂
    • Meta Llama 3.2 1B
    • Meta Llama 3.1⥂
    • GTE v1.5 (English)⥂
    • BGE v1.5 (English)⥂
eastus Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
eastus2 Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
francecentral Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
germanywestcentral Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
japaneast Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (pratinjau)
    • Meta Llama 3.3⥂
    • Meta Llama 3,2 3B⥂
    • Meta Llama 3.2 1B
    • Meta Llama 3.1⥂
    • GTE v1.5 (English)⥂
    • BGE v1.5 (English)⥂
japanwest Tidak didukung Tidak didukung Tidak didukung
koreacentral Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂
    • Meta Llama 3.3⥂
    • Meta Llama 3,2 3B⥂
    • Meta Llama 3.2 1B
    • Meta Llama 3.1⥂
mexicocentral Tidak didukung Tidak didukung Tidak didukung
northcentralus Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
northeurope Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
norwayeast Tidak didukung Tidak didukung Tidak didukung
qatarcentral Tidak didukung Tidak didukung Tidak didukung
southafricanorth Tidak didukung Tidak didukung Tidak didukung
southcentralus Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
southeastasia Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (pratinjau)
    • Meta Llama 3.3⥂
    • Meta Llama 3,2 3B⥂
    • Meta Llama 3.2 1B
    • Meta Llama 3.1⥂
    • GTE v1.5 (English)⥂
    • BGE v1.5 (English)⥂
southindia Tidak didukung Tidak didukung Tidak didukung
swedencentral Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
switzerlandnorth Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
switzerlandwest Tidak didukung Tidak didukung Tidak didukung
uaenorth Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (pratinjau)
    • Meta Llama 3.3⥂
    • Meta Llama 3,2 3B⥂
    • Meta Llama 3.2 1B
    • Meta Llama 3.1⥂
    • GTE v1.5 (English)⥂
    • BGE v1.5 (English)⥂
uksouth Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (pratinjau)
    • Meta Llama 3.3⥂
    • Meta Llama 3,2 3B⥂
    • Meta Llama 3.2 1B
    • Meta Llama 3.1⥂
    • GTE v1.5 (English)⥂
    • BGE v1.5 (English)⥂
ukwest Tidak didukung Tidak didukung Tidak didukung
westcentralus Tidak didukung Tidak didukung Tidak didukung
westeurope Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
westindia Tidak didukung Tidak didukung Tidak didukung
westus Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
westus2 Model berikut didukung:
Model berikut didukung:
  • Keluarga model berikut didukung untuk inferensi waktu nyata:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (pratinjau)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (Bahasa Inggris)
    • BGE v1.5 (Bahasa Inggris)
westus3 Model berikut didukung:
Tidak didukung Tidak didukung

⥂ Model ini didukung berdasarkan ketersediaan GPU dan memerlukan perutean geografi silang untuk diaktifkan.

Mengakses model fondasi yang dihosting di luar Databricks

Model fondasi yang dibuat oleh penyedia LLM, seperti OpenAI dan Anthropic, juga dapat diakses di Databricks menggunakan model Eksternal . Model ini dihosting di luar Databricks dan Anda dapat membuat titik akhir untuk mengkuerinya. Titik akhir ini dapat diatur secara terpusat dari Azure Databricks, yang menyederhanakan penggunaan dan manajemen berbagai penyedia LLM dalam organisasi Anda.

Tabel berikut menyajikan daftar model yang didukung yang tidak lengkap dan jenis titik akhir yang sesuai. Anda dapat menggunakan asosiasi model yang tercantum untuk membantu mengonfigurasi endpoint Anda untuk jenis model baru yang dirilis ketika tersedia dari penyedia yang bersangkutan. Pelanggan bertanggung jawab untuk memastikan kepatuhan terhadap lisensi model yang berlaku.

Nota

Dengan perkembangan LLM yang pesat, tidak ada jaminan bahwa daftar ini sudah diperbarui setiap saat. Versi model baru dari penyedia yang sama biasanya didukung meskipun tidak ada dalam daftar.

Penyedia model llm/v1/completions llm/v1/chat llm/v1/embeddings
OpenAI**
  • gpt-3.5-turbo-petunjuk
  • babbage-002
  • davinci-002
  • o1
  • o1-mini
  • o1-mini-2024-09-12
  • gpt-3.5-turbo
  • gpt-4
  • gpt-4-turbo
  • gpt-4-turbo-2024-04
  • gpt-4o
  • gpt-4o-2024-05-13
  • gpt-4o-mini
  • text-embedding-ada-002
  • penyisipan-teks-3-besar
  • teks-penanaman-3-kecil
Azure OpenAI**
  • text-davinci-003
  • gpt-35-turbo-instruct
  • o1
  • o1-mini
  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-4
  • gpt-4-turbo
  • gpt-4-32k
  • gpt-4o
  • gpt-4o-mini
  • text-embedding-ada-002
  • penyisipan-teks-3-besar
  • teks-penanaman-3-kecil
Antropik
  • claude-1
  • claude-1.3-100k
  • claude-2
  • claude-2.1
  • claude-2.0
  • claude-instant-1.2
  • claude-3-5-sonnet-terbaru
  • claude-3-5-haiku-terbaru
  • claude-3-5-opus-terkini
  • claude-3-5-sonnet-20241022
  • claude-3-5-haiku-20241022
  • claude-3-5-sonnet-20240620
  • claude-3-haiku-20240307
  • claude-3-opus-20240229
  • claude-3-sonnet-20240229
Cohere**
  • Perintah
  • perintah-ringan
  • komando-r7b-12-2024
  • command-r-plus-08-2024
  • command-r-08-2024
  • Command-R-Plus
  • perintah-r
  • Perintah
  • komando-cahaya-malam-setiap hari
  • perintah-ringan
  • perintah-malam-hari
  • embed-inggris-v2.0
  • Embed-multibahasa-v2.0
  • embed-english-light-v2.0
  • embed-bahasa-inggris-v3.0
  • embed-inggris-ringan-v3.0
  • embed-multibahasa-v3.0
  • embed-multilingual-light-v3.0
Penerapan Model AI Mosaik Titik akhir layanan Databricks Titik akhir layanan Databricks Titik akhir layanan Databricks
Amazon Bedrock Antropik
  • claude-instant-v1
  • claude-v2

Cohere:
  • command-text-v14
  • perintah-teks-ringan-v14

AI21 Labs:
  • j2-grande-instruct
  • j2-jumbo-instruct
  • j2-mid
  • j2-mid v1
  • j2-ultra
  • j2-ultra-v1
Antropik
  • claude-3-5-sonnet-20241022-v2:0
  • claude-3-5-haiku-20241022-v1:0
  • claude-3-opus-20240229-v1:0
  • claude-3-sonnet-20240229-v1:0
  • claude-3-5-sonnet-20240620-v1:0

Cohere:
  • command-r-plus-v1:0
  • command-r-v1:0

Amazon:
  • nova-lite-v1:0
  • nova-micro-v1:0
  • nova-pro-v1:0
Amazon:
  • titan-embed-text-v2:0
  • titan-embed-text-v1
  • titan-embed-g1-text-02

Cohere:
  • sisipkan-inggris-v3
  • embed-multilingual-v3
Lab AI21
  • j2-mid
  • j2-light
  • j2-ultra
Google Cloud Vertex AI teks-bison
  • chat-bison
  • gemini-pro
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-flash
  • gemini-2.0-flash
  • text-embedding-004
  • text-embedding-005
  • textembedding-gecko

Penyedia model ** mendukung model penyelesaian yang telah disesuaikan dan model obrolan. Untuk mengkueri model hasil fine-tuning, isi bidang name di konfigurasi external model dengan nama model hasil fine-tuning Anda.

Penyedia model mendukung model penyelesaian kustom.

Membuat model fondasi yang melayani titik akhir

Untuk mengkueri dan menggunakan model fondasi di aplikasi AI, Anda harus terlebih dahulu membuat model yang melayani titik akhir. Model Serving menggunakan API dan UI terpadu untuk membuat dan memperbarui endpoint penyajian model dasar.

Model fondasi kueri yang melayani titik akhir

Setelah Anda membuat titik akhir penyajian, Anda dapat menjalankan kueri pada model dasar Anda. Model Serving menggunakan API dan SDK yang kompatibel dengan OpenAI terpadu untuk mengkueri model fondasi. Pengalaman terpadu ini menyederhanakan cara Anda bereksperimen dengan dan menyesuaikan model fondasi untuk produksi di seluruh cloud dan penyedia yang didukung.

Lihat Menggunakan model fondasi.