Podporované základní modely pro obsluhu modelu AI v systému Mosaic

Tento článek popisuje základní modely, které můžete obsluhovat pomocí Služby modelu Mosaic AI.

Základní modely jsou velké předem natrénované neurální sítě, které jsou natrénované na velkých i širokých rozsazích dat. Tyto modely jsou navržené tak, aby se naučily obecné vzory v jazyce, obrázcích nebo jiných datových typech a dají se vyladit pro konkrétní úlohy s dalšími školeními. Vaše použití určitých základních modelů podléhá podmínkám modelu a přijatelným zásadám použití. Viz Platné podmínky modelu.

Obsluha modelů nabízí flexibilní možnosti hostování a dotazování základních modelů na základě vašich potřeb:

  • s platbou za token: Ideální pro experimentování a rychlý průzkum. Tato možnost umožňuje dotazovat se na předem nakonfigurované koncové body v pracovním prostoru Databricks bez počátečních závazků infrastruktury.
  • Funkce AI (dávkové odvozování):: Podmnožina modelů hostovaných v Databricks je optimalizovaná pro funkce AI. AI můžete použít na data a spouštět produkční úlohy dávkového odvozování ve velkém měřítku pomocí těchto funkcí a jejich podporovaných modelů.
  • Zřízená propustnost: Doporučeno pro případy použití v produkčním prostředí vyžadující záruky výkonu. Tato možnost umožňuje nasazení jemně vyladěných základních modelů s optimalizovanými obslužnými koncovými body.
  • Externí modely: Tato možnost umožňuje přístup k základním modelům hostovaným mimo Databricks, jako jsou ty, které poskytuje OpenAI nebo Anthropic. Tyto modely je možné centrálně spravovat v Databricks, aby se zjednodušily zásady správného řízení.

Základní modely hostované v Databricks

Databricks hostuje nejmodernější otevřené základní modely, jako je Meta Llama. Tyto modely jsou k dispozici pomocí rozhraní API základního modelu.

Následující tabulka shrnuje, které modely a rodiny modelů hostované službou Databricks jsou podporovány v každé oblasti na základě funkce Obsluha modelu.

Důležitý

  • Anthropic Claude 3.7 Sonnet již není k dispozici. Informace o tom, jak migrovat během vyřazení, najdete v části Vyřazené modely s doporučeným náhradním modelem a pokyny k migraci.
  • Meta Llama 4 Maverick je k dispozici pro úlohy s propustností rozhraní API základních modelů ve verzi Public Preview.
  • Meta-Llama-3.1-405B-Instruct už není k dispozici pro úlohy s platbami za tokeny. Od 15. května 2026 bude také ukončena pro pracovní zátěže s nastavenou propustností. Informace o tom, jak migrovat během vyřazení, najdete v části Vyřazené modely s doporučeným náhradním modelem a pokyny k migraci.
  • Několik starších modelových řad bylo vyřazeno. Úplný seznam vyřazených modelů a doporučených nahrazení najdete v části Vyřazené modely .
Región Rozhraní API základního modelu s platbou podle počtu tokenů Funkce AI (dávkové odvození) Zajištěná propustnost API základního modelu
australiacentral Není podporováno Není podporováno Není podporováno
australiacentral2 Není podporováno Není podporováno Není podporováno
australiaeast Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick (Preview)⥂
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
australiasoutheast Není podporováno Není podporováno Není podporováno
brazilsouth Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (Preview)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angličtina)⥂
    • BGE v1.5 (angličtina)⥂
canadacentral Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (Preview)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angličtina)⥂
    • BGE v1.5 (angličtina)⥂
canadaeast Není podporováno Není podporováno Není podporováno
centralindia Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (Preview)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angličtina)⥂
    • BGE v1.5 (angličtina)⥂
centralus Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (Preview)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
chinaeast2 Není podporováno Není podporováno Není podporováno
chinaeast3 Není podporováno Není podporováno Není podporováno
chinanorth2 Není podporováno Není podporováno Není podporováno
chinanorth3 Není podporováno Není podporováno Není podporováno
eastasia Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (Preview)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angličtina)⥂
    • BGE v1.5 (angličtina)⥂
eastus Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (Preview)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
eastus2 Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (Preview)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
francecentral Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (Preview)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
germanywestcentral Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (Preview)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
japaneast Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (Preview)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angličtina)⥂
    • BGE v1.5 (angličtina)⥂
japanwest Není podporováno Není podporováno Není podporováno
koreacentral Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
mexicocentral Není podporováno Není podporováno Není podporováno
northcentralus Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (Preview)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
northeurope Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (Preview)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
norwayeast Není podporováno Není podporováno Není podporováno
qatarcentral Není podporováno Není podporováno Není podporováno
southafricanorth Není podporováno Není podporováno Není podporováno
southcentralus Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (Preview)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
southeastasia Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (Preview)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angličtina)⥂
    • BGE v1.5 (angličtina)⥂
southindia Není podporováno Není podporováno Není podporováno
swedencentral Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (Preview)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
switzerlandnorth Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (Preview)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
switzerlandwest Není podporováno Není podporováno Není podporováno
uaenorth Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (Preview)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angličtina)⥂
    • BGE v1.5 (angličtina)⥂
uksouth Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B⥂
    • Meta Llama 4 Maverick⥂ (Preview)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angličtina)⥂
    • BGE v1.5 (angličtina)⥂
ukwest Není podporováno Není podporováno Není podporováno
westcentralus Není podporováno Není podporováno Není podporováno
westeurope Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (Preview)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
westindia Není podporováno Není podporováno Není podporováno
westus Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (Preview)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
westus2 Podporují se následující modely:
Podporují se následující modely:
  • Pro odvozování v reálném čase se podporují následující rodiny modelů:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (Preview)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (angličtina)
    • BGE v1.5 (angličtina)
westus3 Podporují se následující modely:
Není podporováno Není podporováno

⥂ Tento model je podporovaný na základě dostupnosti GPU a vyžaduje povolení směrování napříč geografickými oblastmi.

základních modelů Accessu hostovaných mimo Databricks

Základní modely vytvořené poskytovateli LLM, jako jsou OpenAI a Anthropic, jsou také přístupné v Databricks pomocí externích modelů. Tyto modely jsou hostované mimo Databricks a můžete vytvořit koncový bod pro jejich dotazování. Tyto koncové body se dají centrálně řídit z Azure Databricks, což zjednodušuje používání a správu různých poskytovatelů LLM ve vaší organizaci.

Následující tabulka uvádí seznam podporovaných modelů a odpovídajících typů koncových bodů . Pomocí uvedených přidružení modelů můžete nakonfigurovat koncový bod pro všechny nově vydané typy modelů, jakmile budou dostupné u daného poskytovatele. Zákazníci nesou odpovědnost za zajištění souladu s platnými licencemi modelu.

Poznámka

Díky rychlému vývoji LLM není zaručeno, že je tento seznam neustále aktuální. Nové verze modelu od stejného poskytovatele se obvykle podporují i v případě, že nejsou v seznamu.

Zprostředkovatel modelů llm/v1/doplnění llm/v1/chat llm/v1/embeddings
OpenAI**
  • gpt-3.5-turbo-instruct
  • babbage-002
  • Davinci-002
  • o1
  • o1-mini
  • o1-mini-2024-09-12
  • gpt-3.5-turbo
  • gpt-4
  • gpt-4-turbo
  • gpt-4-turbo-2024-04
  • gpt-4o
  • gpt-4o-2024-05-13
  • gpt-4o-mini
  • text-embedding-ada-002
  • vložení-textu-3-velké
  • textové zapouzdření-3-malé
Azure OpenAI**
  • text-davinci-003
  • gpt-35-turbo-instruct
  • o1
  • o1-mini
  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-4
  • gpt-4-turbo
  • gpt-4-32k
  • gpt-4o
  • gpt-4o-mini
  • text-embedding-ada-002
  • vložení-textu-3-velké
  • textové zapouzdření-3-malé
Antropický
  • claude-1
  • claude-1.3-100k
  • claude-2
  • claude-2.1
  • claude-2.0
  • claude-instant-1.2
  • claude-3-5-sonnet-latest
  • claude-3-5-haiku-nejnovější
  • claude-3-5-opus-nejnovější
  • claude-3-5-sonnet-20241022
  • claude-3-5-haiku-20241022
  • claude-3-5-sonnet-20240620
  • claude-3-haiku-20240307
  • claude-3-opus-20240229
  • claude-3-sonnet-20240229
Cohere
  • příkaz
  • světlo příkazu
  • command-r7b-12-2024
  • command-r-plus-08-2024
  • příkaz-r-08-2024
  • Command-R-plus
  • příkaz-R
  • příkaz
  • příkaz nočního světla
  • světlo příkazu
  • příkaz -noční
  • vložit-anglicky-v2.0
  • embed-multilingual-v2.0
  • embed-anglický-light-v2.0
  • embed-english-v3.0
  • embed-english-light-v3.0
  • embed-multilingual-v3.0
  • embed-multilingual-light-v3.0
Model umělé inteligence Mosaic pro nasazení Koncový bod služby Databricks Koncový bod služby Databricks Koncový bod služby Databricks
Amazon Bedrock Anthropic:
  • claude-instant-v1
  • claude-v2

Spojit se!
  • command-text-v14
  • command-light-text-v14

Testovací prostředí AI21:
  • j2-grande-instruct
  • j2-jumbo-instruct
  • j2–mid
  • j2-mid-v1
  • j2-ultra
  • j2-ultra-v1
Anthropic:
  • claude-3-5-sonnet-20241022-v2:0
  • claude-3-5-haiku-20241022-v1:0
  • claude-3-opus-20240229-v1:0
  • claude-3-sonnet-20240229-v1:0
  • claude-3-5-sonnet-20240620-v1:0

Spojit se!
  • command-r-plus-v1:0
  • command-r-v1:0

Amazonka:
  • nova-lite-v1:0
  • nova-micro-v1:0
  • nova-pro-v1:0
Amazonka:
  • titan-embed-text-v2:0
  • titan-embed-text-v1
  • titan-embed-g1-text-02

Spojit se!
  • embed-english-v3
  • embed-multilingual-v3
Testovací prostředí AI21
  • j2–mid
  • j2-light
  • j2-ultra
Google Cloud Vertex AI text-bizon
  • chat-bison
  • gemini-pro
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-flash
  • gemini-2.0-flash
  • text-embedding-004
  • text-embedding-005
  • textové vkládání-gecko

poskytovatel modelů ** podporuje jemně vyladěné modely dokončování a chatu. Pokud chcete dotazovat jemně vyladěný model, vyplňte pole name konfigurace external model názvem jemně vyladěného modelu.

Zprostředkovatel modelů podporuje vlastní modely dokončování.

Vytvořte koncové body pro obsluhu základního modelu

Pokud chcete dotazovat a používat základní modely v aplikacích AI, musíte nejprve vytvořit koncový bod obsluhy modelu. Obsluha modelů používá jednotné rozhraní API a uživatelské rozhraní k vytváření a aktualizaci základních modelů obsluhujících koncové body.

Dotazování na koncové body obsluhující základní model

Po vytvoření koncového bodu obsluhy se můžete dotazovat na výchozí model. Obsluha modelů používá pro dotazování základních modelů sjednocené rozhraní API kompatibilní s OpenAI a sadou SDK. Toto jednotné prostředí zjednodušuje experimentování se základními modely pro produkční prostředí napříč podporovanými cloudy a poskytovateli.

Viz Použití základních modelů.