Dela via


Grundmodeller som stöds på Mosaic AI Model Serving

Den här artikeln beskriver de grundläggande modeller som du kan använda med Mosaic AI Model Serving.

Grundmodeller är stora, förtränade neurala nätverk som tränas på både stora och breda dataintervall. Dessa modeller är utformade för att lära sig allmänna mönster i språk, bilder eller andra datatyper och kan finjusteras för specifika uppgifter med ytterligare utbildning. Din användning av vissa grundmodeller omfattas av modellutvecklarens licens och acceptabla användningsprincip. Se Tillämpliga licenser och villkor för modellutvecklare.

Modellhantering erbjuder flexibla alternativ för att hantera och ställa frågor till grundmodeller baserat på dina behov.

  • Betala per token: Perfekt för experimentering och snabb utforskning. Med det här alternativet kan du köra frågor mot förkonfigurerade slutpunkter på din Databricks-arbetsyta utan åtaganden om infrastruktur i förväg.
  • AI Functions (batch-slutsatsdragning): En delmängd av Databricks-värdbaserade modeller är optimerade för AI Functions. Du kan tillämpa AI på dina data och köra produktionsarbetsbelastningar för batch-inferens i stor skala med hjälp av dessa funktioner och deras stödda modeller.
  • Provisionerat genomflöde: Rekommenderas för användningar i produktion som kräver prestandagarantier. Med det här alternativet kan du distribuera finjusterade grundmodeller med optimerade serverslutpunkter.
  • Externa modeller: Det här alternativet ger åtkomst till grundläggande modeller som finns utanför Databricks, till exempel de som tillhandahålls av OpenAI eller Anthropic. Dessa modeller kan hanteras centralt i Databricks för effektiv styrning.

Foundation-modeller som finns på Databricks

Databricks är värd för toppmoderna öppna grundmodeller, till exempel Meta Llama. Dessa modeller görs tillgängliga genom Foundation Model API:er.

I följande tabell sammanfattas modeller som är värdbaserade på Databricks och modellfamiljer som stöds i varje region baserat på modelltjänsten.

Viktig

  • Antropiska Claude Opus 4.5 finns på globala slutpunkter och kräver att routning mellan geografiska områden aktiveras för varje region.

  • Antropiska Claude 3.7 Sonnet går i pension den 10 mars 2026. Se Tillbakadragna modeller för den rekommenderade ersättningsmodellen och vägledning om hur du migrerar under utfasningsperioden.

  • Meta Llama 4 Maverick är tillgängligt för Foundation Model API:er med förberedd datagenomströmning för arbetsbelastningar i offentlig förhandsgranskning.

  • Från och med den 11 december 2024 ersätter Meta-Llama-3.3-70B-Instruct stödet för Meta-Llama-3.1-70B-Instruct i Foundation Model API:ers betalning per token-slutpunkter.

  • Meta-Llama-3.1-405B-Instruct är den största öppet tillgängliga, toppmoderna stora språkmodellen som skapats och tränats av Meta och distribuerats av Azure Machine Learning med hjälp av AzureML-modellkatalogen.

    • Från och med den 15 februari 2026 kommer Meta-Llama-3.1-405B-Instruct att dras tillbaka för belastningar med betalning per token.
    • Från och med 15 maj 2026 fasas Meta-Llama-3.1-405B-Instruct ut för specifika genomströmningsarbetsbelastningar.
    • Se Tillbakadragna modeller för den rekommenderade ersättningsmodellen och vägledning om hur du migrerar under utfasningsperioden.
  • Från och med den 15 februari 2026 dras de modeller som är associerade med följande modellfamiljer tillbaka och är inte längre tillgängliga för användning i något av funktionsområdena modellservering. Se Tillbakadragna modeller för rekommenderade ersättningsmodeller och vägledning för hur du migrerar under utfasningen.

    • Llama 3 70B
    • Llama 3 8B
    • Llama 2 70B
    • Llama 2 13B
    • Mistral 8x7B
    • Mixtral 8x7B
  • Från och med den 19 december 2025 dras de modeller som är associerade med följande modellfamiljer tillbaka och är inte längre tillgängliga för användning i något av funktionsområdena Modellservering. Se Tillbakadragna modeller för rekommenderade ersättningsmodeller och vägledning för hur du migrerar under utfasningen.

    • DBRX
    • MPT 30B
    • MPT 7B
Region Foundation Model-API:er betalar per token AI Functions (batchinferens) Foundation Model API:er med tilldelat dataflöde
australiacentral Stöds inte Stöds inte Stöds inte
australiacentral2 Stöds inte Stöds inte Stöds inte
australiaeast Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick (förhandsversion)*
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
australiasoutheast Stöds inte Stöds inte Stöds inte
brazilsouth Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
canadacentral Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
canadaeast Stöds inte Stöds inte Stöds inte
centralindia Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
centralus Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
chinaeast2 Stöds inte Stöds inte Stöds inte
chinaeast3 Stöds inte Stöds inte Stöds inte
chinanorth2 Stöds inte Stöds inte Stöds inte
chinanorth3 Stöds inte Stöds inte Stöds inte
eastasia Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
eastus Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
eastus2 Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
francecentral Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
germanywestcentral Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
japaneast Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
japanwest Stöds inte Stöds inte Stöds inte
koreacentral Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick*
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
mexicocentral Stöds inte Stöds inte Stöds inte
northcentralus Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
northeurope Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
norwayeast Stöds inte Stöds inte Stöds inte
qatarcentral Stöds inte Stöds inte Stöds inte
southafricanorth Stöds inte Stöds inte Stöds inte
southcentralus Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
southeastasia Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
southindia Stöds inte Stöds inte Stöds inte
swedencentral Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
switzerlandnorth Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
switzerlandwest Stöds inte Stöds inte Stöds inte
uaenorth Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
uksouth Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B*
    • OpenAI GPT OSS 20B*
    • Google Gemma 3 12B*
    • Meta Llama 4 Maverick* (förhandsversion)
    • Meta Llama 3.3*
    • Meta Llama 3.2 3B*
    • Meta Llama 3.2 1B*
    • Meta Llama 3.1*
    • GTE v1.5 (engelska)*
    • BGE v1.5 (engelska)*
ukwest Stöds inte Stöds inte Stöds inte
westcentralus Stöds inte Stöds inte Stöds inte
westeurope Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
westindia Stöds inte Stöds inte Stöds inte
westus Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
westus2 Följande modeller stöds:
Följande modeller stöds:
  • Följande modellfamiljer stöds för slutsatsdragning i realtid:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (förhandsversion)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE v1.5 (engelska)
    • BGE v1.5 (engelska)
westus3 Stöds inte Stöds inte Stöds inte

* Den här modellen stöds baserat på GPU-tillgänglighet och kräver att routning mellan geografiska områden är aktiverad.

Access Foundation-modeller som finns utanför Databricks

Grundmodeller som skapats av LLM-leverantörer, till exempel OpenAI och Anthropic, är också tillgängliga på Databricks med hjälp av externa modeller. Dessa modeller finns utanför Databricks och du kan skapa en slutpunkt för att fråga dem. Dessa slutpunkter kan styras centralt från Azure Databricks, vilket effektiviserar användningen och hanteringen av olika LLM-leverantörer i din organisation.

I följande tabell visas en icke-fullständig lista över modeller som stöds och motsvarande slutpunktstyper. Du kan använda de listade modellassociationerna för att hjälpa dig att konfigurera en slutpunkt för alla nyligen släppta modelltyper när de blir tillgängliga med en viss leverantör. Kunderna ansvarar för att säkerställa efterlevnaden av tillämpliga modelllicenser.

Obs

Med den snabba utvecklingen av LLM:er finns det ingen garanti för att listan är uppdaterad hela tiden. Nya modellversioner från samma provider stöds vanligtvis även om de inte finns med i listan.

Modellprovider llm/v1/completions llm/v1/chat llm/v1/inbäddningar
OpenAI**
  • gpt-3.5-turbo-instruct
  • babbage-002
  • davinci-002
  • o1
  • o1-mini
  • o1-mini-2024-09-12
  • gpt-3.5-turbo
  • gpt-4
  • gpt-4-turbo
  • gpt-4-turbo-2024-04
  • gpt-4o
  • gpt-4o-2024-05-13
  • gpt-4o-mini
  • text-embedding-ada-002
  • text-inbäddning-3-stor
  • text-inbäddning-3-liten
Azure OpenAI**
  • text-davinci-003
  • gpt-35-turbo-instruct
  • o1
  • o1-mini
  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-4
  • gpt-4-turbo
  • gpt-4-32k
  • gpt-4o
  • gpt-4o-mini
  • text-embedding-ada-002
  • text-inbäddning-3-stor
  • text-inbäddning-3-liten
Människoorienterad
  • claude-1
  • claude-1.3-100k
  • claude-2
  • claude-2.1
  • claude-2.0
  • claude-instant-1.2
  • claude-3-5-sonnet-latest
  • claude-3-5-haiku-latest
  • claude-3-5-opus-senaste
  • claude-3-5-sonnet-20241022
  • claude-3-5-haiku-20241022
  • claude-3-5-sonnet-20240620
  • claude-3-haiku-20240307
  • claude-3-opus-20240229
  • claude-3-sonnet-20240229
Cohere**
  • kommando
  • kommandolampa
  • command-r7b-12-2024
  • command-r-plus-08-2024
  • kommando-r-08-2024
  • Kommando-R-plus
  • kommando-R
  • kommando
  • kommando-ljus-nattlig
  • kommandolampa
  • command-nightly
  • embed-english-v2.0
  • embed-multilingual-v2.0
  • embed-english-light-v2.0
  • bädda-in-engelska-v3.0
  • embed-english-light-v3.0
  • inbädda-flerspråkig-v3.0
  • embed-multilingual-light-v3.0
Mosaiks AI-modelltjänstgöring Databricks-serverslutpunkt Databricks-serverslutpunkt Databricks-serverslutpunkt
** Amazon Bedrock Antropisk:
  • claude-instant-v1
  • claude-v2

Hålla samman
  • command-text-v14
  • command-light-text-v14

AI21 Labs:
  • j2-grande-instruct
  • j2-jumbo-instruct
  • j2-mid
  • j2-mid-v1
  • j2-ultra
  • j2-ultra-v1
Antropisk:
  • claude-3-5-sonnet-20241022-v2:0
  • claude-3-5-haiku-20241022-v1:0
  • claude-3-opus-20240229-v1:0
  • claude-3-sonnet-20240229-v1:0
  • claude-3-5-sonnet-20240620-v1:0

Hålla samman
  • command-r-plus-v1:0
  • command-r-v1:0

Amason:
  • nova-lite-v1:0
  • nova-micro-v1:0
  • nova-pro-v1:0
Amason:
  • titan-embed-text-v2:0
  • titan-embed-text-v1
  • titan-embed-g1-text-02

Hålla samman
  • bädda-in-engelska-v3
  • embed-multilingual-v3
AI21 Labs
  • j2-mid
  • j2-ljus
  • j2-ultra
Google Cloud Vertex AI text-bison
  • chatbison
  • gemini-pro
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-flash
  • gemini-2.0-flash
  • text-embedding-004
  • text-embedding-005
  • textinbäddning-gecko

** Modellleverantören stöder anpassade slutförande- och chattmodeller. Om du vill köra frågor mot en finjusterad modell fyller du i fältet name i external model-konfigurationen med namnet på din finjusterade modell.

Modellprovidern stöder anpassade slutförandemodeller.

Skapa basmodell som betjänar slutpunkter

Om du vill köra frågor mot och använda grundmodeller i dina AI-program måste du först skapa en modell som betjänar slutpunkten. Modellservern använder ett enhetligt API och användargränssnitt för att skapa och uppdatera basmodell som betjänar slutpunkter.

Frågegrundsmodell som betjänar slutpunkter

När du har skapat din tjänsteslutpunkt kan du fråga din grundmodell. Modellservern använder ett enhetligt OpenAI-kompatibelt API och SDK för att köra frågor mot grundmodeller. Den här enhetliga upplevelsen förenklar hur du experimenterar med och anpassar grundmodeller för produktion i moln och leverantörer som stöds.

Se Använda grundmodeller.