Támogatott alapmodellek a Mozaik AI-modell-szolgáltatásban

Ez a cikk a Mozaik AI-modell-szolgáltatással kiszolgálható alapmodelleket ismerteti.

Az alapmodellek nagy, előre betanított neurális hálózatok, amelyek nagy és széles körű adatbázisokon készültek fel. Ezek a modellek úgy lettek kialakítva, hogy általános mintákat tanuljanak a nyelv, a képek vagy más adattípusok esetében, és további betanításokkal finomhangolhatók adott feladatokhoz. Bizonyos alapmodellek használatára a modell feltételei és elfogadható használati szabályzata vonatkozik. Lásd : Vonatkozó modellfeltételek.

A Modellszolgáltatás rugalmas lehetőségeket kínál az alapmodellek üzemeltetésére és lekérdezésére az igényeinek megfelelően:

  • Pay-per-token: Ideális kísérletezéshez és gyors feltáráshoz. Ezzel a beállítással előre konfigurált végpontokat kérdezhet le a Databricks-munkaterületen előzetes infrastruktúra-kötelezettségvállalások nélkül.
  • AI-függvények (kötegelt következtetés): A Databricks által üzemeltetett modellek egy része az AI Functionsre van optimalizálva. A mesterséges intelligenciát alkalmazhatja az adataira, és nagy léptékben futtathat kötegelt következtetési feladatokat ezekkel a függvényekkel és az általuk támogatott modellekkel.
  • Kiosztott átviteli sebesség: Teljesítménygaranciát igénylő éles használat esetén ajánlott. Ez a beállítás lehetővé teszi a finomhangolt alapmodellek üzembe helyezését optimalizált kiszolgáló végpontokkal.
  • Külső modellek: Ez a beállítás hozzáférést biztosít a Databricksen kívül üzemeltetett alapmodellekhez, például az OpenAI vagy az antropikus modellekhez. Ezek a modellek központilag kezelhetők a Databricksben az egyszerűbb szabályozás érdekében.

A Databricksen üzemeltetett alapmodellek

A Databricks a legmodernebb nyílt alapmodelleket üzemelteti, például a Meta Llama-t. Ezek a modellek foundation model API-k használatával érhetők el.

Az alábbi táblázat összefoglalja, hogy mely Databricks által üzemeltetett modellek és modellcsaládok támogatottak az egyes régiókban a Modellkiszolgáló funkció alapján.

Fontos

  • Antropikus Claude 3.7 Sonnet már nem érhető el. Kérjük, tekintse meg a kivezetett modelleket az ajánlott cseremodell megtekintéséhez és útmutatást ahhoz, hogyan hajthatja végre az átállást az elavulás során.
  • A Meta Llama 4 Maverick elérhető a Foundation Model API-k kiosztott áteresztőképességi munkaterheléseihez Nyilvános előzetes verzióban.
  • A Meta-Llama-3.1-405B-Instruct már nem érhető el a tokenenkénti fizetéses számítási feladatokhoz. 2026. május 15-től a kiosztott átviteli sebesség számítási feladatai is megszűnnek. Kérjük, tekintse meg a kivezetett modelleket az ajánlott cseremodell megtekintéséhez és útmutatást ahhoz, hogyan hajthatja végre az átállást az elavulás során.
  • Számos régebbi modellcsaládot kivontak. A kivezetett modellek és a javasolt cserék teljes listájáért tekintse meg a kivezetett modelleket.
Régió Alapmodell API-k, fizetés tokenenként AI-funkciók (kötegelt következtetés) Alapmodell API-k kiosztott átviteli sebessége
australiacentral Nem támogatott Nem támogatott Nem támogatott
australiacentral2 Nem támogatott Nem támogatott Nem támogatott
australiaeast A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)⥂
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
australiasoutheast Nem támogatott Nem támogatott Nem támogatott
brazilsouth A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick⥂ (előzetes verzió)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B⥂
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angol)⥂
    • BGE v1.5 (angol)⥂
canadacentral A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick⥂ (előzetes verzió)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B⥂
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angol)⥂
    • BGE v1.5 (angol)⥂
canadaeast Nem támogatott Nem támogatott Nem támogatott
centralindia A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick⥂ (előzetes verzió)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B⥂
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angol)⥂
    • BGE v1.5 (angol)⥂
centralus A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
chinaeast2 Nem támogatott Nem támogatott Nem támogatott
chinaeast3 Nem támogatott Nem támogatott Nem támogatott
chinanorth2 Nem támogatott Nem támogatott Nem támogatott
chinanorth3 Nem támogatott Nem támogatott Nem támogatott
eastasia A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick⥂ (előzetes verzió)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B⥂
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angol)⥂
    • BGE v1.5 (angol)⥂
eastus A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
eastus2 A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
francecentral A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
germanywestcentral A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
japaneast A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick⥂ (előzetes verzió)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B⥂
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angol)⥂
    • BGE v1.5 (angol)⥂
japanwest Nem támogatott Nem támogatott Nem támogatott
koreacentral A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick⥂
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B⥂
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
mexicocentral Nem támogatott Nem támogatott Nem támogatott
northcentralus A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
northeurope A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
norwayeast Nem támogatott Nem támogatott Nem támogatott
qatarcentral Nem támogatott Nem támogatott Nem támogatott
southafricanorth Nem támogatott Nem támogatott Nem támogatott
southcentralus A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
southeastasia A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick⥂ (előzetes verzió)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B⥂
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angol)⥂
    • BGE v1.5 (angol)⥂
southindia Nem támogatott Nem támogatott Nem támogatott
swedencentral A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
switzerlandnorth A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
switzerlandwest Nem támogatott Nem támogatott Nem támogatott
uaenorth A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick⥂ (előzetes verzió)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B⥂
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angol)⥂
    • BGE v1.5 (angol)⥂
uksouth A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B⥂
    • OpenAI GPT OSS 20B⥂
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick⥂ (előzetes verzió)
    • Meta Llama 3.3⥂
    • Meta Llama 3.2 3B⥂
    • Meta Llama 3.2 1B⥂
    • Meta Llama 3.1⥂
    • GTE v1.5 (angol)⥂
    • BGE v1.5 (angol)⥂
ukwest Nem támogatott Nem támogatott Nem támogatott
westcentralus Nem támogatott Nem támogatott Nem támogatott
westeurope A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
westindia Nem támogatott Nem támogatott Nem támogatott
westus A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
westus2 A következő modellek támogatottak:
A következő modellek támogatottak:
  • A valós idejű következtetéshez a következő modellcsaládok támogatottak:
    • OpenAI GPT OSS 120B
    • OpenAI GPT OSS 20B
    • Google Gemma 3 12B
    • Meta Llama 4 Maverick (előzetes verzió)
    • Meta Llama 3.3
    • Meta Llama 3.2 3B
    • Meta Llama 3.2 1B
    • Meta Llama 3.1
    • GTE 1.5-ös verzió (angol)
    • BGE 1.5-ös verzió (angol)
westus3 A következő modellek támogatottak:
Nem támogatott Nem támogatott

⥂ Ez a modell a GPU rendelkezésre állása alapján támogatott, és engedélyezni kell a földrajzi távolságok közötti útválasztást.

Databricksen kívül üzemeltetett Access alapmodellek

Az OLYAN LLM-szolgáltatók által létrehozott alapmodellek, mint az OpenAI és az antropikus, külső modelleket használó Databricksben is elérhetők. Ezek a modellek a Databricksen kívül vannak üzemeltetve, és létrehozhat egy végpontot a lekérdezéshez. Ezek a végpontok központilag szabályozhatók a Azure Databricks, ami leegyszerűsíti a szervezeten belüli különböző LLM-szolgáltatók használatát és kezelését.

Az alábbi táblázat a támogatott modellek és a megfelelő végponttípusok nem teljes listáját mutatja be. A felsorolt modelltársításokkal konfigurálhatja, hogy végpontként szolgáljon az újonnan kiadott modelltípusokhoz, amint azok elérhetővé válnak egy adott szolgáltatónál. Az ügyfelek felelősek az alkalmazandó modelllicencek megfelelőségének biztosításáért.

Megjegyzés

Az LLM-ek gyors fejlődésével nincs garancia arra, hogy ez a lista mindig naprakész. Az azonos szolgáltatótól származó új modellverziók általában akkor is támogatottak, ha nem szerepelnek a listán.

Modellszolgáltató llm/v1/completions llm/v1/chat llm/v1/beágyazások
OpenAI**
  • gpt-3.5-turbo-instruct
  • babbage-002
  • davinci-002
  • o1
  • o1-mini
  • o1-mini-2024-09-12
  • gpt-3.5-turbo
  • gpt-4
  • gpt-4-turbo
  • gpt-4-turbo-2024-04
  • gpt-4o
  • gpt-4o-2024-05-13
  • gpt-4o-mini
  • text-embedding-ada-002
  • szöveg-beágyazás-3-nagy
  • szöveg-beágyazás-3-kicsi
Azure OpenAI**
  • text-davinci-003
  • gpt-35-turbo-instruct
  • o1
  • o1-mini
  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-4
  • gpt-4-turbo
  • gpt-4-32k
  • gpt-4o
  • gpt-4o-mini
  • text-embedding-ada-002
  • szöveg-beágyazás-3-nagy
  • szöveg-beágyazás-3-kicsi
Antropikus
  • claude-1
  • claude-1.3-100k
  • claude-2
  • claude-2.1
  • claude-2.0
  • claude-instant-1.2
  • claude-3-5-sonnet-latest
  • claude-3-5-haiku-legújabb
  • claude-3-5-opus-legújabb
  • claude-3-5-sonnet-20241022
  • claude-3-5-haiku-20241022
  • claude-3-5-sonnet-20240620
  • claude-3-haiku-20240307
  • claude-3-opus-20240229
  • claude-3-sonnet-20240229
Cohere**
  • parancs
  • utasításjelző fény
  • command-r7b-12-2024
  • command-r-plus-08-2024
  • parancs-r-08-2024
  • Command-R-plus
  • parancs-r
  • parancs
  • parancs-fény-éjszakai
  • utasításjelző fény
  • parancs-éjszakai
  • beágyaz-angol-v2.0
  • beágyaz-többnyelvű-v2.0
  • embed-english-light-v2.0
  • embed-english-v3.0
  • embed-english-light-v3.0
  • beágyazás-többnyelvű-v3.0
  • beágyaz-többnyelvű-light-v3.0
Mozaik AI-modell kiszolgálása Databricks kiszolgálási végpont Databricks kiszolgálási végpont Databricks kiszolgálási végpont
Amazon Bedrock Antropikus:
  • claude-instant-v1
  • claude-v2

Közösen:
  • parancs-szöveg-v14
  • parancs-világos-szöveg-v14

AI21 Labs:
  • j2-grande-instruct
  • j2-jumbo-instruct
  • j2-közép
  • j2-mid-v1
  • j2-ultra
  • j2-ultra-v1
Antropikus:
  • claude-3-5-sonnet-20241022-v2:0
  • claude-3-5-haiku-20241022-v1:0
  • claude-3-opus-20240229-v1:0
  • claude-3-sonnet-20240229-v1:0
  • claude-3-5-sonnet-20240620-v1:0

Közösen:
  • command-r-plus-v1:0
  • command-r-v1:0

Amazon:
  • nova-lite-v1:0
  • nova-micro-v1:0
  • nova-pro-v1:0
Amazon:
  • titan-beágyaz-szöveg-v2:0
  • titan-embed-text-v1
  • titan-embed-g1-text-02

Közösen:
  • beágyazás-angol-v3
  • beágyaz-multinyelvű-v3
AI21 Labs
  • j2-közép
  • j2-light
  • j2-ultra
Google Cloud Vertex AI text-bison
  • csevegő Bison
  • gemini-pro
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-flash
  • gemini-2.0-flash
  • text-embedding-004
  • text-embedding-005
  • szövegbeágyazás-gecko

** modellszolgáltató támogatja a finomhangolt befejezési és csevegési modelleket. Egy finomhangolt modell lekérdezéséhez töltse ki a name konfiguráció external model mezőjét a finomhangolt modell nevével.

A modell szolgáltató támogatja az egyéni kiegészítő modelleket.

Végpontokat kiszolgáló alapmodell létrehozása

Az AI-alkalmazások alapmodelljeinek lekérdezéséhez és használatához először létre kell hoznia egy végpontot kiszolgáló modellt. A Modellkiszolgáló egységes API-t és felhasználói felületet használ a végpontokat kiszolgáló alapmodell létrehozásához és frissítéséhez.

Végpontokat kiszolgáló lekérdezési alapmodell

A kiszolgálóvégpont létrehozása után lekérdezheti az alapmodellt. A Modellkiszolgáló egységes OpenAI-kompatibilis API-t és SDK-t használ az alapmodellek lekérdezéséhez. Ez az egységes élmény leegyszerűsíti, hogyan kísérletezhet és szabhat testre alapmodelleket a termelési környezethez a támogatott felhők és szolgáltatók között.

Lásd: Alapmodellek használata.