Databricks alapmodell API-k
Ez a cikk áttekintést nyújt az Azure Databricks alapmodell API-jairól. Tartalmazza a használati követelményeket, a támogatott modelleket és a korlátozásokat.
Mik azok a Databricks Foundation-modell API-k?
A Mozaik AI-modellmegjelenítés mostantól támogatja az alapmodell API-kat, amelyek lehetővé teszik a korszerű nyitott modellek elérését és lekérdezését egy kiszolgáló végpontról. Az Alapmodell API-kkal gyorsan és egyszerűen hozhat létre olyan alkalmazásokat, amelyek kiváló minőségű, generatív AI-modellt használnak anélkül, hogy fenntartanák a saját modell üzembe helyezését. Az Alapmodell API-k egy Databricks-kijelölt szolgáltatás, amely azt jelenti, hogy a Databricks Geos használatával kezeli az adatok tartózkodási helyét az ügyféltartalmak feldolgozásakor.
Az Alapmodell API-k két díjszabási módban érhetők el:
- Pay-per-token: Ez a legegyszerűbb módja annak, hogy megkezdje az alapmodellek elérését a Databricksen, és ajánlott az alapmodell API-kkal való utazás megkezdéséhez. Ez a mód nem nagy átviteli sebességű alkalmazásokhoz vagy nagy teljesítményű éles számítási feladatokhoz készült.
- Kiosztott átviteli sebesség: Ez a mód minden éles számítási feladathoz ajánlott, különösen azokhoz, amelyek magas átviteli sebességet, teljesítménygaranciát, finomhangolt modelleket vagy további biztonsági követelményeket igényelnek. A kiépített átviteli sebesség végpontjai olyan megfelelőségi tanúsítványokkal érhetők el, mint a HIPAA.
A két mód és a támogatott modellek használatára vonatkozó útmutatásért tekintse meg az Alapmodell API-k használatát ismertető cikket.
Az Alapmodell API-kkal a következőt teheti:
- Lekérdezhet egy általánosított LLM-et a projekt érvényességének ellenőrzéséhez, mielőtt további erőforrásokat fektet be.
- Lekérdezhet egy általánosított LLM-et, hogy gyors megvalósíthatósági igazolást hozzon létre egy LLM-alapú alkalmazáshoz, mielőtt betanítanának és üzembe helyeznének egy egyéni modellt.
- Használjon alapmodellt és vektoradatbázist egy csevegőrobot létrehozásához a lekéréses kiterjesztett generáció (RAG) használatával.
- Cserélje le a védett modelleket nyílt alternatívákra a költségek és a teljesítmény optimalizálása érdekében.
- Hatékonyan hasonlítsa össze az LLM-eket, hogy lássa, melyik a legjobb jelölt a használati esethez, vagy felcserélhet egy éles modellt egy jobb teljesítményűre.
- Olyan, skálázható, SLA-alapú LLM-kiszolgáló megoldáson alapuló, fejlesztésre vagy éles használatra készült LLM-alkalmazás létrehozása, amely támogatja az éles forgalom csúcsait.
Követelmények
- Databricks API-jogkivonat a végpontkérelmek hitelesítéséhez.
- Kiszolgáló nélküli számítás (kiépített átviteli sebességmodellekhez).
- Munkaterület egy támogatott régióban:
Feljegyzés
A DBRX-alapmodellt használó kiosztott átviteli sebesség számítási feladataiért tekintse meg az alapmodell API-jainak a régió rendelkezésre állására vonatkozó korlátait .
Alapmodell API-k használata
Az alapmodell API-k használatára több lehetősége is van.
Az API-k kompatibilisek az OpenAI-val, így az OpenAI-ügyfelet használhatja a lekérdezéshez. A támogatott modellek lekérdezéséhez használhatja a felhasználói felületet, az Foundation Models API-kat, a Python SDK-t, az MLflow Deployments SDK-t vagy a REST API-t is. A Databricks az OpenAI ügyféloldali SDK-t vagy API-t javasolja a kiterjesztett interakciókhoz, valamint a felhasználói felületet a funkció kipróbáláshoz.
Példák pontozásához tekintse meg a lekérdezésgeneratív AI-modelleket .
Jogkivonatonkénti fizetéses alapmodell API-k
A jogkivonatonkénti fizetéses modellek elérhetők az Azure Databricks-munkaterületen, és ajánlott az első lépésekhez. A munkaterületen való hozzáféréshez lépjen a bal oldali oldalsáv Kiszolgálás lapjára. Az Alapmodell API-k a Végpontok listanézet tetején találhatók.
Az alábbi táblázat összefoglalja a jogkivonatonkénti fizetés támogatott modelljeit. További modellinformációkért tekintse meg a jogkivonatonkénti fizetés támogatott modelljeit.
Ha tesztelni és csevegni szeretne ezekkel a modellekkel, ezt az AI Playground használatával teheti meg. Lásd: Csevegés LLM-ekkel és GenAI-alkalmazások prototípusával az AI Playground használatával.
Fontos
- 2024. július 23-tól a Meta-Llama-3.1-70B-Instruct a Meta-Llama-3-70B-Instruct in Foundation Model API-k tokenenkénti fizetéses végpontjainak támogatását váltja fel.
- A Meta-Llama-3.1-405B-Instruct a legnagyobb, nyíltan elérhető, a meta által készített és betanított, az Azure Machine Learning által az AzureML-modellkatalógussal elosztott, nyíltan elérhető, modern, nagy nyelvi modell.
- A következő modellek kivonásra kerülnek. Az ajánlott cseremodellekért tekintse meg a kivezetett modelleket .
- Llama 2 70B csevegés
- MPT 7B utasítás
- MPT 30B utasítás
Modell | Tevékenység típusa | Végpont | Jegyzetek |
---|---|---|---|
GTE Large (angol) | Beágyazás | databricks-gte-large-en |
Nem hoz létre normalizált beágyazásokat. |
Meta-Llama-3.1-70B-Instruct | Csevegés | databricks-meta-llama-3-1-70b-instruct |
|
Meta-Llama-3.1-405B-Instruct* | Csevegés | databricks-meta-llama-3-1-405b-instruct |
Tekintse meg az alapmodell API-k régióhoz való elérhetőségére vonatkozó korlátozásait . |
DBRX-utasítások | Csevegés | databricks-dbrx-instruct |
Tekintse meg az alapmodell API-k régióhoz való elérhetőségére vonatkozó korlátozásait . |
Mixtral-8x7B utasítás | Csevegés | databricks-mixtral-8x7b-instruct |
Tekintse meg az alapmodell API-k régióhoz való elérhetőségére vonatkozó korlátozásait . |
BGE Large (angol) | Beágyazás | databricks-bge-large-en |
Tekintse meg az alapmodell API-k régióhoz való elérhetőségére vonatkozó korlátozásait . |
*
Ha végponthibákat vagy stabilizálási hibákat tapasztal a modell használatakor, forduljon a Databricks-fiók csapatához.
- Az alapmodell API-k lekérdezésével kapcsolatos útmutatásért tekintse meg a lekérdezésgeneratív AI-modelleket .
- Tekintse meg az alapmodell REST API-referenciáit a szükséges paraméterekkel és szintaxissal kapcsolatban.
Kiosztott átviteli sebesség foundation model API-k
A kiosztott átviteli sebesség optimalizált következtetést biztosít az alapmodell számítási feladataihoz, amelyek teljesítménygaranciát igényelnek. A Databricks a kiosztott átviteli sebességet javasolja az éles számítási feladatokhoz. Az alapmodell API-k üzembe helyezéséről részletes útmutatót talál a kiépített átviteli sebesség foundation modell API-iról.
A kiépített átviteli sebesség támogatása a következőket tartalmazza:
- Alapmodellek minden méretben, például DBRX Base. Az alapmodellek a Databricks Marketplace-en érhetők el, vagy letöltheti őket az Ölelés arcról vagy egy másik külső forrásból, és regisztrálhatja őket a Unity katalógusban. Az utóbbi megközelítés a támogatott modellek bármely finomhangolt változatával működik, függetlenül az alkalmazott finomhangolási módszertől.
- Az alapmodellek finomhangolt változatai, például a LlamaGuard-7B. Ide tartoznak a védett adatokra finomhangolt modellek.
- Teljesen egyéni súlyok és tokenizerek, például az alapoktól betanított vagy az alapmodell architektúráját (például CodeLlama) használó folyamatos előre betanított vagy egyéb változatok.
Az alábbi táblázat a kiosztott átviteli sebesség támogatott modellarchitektúráit foglalja össze.
Fontos
A Meta Llama 3.2 licenccel rendelkezik a LLAMA 3.2 közösségi licenc, Copyright © Meta Platformok, Inc. Minden jog fenntartva. Az ügyfelek felelősek azért, hogy megfeleljenek a licenc feltételeinek és a Llama 3.2 elfogadható használati szabályzatának.
A Meta Llama 3.1 licenccel rendelkezik a LLAMA 3.1 közösségi licenc, copyright © metaplatformok, Inc. Minden jog fenntartva. Az ügyfelek felelősek az alkalmazandó modelllicencek megfelelőségének biztosításáért.
Modellarchitektúra | Feladattípusok | Jegyzetek |
---|---|---|
Meta Llama 3.2 3B | Csevegés vagy befejezés | |
Meta Llama 3.2 1B | Csevegés vagy befejezés | |
Meta Llama 3.1 | Csevegés vagy befejezés | |
Meta Llama 3 | Csevegés vagy befejezés | |
Meta Láma 2 | Csevegés vagy befejezés | |
DBRX | Csevegés vagy befejezés | Tekintse meg az alapmodell API-k régióhoz való elérhetőségére vonatkozó korlátozásait . |
Misztrál | Csevegés vagy befejezés | |
Mixtral | Csevegés vagy befejezés | |
TCT | Csevegés vagy befejezés | |
GTE 1.5-ös verzió (angol) | Beágyazás | Nem hoz létre normalizált beágyazásokat. |
BGE 1.5-ös verzió (angol) | Beágyazás |
Korlátozások
Lásd az alapmodell API-jainak korlátait.