Share via


Databricks Foundation 模型 API

本文提供 Azure Databricks 中基礎模型 API 的概觀。 其中包含使用需求、支援的模型和限制。

什麼是 Databricks Foundation 模型 API?

Databricks 模型服務現在支持基礎模型 API,可讓您從服務端點存取和查詢最先進的開放模型。 透過基礎模型 API,您可以快速且輕鬆地建置利用高質量產生 AI 模型的應用程式,而不需要維護自己的模型部署。

基礎模型 API 以兩種定價模式提供:

  • 按令牌付費:這是在 Databricks 上開始存取基礎模型的最簡單方式,建議您使用基礎模型 API 開始旅程。 此模式不是針對高輸送量應用程式或高效能的生產工作負載所設計。
  • 布建的輸送量:建議針對所有生產工作負載使用此模式,特別是需要高輸送量、效能保證、微調模型或具有其他安全性需求的工作負載。 布建的輸送量端點可透過 HIPAA 等合規性認證來取得。

如需如何使用這兩種模式和支援的模型指引,請參閱 使用基礎模型 API

您可以使用基礎模型 API:

  • 查詢一般化 LLM,以在投資更多資源之前,先確認專案的有效性。
  • 在投資定型和部署自定義模型之前,先查詢一般化 LLM,以建立 LLM 型應用程式的快速概念證明。
  • 使用基礎模型以及向量資料庫,使用擷取增強式產生 (RAG) 來建置聊天機器人。
  • 將專屬模型取代為開放式替代方案,以優化成本和效能。
  • 有效率地比較 LLM 以查看哪一個是使用案例的最佳候選專案,或將生產模型交換為較佳的執行模型。
  • 在可調整、SLA 支援的 LLM 服務解決方案之上建置 LLM 應用程式,以支援生產流量尖峰。

需求

  • 用來驗證端點要求的 Databricks API 令牌。
  • 無伺服器計算(適用於布建的輸送量模型)。
  • 支援區域中的工作區:

注意

如需使用 DBRX 基底模型的布建輸送量工作負載,請參閱 區域可用性的基礎模型 API 限制

使用基礎模型 API

您有多個使用基礎模型 API 的選項。

API 與 OpenAI 相容,因此您甚至可以使用 OpenAI 用戶端進行查詢。 您也可以使用UI、基礎模型 API Python SDK、MLflow 部署 SDK 或 REST API 來查詢支援的模型。 Databricks 建議使用 MLflow 部署 SDK 或 REST API 進行延伸互動,以及嘗試此功能的 UI。

如需評分範例,請參閱 查詢基礎模型

按令牌付費基礎模型 API

重要

這項功能處於公開預覽狀態

您可以在 Azure Databricks 工作區中存取每一令牌付費模型,並建議開始使用。 若要在您的工作區中存取它們,請瀏覽至 左側提要字段中的 [服務 ] 索引卷標。 基礎模型 API 位於 [端點] 清單檢視的頂端。

提供端點清單

下表摘要說明每個令牌付費支援的模型。 如需其他模型資訊,請參閱 支援的每個令牌 付費模型。

如果您想要測試這些模型並與其聊天,您可以使用 AI 遊樂場來執行此動作。 請參閱 使用 AI 遊樂場與支援的 LLM 聊天。

模型 工作類型 端點
DBRX 指示 聊天 databricks-dbrx-instruct
Meta-Llama-3-70B-指示 聊天 databricks-meta-llama-3-70b-instruct
Meta-Llama-2-70B-Chat 聊天 databricks-llama-2-70b-chat
Mixtral-8x7B 指示 聊天 databricks-mixtral-8x7b-instruct
MPT 7B 指示 Completion databricks-mpt-7b-instruct
MPT 30B 指示 Completion databricks-mpt-30b-instruct
BGE 大型 (英文) 內嵌 databricks-bge-large-en

布建的輸送量基礎模型 API

布建的輸送量已正式推出,Databricks 建議為生產工作負載布建輸送量。 布建的輸送量為需要效能保證的基礎模型工作負載提供優化的推斷。 如需如何在布建整個模式中部署基礎模型 API 的逐步指南,請參閱 布建的輸送量基礎模型 API。

佈建的輸送量支援包括:

  • 所有大小的基底模型,例如 DBRX 基底。 您可以使用 Databricks Marketplace 來存取基底模型,或者您也可以從擁抱臉部或其他外部來源下載模型,並在 Unity 目錄中註冊它們。 後者的方法適用於所支援模型的任何微調變體,不論採用的微調方法為何。
  • 基底模型的微調變體,例如 LlamaGuard-7B。 這包括微調專屬數據的模型。
  • 完整自定義權數和標記化工具,例如使用基底模型架構(例如 CodeLlama、Yi-34B-Chat 或 SOLAR-10.7B)進行從頭訓練或繼續預先定型或其他變化的人員。

下表摘要說明布建輸送量支援的模型架構。

模型架構 工作類型 備註
DBRX 聊天或完成 如需區域可用性,請參閱 基礎模型 API 限制
Meta Llama 3 聊天或完成
Meta Llama 2 聊天或完成
Mistral 聊天或完成
Mixtral 聊天或完成
郵電部 聊天或完成
BGE v1.5 (英文) 內嵌

限制

請參閱 模型服務限制和區域

其他資源