概觀:在 Azure AI Studio 中部署 AI 模型
Azure AI Studio 中的模型目錄是用來探索和使用各種模型來建置產生 AI 應用程式的中樞。 模型必須部署,使其可供接收推斷要求。 與已部署模型互動的程序稱為推斷。 Azure AI Studio 會根據您的需求和模型需求,為這些模型提供一套完整的部署選項。
部署模型
部署選項會根據模型類型而有所不同:
- Azure OpenAI 模型: 具有 Azure 企業功能的最新 OpenAI 模型。
- 模型即服務模型: 這些模型不需要訂用帳戶的計算配額。 此選項可讓您部署模型即服務 (MaaS)。 您可以使用無伺服器 API 部署,並以隨用隨付的方式按權杖計費。
- 開啟和自定義模型: 模型目錄可讓您跨開放存取的模式存取各種模型。 您可以使用受控基礎結構、虛擬機器和執行個體數目,在您自己的訂用帳戶中裝載開放式模型,以進行容量管理。 Azure OpenAI、Hugging Face 和 NVIDIA 有各種不同的模型。
Azure AI Studio 提供四種不同的部署選項:
名稱 | Azure OpenAI 服務 | Azure AI 模型推斷服務 | 無伺服器 API | 受控計算 |
---|---|---|---|---|
可以部署哪些模型? | Azure OpenAI 模型 | Azure OpenAI 模型和模型即服務 | 模型即服務 | 開啟和自定義模型 |
部署資源 | Azure OpenAI 服務 | Azure AI 服務 | AI 專案 | AI 專案 |
最適合時機 | 您計劃只使用 OpenAI 模型 | 您正計劃利用 Azure AI 目錄中的旗艦模型,包括 OpenAI。 | 您打算從特定提供者使用單一模型(不包括 OpenAI)。 | 如果您打算使用開放式模型,而且您的訂用帳戶中有足夠的計算配額可用。 |
計費基礎 | 權杖使用 | 權杖使用 | 令牌使用方式1 | 計算核心時數2 |
部署指示 | 部署至 Azure OpenAI 服務 | 部署至 Azure AI 模型推斷 | 部署至無伺服器 API | 部署至受控計算 |
1 最低端點基礎結構會依每分鐘計費。 您不會針對以隨用隨付方式裝載模型的基礎結構計費。 刪除端點之後,就不會再產生任何費用。
2 計費會依據產品階層和部署中使用的執行個體數目,以分鐘為單位計 (自建立的那一刻起)。 刪除端點之後,就不會再產生任何費用。
提示
若要深入了解如何追蹤成本,請參閱監視整個 Azure Marketplace 中提供的模型成本。
如何思考部署選項?
Azure AI Studio 鼓勵客戶探索部署選項,並挑選最適合其商務和技術需求的部署選項。 一般而言,您可以使用下列思維程式:
從具有較大範圍的部署選項開始。 這可讓您在應用程式中更快速地逐一查看和原型,而不需要在每次決定變更某個專案時重建架構。 Azure AI 模型推斷服務 是一個部署目標,可支援 Azure AI 目錄中的所有旗艦模型,包括 Azure OpenAI 的最新創新。
當您要使用特定模型時:
當您對 OpenAI 模型感興趣時,請使用 Azure OpenAI 服務,其提供各種不同的功能,且專為它們所設計。
當您對模型即服務的特定模型感興趣,而且您不想要使用任何其他類型的模型時,請使用 無伺服器 API 端點。 它們允許在一組唯一的端點 URL 和金鑰下部署單一模型。
當模型即服務中沒有可用的模型,而且您的訂用帳戶中有可用的計算配額時,請使用 支持開放和自定義模型的部署受控計算 。 它也允許高度自定義部署推斷伺服器、通訊協定和詳細設定。
提示
每個部署選項在網路、安全性和內容安全性等其他功能方面都提供不同的功能。 請檢閱每一個檔以瞭解其限制。