共用方式為


概觀:在 Azure AI Studio 中部署 AI 模型

Azure AI Studio 中的模型目錄是用來探索和使用各種模型來建置產生 AI 應用程式的中樞。 模型必須部署,使其可供接收推斷要求。 與已部署模型互動的程序稱為推斷。 Azure AI Studio 會根據您的需求和模型需求,為這些模型提供一套完整的部署選項。

部署模型

部署選項會根據模型類型而有所不同:

  • Azure OpenAI 模型: 具有 Azure 企業功能的最新 OpenAI 模型。
  • 模型即服務模型: 這些模型不需要訂用帳戶的計算配額。 此選項可讓您部署模型即服務 (MaaS)。 您可以使用無伺服器 API 部署,並以隨用隨付的方式按權杖計費。
  • 開啟和自定義模型: 模型目錄可讓您跨開放存取的模式存取各種模型。 您可以使用受控基礎結構、虛擬機器和執行個體數目,在您自己的訂用帳戶中裝載開放式模型,以進行容量管理。 Azure OpenAI、Hugging Face 和 NVIDIA 有各種不同的模型。

Azure AI Studio 提供四種不同的部署選項:

名稱 Azure OpenAI 服務 Azure AI 模型推斷服務 無伺服器 API 受控計算
可以部署哪些模型? Azure OpenAI 模型 Azure OpenAI 模型和模型即服務 模型即服務 開啟和自定義模型
部署資源 Azure OpenAI 服務 Azure AI 服務 AI 專案 AI 專案
最適合時機 您計劃只使用 OpenAI 模型 您正計劃利用 Azure AI 目錄中的旗艦模型,包括 OpenAI。 您打算從特定提供者使用單一模型(不包括 OpenAI)。 如果您打算使用開放式模型,而且您的訂用帳戶中有足夠的計算配額可用。
計費基礎 權杖使用 權杖使用 令牌使用方式1 計算核心時數2
部署指示 部署至 Azure OpenAI 服務 部署至 Azure AI 模型推斷 部署至無伺服器 API 部署至受控計算

1 最低端點基礎結構會依每分鐘計費。 您不會針對以隨用隨付方式裝載模型的基礎結構計費。 刪除端點之後,就不會再產生任何費用。

2 計費會依據產品階層和部署中使用的執行個體數目,以分鐘為單位計 (自建立的那一刻起)。 刪除端點之後,就不會再產生任何費用。

提示

若要深入了解如何追蹤成本,請參閱監視整個 Azure Marketplace 中提供的模型成本

如何思考部署選項?

Azure AI Studio 鼓勵客戶探索部署選項,並挑選最適合其商務和技術需求的部署選項。 一般而言,您可以使用下列思維程式:

  1. 從具有較大範圍的部署選項開始。 這可讓您在應用程式中更快速地逐一查看和原型,而不需要在每次決定變更某個專案時重建架構。 Azure AI 模型推斷服務 是一個部署目標,可支援 Azure AI 目錄中的所有旗艦模型,包括 Azure OpenAI 的最新創新。

  2. 當您要使用特定模型時:

    1. 當您對 OpenAI 模型感興趣時,請使用 Azure OpenAI 服務,其提供各種不同的功能,且專為它們所設計。

    2. 當您對模型即服務的特定模型感興趣,而且您不想要使用任何其他類型的模型時,請使用 無伺服器 API 端點。 它們允許在一組唯一的端點 URL 和金鑰下部署單一模型。

  3. 當模型即服務中沒有可用的模型,而且您的訂用帳戶中有可用的計算配額時,請使用 支持開放和自定義模型的部署受控計算 。 它也允許高度自定義部署推斷伺服器、通訊協定和詳細設定。

提示

每個部署選項在網路、安全性和內容安全性等其他功能方面都提供不同的功能。 請檢閱每一個檔以瞭解其限制。