部署生成式 AI 模型

已完成

您必須先部署模型,以進行 API 呼叫,以接收完成提示。 當您建立新的部署時,必須指出要部署的基底模型。 只要其 TPM 在該區域中的總數目少於 240K,您就可以在一或多個 Azure OpenAI 資源中部署任意數目的部署。 有數種方式可以部署基底模型。

使用 Azure OpenAI Studio 部署

在 Azure OpenAI Studio 的 [部署] 頁面中,您可以從功能表中選取模型名稱來建立新的部署。 可用的基底模型來自模型頁面中的清單。

Screenshot of the Azure OpenAI Studio portal's model deployment wizard.

從 Studio 中的 [部署] 頁面,您也可以檢視所有部署的相關資訊,包括部署名稱、模型名稱、模型版本、狀態、建立日期等等。

使用 Azure CLI 部署

您也可以使用主控台來部署模型。 使用此範例,以您自己的資源值取代下列變數:

  • OAIResourceGroup:以您的資源群組名稱取代
  • MyOpenAIResource:以您的資源名稱取代
  • MyModel:以您的模型唯一名稱取代
  • gpt-35-turbo:以您想要部署的基底模型取代
az cognitiveservices account deployment create \
   -g OAIResourceGroup \
   -n MyOpenAIResource \
   --deployment-name MyModel \
   --model-name gpt-35-turbo \
   --model-version "0301"  \
   --model-format OpenAI \
   --sku-name "Standard" \
   --sku-capacity 1

使用 REST API 部署

您可以使用 REST API 來部署模型。 在要求本文中,您指定您想要部署的基底模型。 請參閱 Azure OpenAI 文件中的範例。