部署生成式 AI 模型
您必須先部署模型,以進行 API 呼叫,以接收完成提示。 當您建立新的部署時,必須指出要部署的基底模型。 只要其 TPM 在該區域中的總數目少於 240K,您就可以在一或多個 Azure OpenAI 資源中部署任意數目的部署。 有數種方式可以部署基底模型。
使用 Azure OpenAI Studio 部署
在 Azure OpenAI Studio 的 [部署] 頁面中,您可以從功能表中選取模型名稱來建立新的部署。 可用的基底模型來自模型頁面中的清單。
從 Studio 中的 [部署] 頁面,您也可以檢視所有部署的相關資訊,包括部署名稱、模型名稱、模型版本、狀態、建立日期等等。
使用 Azure CLI 部署
您也可以使用主控台來部署模型。 使用此範例,以您自己的資源值取代下列變數:
- OAIResourceGroup:以您的資源群組名稱取代
- MyOpenAIResource:以您的資源名稱取代
- MyModel:以您的模型唯一名稱取代
- gpt-35-turbo:以您想要部署的基底模型取代
az cognitiveservices account deployment create \
-g OAIResourceGroup \
-n MyOpenAIResource \
--deployment-name MyModel \
--model-name gpt-35-turbo \
--model-version "0301" \
--model-format OpenAI \
--sku-name "Standard" \
--sku-capacity 1
使用 REST API 部署
您可以使用 REST API 來部署模型。 在要求本文中,您指定您想要部署的基底模型。 請參閱 Azure OpenAI 文件中的範例。