共用方式為


Model Capacities - List

列出 ModelCapacities。

GET https://management.azure.com/subscriptions/{subscriptionId}/providers/Microsoft.CognitiveServices/modelCapacities?api-version=2024-04-01-preview&modelFormat={modelFormat}&modelName={modelName}&modelVersion={modelVersion}

URI 參數

名稱 位於 必要 類型 Description
subscriptionId
path True

string

minLength: 1

目標訂用帳戶的標識碼。

api-version
query True

string

minLength: 1

要用於這項作業的 API 版本。

modelFormat
query True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_.-]*$

模型的格式

modelName
query True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_.-]*$

模型的名稱

modelVersion
query True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_.-]*$

模型的版本

回應

名稱 類型 Description
200 OK

ModelCapacityListResult

還行。 已成功擷取modelCapacities。

Other Status Codes

ErrorResponse

描述作業失敗原因的錯誤回應。

範例

ListModelCapacities

範例要求

GET https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/providers/Microsoft.CognitiveServices/modelCapacities?api-version=2024-04-01-preview&modelFormat=OpenAI&modelName=ada&modelVersion=1

範例回覆

{
  "value": [
    {
      "id": "/subscriptions/{subscriptionContext.SubscriptionId}/providers/Microsoft.CognitiveServices/locations/WestUS/models/OpenAI.ada.1/skuCapacities/Standard",
      "type": "Microsoft.CognitiveServices/locations/models/skuCapacities",
      "name": "Standard",
      "location": "WestUS",
      "properties": {
        "model": {
          "format": "OpenAI",
          "name": "ada",
          "version": "1"
        },
        "skuName": "Standard",
        "availableCapacity": 300,
        "availableFinetuneCapacity": 20
      }
    }
  ]
}

定義

名稱 Description
CallRateLimit

通話速率限制認知服務帳戶。

DeploymentModel

認知服務帳戶部署模型的屬性。

ErrorAdditionalInfo

資源管理錯誤其他資訊。

ErrorDetail

錯誤詳細數據。

ErrorResponse

錯誤回應

ModelCapacityListResult

認知服務帳戶作業回應的清單。

ModelSkuCapacityProperties

認知服務帳戶 ModelSkuCapacity。

RequestMatchPattern
ThrottlingRule
Value

取得認知服務帳戶 ModelSkuCapacity 的清單。

CallRateLimit

通話速率限制認知服務帳戶。

名稱 類型 Description
count

number

通話速率限制的計數值。

renewalPeriod

number

通話速率限制秒數的更新期間。

rules

ThrottlingRule[]

DeploymentModel

認知服務帳戶部署模型的屬性。

名稱 類型 Description
callRateLimit

CallRateLimit

通話速率限制認知服務帳戶。

format

string

部署模型格式。

name

string

部署模型名稱。

source

string

自選。 部署模型來源 ARM 資源識別碼。

version

string

自選。 部署模型版本。 如果未指定版本,則會指派預設版本。 不同模型的預設版本不同,而且當有新版本可供模型使用時,可能會變更。 您可以從清單模型 API 找到模型的預設版本。

ErrorAdditionalInfo

資源管理錯誤其他資訊。

名稱 類型 Description
info

object

其他資訊。

type

string

其他信息類型。

ErrorDetail

錯誤詳細數據。

名稱 類型 Description
additionalInfo

ErrorAdditionalInfo[]

錯誤其他資訊。

code

string

錯誤碼。

details

ErrorDetail[]

錯誤詳細數據。

message

string

錯誤訊息。

target

string

錯誤目標。

ErrorResponse

錯誤回應

名稱 類型 Description
error

ErrorDetail

error 物件。

ModelCapacityListResult

認知服務帳戶作業回應的清單。

名稱 類型 Description
nextLink

string

用來取得 ModelSkuCapacity 下一頁的連結。

value

Value[]

取得認知服務帳戶 ModelSkuCapacity 的清單。

ModelSkuCapacityProperties

認知服務帳戶 ModelSkuCapacity。

名稱 類型 Description
availableCapacity

number

使用此模型和 SKU 進行部署的可用容量。

availableFinetuneCapacity

number

此模型和 SKU 版本微調的可用容量可供部署。

model

DeploymentModel

認知服務帳戶部署模型的屬性。

skuName

string

RequestMatchPattern

名稱 類型 Description
method

string

path

string

ThrottlingRule

名稱 類型 Description
count

number

dynamicThrottlingEnabled

boolean

key

string

matchPatterns

RequestMatchPattern[]

minCount

number

renewalPeriod

number

Value

取得認知服務帳戶 ModelSkuCapacity 的清單。

名稱 類型 Description
id

string

資源的完整資源標識碼。 例如 - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

location

string

模型 Sku 容量的位置。

name

string

資源的名稱

properties

ModelSkuCapacityProperties

認知服務帳戶 ModelSkuCapacity。

type

string

資源的型別。 例如“Microsoft.Compute/virtualMachines” 或 “Microsoft.Storage/storageAccounts”