Freigeben über


Model Capacities - List

Listen Sie ModelCapacities auf.

GET https://management.azure.com/subscriptions/{subscriptionId}/providers/Microsoft.CognitiveServices/modelCapacities?api-version=2024-04-01-preview&modelFormat={modelFormat}&modelName={modelName}&modelVersion={modelVersion}

URI-Parameter

Name In Erforderlich Typ Beschreibung
subscriptionId
path True

string

minLength: 1

Die ID des Zielabonnements.

api-version
query True

string

minLength: 1

Die API-Version, die für diesen Vorgang verwendet werden soll.

modelFormat
query True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_.-]*$

Das Format des Modells

modelName
query True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_.-]*$

Der Name des Modells

modelVersion
query True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_.-]*$

Die Version des Modells

Antworten

Name Typ Beschreibung
200 OK

ModelCapacityListResult

OKAY. Erfolgreich abgerufene modelCapacities.

Other Status Codes

ErrorResponse

Fehlerantwort, die beschreibt, warum der Vorgang fehlgeschlagen ist.

Beispiele

ListModelCapacities

Beispielanforderung

GET https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/providers/Microsoft.CognitiveServices/modelCapacities?api-version=2024-04-01-preview&modelFormat=OpenAI&modelName=ada&modelVersion=1

Beispiel für eine Antwort

{
  "value": [
    {
      "id": "/subscriptions/{subscriptionContext.SubscriptionId}/providers/Microsoft.CognitiveServices/locations/WestUS/models/OpenAI.ada.1/skuCapacities/Standard",
      "type": "Microsoft.CognitiveServices/locations/models/skuCapacities",
      "name": "Standard",
      "location": "WestUS",
      "properties": {
        "model": {
          "format": "OpenAI",
          "name": "ada",
          "version": "1"
        },
        "skuName": "Standard",
        "availableCapacity": 300,
        "availableFinetuneCapacity": 20
      }
    }
  ]
}

Definitionen

Name Beschreibung
CallRateLimit

Das Anrufratenlimit des Cognitive Services-Kontos.

DeploymentModel

Eigenschaften des Bereitstellungsmodells für Cognitive Services-Konten.

ErrorAdditionalInfo

Der Ressourcenverwaltungsfehler zusätzliche Informationen.

ErrorDetail

Das Fehlerdetails.

ErrorResponse

Fehlerantwort

ModelCapacityListResult

Die Liste der kognitiven Dienste konten Operation Reaktion.

ModelSkuCapacityProperties

Cognitive Services-Konto ModelSkuCapacity.

RequestMatchPattern
ThrottlingRule
Value

Ruft die Liste der Cognitive Services-Konten ModelSkuCapacity ab.

CallRateLimit

Das Anrufratenlimit des Cognitive Services-Kontos.

Name Typ Beschreibung
count

number

Der Anzahlwert des Anrufratenlimits.

renewalPeriod

number

Der Verlängerungszeitraum in Sekunden des Anrufratenlimits.

rules

ThrottlingRule[]

DeploymentModel

Eigenschaften des Bereitstellungsmodells für Cognitive Services-Konten.

Name Typ Beschreibung
callRateLimit

CallRateLimit

Das Anrufratenlimit des Cognitive Services-Kontos.

format

string

Bereitstellungsmodellformat.

name

string

Name des Bereitstellungsmodells.

source

string

Wahlfrei. Arm-Ressourcen-ID der Bereitstellungsmodellquelle.

version

string

Wahlfrei. Bereitstellungsmodellversion. Wenn keine Version angegeben ist, wird eine Standardversion zugewiesen. Die Standardversion unterscheidet sich für verschiedene Modelle und kann sich ändern, wenn eine neue Version für ein Modell verfügbar ist. Die Standardversion für ein Modell wurde aus der Listenmodelle-API gefunden.

ErrorAdditionalInfo

Der Ressourcenverwaltungsfehler zusätzliche Informationen.

Name Typ Beschreibung
info

object

Die zusätzlichen Informationen.

type

string

Der zusätzliche Informationstyp.

ErrorDetail

Das Fehlerdetails.

Name Typ Beschreibung
additionalInfo

ErrorAdditionalInfo[]

Die zusätzlichen Informationen des Fehlers.

code

string

Der Fehlercode.

details

ErrorDetail[]

Die Fehlerdetails.

message

string

Die Fehlermeldung.

target

string

Das Fehlerziel.

ErrorResponse

Fehlerantwort

Name Typ Beschreibung
error

ErrorDetail

Das Fehlerobjekt.

ModelCapacityListResult

Die Liste der kognitiven Dienste konten Operation Reaktion.

Name Typ Beschreibung
nextLink

string

Der Link, der zum Abrufen der nächsten Seite von ModelSkuCapacity verwendet wird.

value

Value[]

Ruft die Liste der Cognitive Services-Konten ModelSkuCapacity ab.

ModelSkuCapacityProperties

Cognitive Services-Konto ModelSkuCapacity.

Name Typ Beschreibung
availableCapacity

number

Die verfügbare Kapazität für die Bereitstellung mit diesem Modell und der SKU.

availableFinetuneCapacity

number

Die verfügbare Kapazität für die Bereitstellung mit einer feinabstimmungen Version dieses Modells und der SKU.

model

DeploymentModel

Eigenschaften des Bereitstellungsmodells für Cognitive Services-Konten.

skuName

string

RequestMatchPattern

Name Typ Beschreibung
method

string

path

string

ThrottlingRule

Name Typ Beschreibung
count

number

dynamicThrottlingEnabled

boolean

key

string

matchPatterns

RequestMatchPattern[]

minCount

number

renewalPeriod

number

Value

Ruft die Liste der Cognitive Services-Konten ModelSkuCapacity ab.

Name Typ Beschreibung
id

string

Vollqualifizierte Ressourcen-ID für die Ressource. Ex - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

location

string

Die Position der Modell-Sku-Kapazität.

name

string

Der Name der Ressource

properties

ModelSkuCapacityProperties

Cognitive Services-Konto ModelSkuCapacity.

type

string

Der Typ der Ressource. Z. B. "Microsoft.Compute/virtualMachines" oder "Microsoft.Storage/storageAccounts"