Condividi tramite


Model Capacities - List

Elencare ModelCapacities.

GET https://management.azure.com/subscriptions/{subscriptionId}/providers/Microsoft.CognitiveServices/modelCapacities?api-version=2024-04-01-preview&modelFormat={modelFormat}&modelName={modelName}&modelVersion={modelVersion}

Parametri dell'URI

Nome In Necessario Tipo Descrizione
subscriptionId
path True

string

ID della sottoscrizione di destinazione.

api-version
query True

string

Versione dell'API da usare per questa operazione.

modelFormat
query True

string

Formato del modello

Criterio di espressione regolare: ^[a-zA-Z0-9][a-zA-Z0-9_.-]*$

modelName
query True

string

Nome del modello

Criterio di espressione regolare: ^[a-zA-Z0-9][a-zA-Z0-9_.-]*$

modelVersion
query True

string

Versione del modello

Criterio di espressione regolare: ^[a-zA-Z0-9][a-zA-Z0-9_.-]*$

Risposte

Nome Tipo Descrizione
200 OK

ModelCapacityListResult

OK. Recuperata correttamente modelCapacities.

Other Status Codes

ErrorResponse

Risposta di errore che descrive il motivo per cui l'operazione non è riuscita.

Esempio

ListModelCapacities

Esempio di richiesta

GET https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/providers/Microsoft.CognitiveServices/modelCapacities?api-version=2024-04-01-preview&modelFormat=OpenAI&modelName=ada&modelVersion=1

Risposta di esempio

{
  "value": [
    {
      "id": "/subscriptions/{subscriptionContext.SubscriptionId}/providers/Microsoft.CognitiveServices/locations/WestUS/models/OpenAI.ada.1/skuCapacities/Standard",
      "type": "Microsoft.CognitiveServices/locations/models/skuCapacities",
      "name": "Standard",
      "location": "WestUS",
      "properties": {
        "model": {
          "format": "OpenAI",
          "name": "ada",
          "version": "1"
        },
        "skuName": "Standard",
        "availableCapacity": 300,
        "availableFinetuneCapacity": 20
      }
    }
  ]
}

Definizioni

Nome Descrizione
CallRateLimit

L'account servizi cognitivi limita la frequenza delle chiamate.

DeploymentModel

Proprietà del modello di distribuzione dell'account servizi cognitivi.

ErrorAdditionalInfo

Informazioni aggiuntive sull'errore di gestione delle risorse.

ErrorDetail

Dettagli dell'errore.

ErrorResponse

Risposta di errore

ModelCapacityListResult

Elenco delle risposte dell'operazione degli account servizi cognitivi.

ModelSkuCapacityProperties

Modello di account di Servizi cognitiviSkuCapacity.

RequestMatchPattern
ThrottlingRule
Value

Ottiene l'elenco di account di Servizi cognitivi ModelSkuCapacity.

CallRateLimit

L'account servizi cognitivi limita la frequenza delle chiamate.

Nome Tipo Descrizione
count

number

Valore count di Call Rate Limit.

renewalPeriod

number

Periodo di rinnovo in secondi del limite di frequenza delle chiamate.

rules

ThrottlingRule[]

DeploymentModel

Proprietà del modello di distribuzione dell'account servizi cognitivi.

Nome Tipo Descrizione
callRateLimit

CallRateLimit

L'account servizi cognitivi limita la frequenza delle chiamate.

format

string

Formato del modello di distribuzione.

name

string

Nome del modello di distribuzione.

source

string

Opzionale. ID risorsa ARM del modello di distribuzione.

version

string

Opzionale. Versione del modello di distribuzione. Se la versione non è specificata, verrà assegnata una versione predefinita. La versione predefinita è diversa per i diversi modelli e può cambiare quando è disponibile una nuova versione per un modello. La versione predefinita per un modello è disponibile nell'API dei modelli di elenco.

ErrorAdditionalInfo

Informazioni aggiuntive sull'errore di gestione delle risorse.

Nome Tipo Descrizione
info

object

Informazioni aggiuntive.

type

string

Tipo di informazioni aggiuntive.

ErrorDetail

Dettagli dell'errore.

Nome Tipo Descrizione
additionalInfo

ErrorAdditionalInfo[]

Informazioni aggiuntive sull'errore.

code

string

Codice di errore.

details

ErrorDetail[]

Dettagli dell'errore.

message

string

Messaggio di errore.

target

string

Destinazione dell'errore.

ErrorResponse

Risposta di errore

Nome Tipo Descrizione
error

ErrorDetail

Oggetto error.

ModelCapacityListResult

Elenco delle risposte dell'operazione degli account servizi cognitivi.

Nome Tipo Descrizione
nextLink

string

Collegamento usato per ottenere la pagina successiva di ModelSkuCapacity.

value

Value[]

Ottiene l'elenco di account di Servizi cognitivi ModelSkuCapacity.

ModelSkuCapacityProperties

Modello di account di Servizi cognitiviSkuCapacity.

Nome Tipo Descrizione
availableCapacity

number

Capacità disponibile per la distribuzione con questo modello e SKU.

availableFinetuneCapacity

number

Capacità disponibile per la distribuzione con una versione ottimizzata di questo modello e sku.

model

DeploymentModel

Proprietà del modello di distribuzione dell'account servizi cognitivi.

skuName

string

RequestMatchPattern

Nome Tipo Descrizione
method

string

path

string

ThrottlingRule

Nome Tipo Descrizione
count

number

dynamicThrottlingEnabled

boolean

key

string

matchPatterns

RequestMatchPattern[]

minCount

number

renewalPeriod

number

Value

Ottiene l'elenco di account di Servizi cognitivi ModelSkuCapacity.

Nome Tipo Descrizione
id

string

ID risorsa completo per la risorsa. Ad esempio - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

location

string

Posizione della capacità dello SKU del modello.

name

string

Nome della risorsa

properties

ModelSkuCapacityProperties

Modello di account di Servizi cognitiviSkuCapacity.

type

string

Tipo della risorsa. Ad esempio, "Microsoft.Compute/virtualMachines" o "Microsoft.Storage/storageAccounts"