Partager via


Model Capacities - List

Répertorier ModelCapacities.

GET https://management.azure.com/subscriptions/{subscriptionId}/providers/Microsoft.CognitiveServices/modelCapacities?api-version=2024-04-01-preview&modelFormat={modelFormat}&modelName={modelName}&modelVersion={modelVersion}

Paramètres URI

Nom Dans Obligatoire Type Description
subscriptionId
path True

string

minLength: 1

ID de l’abonnement cible.

api-version
query True

string

minLength: 1

Version de l’API à utiliser pour cette opération.

modelFormat
query True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_.-]*$

Format du modèle

modelName
query True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_.-]*$

Nom du modèle

modelVersion
query True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_.-]*$

Version du modèle

Réponses

Nom Type Description
200 OK

ModelCapacityListResult

D’ACCORD. Récupération réussie de modelCapacities.

Other Status Codes

ErrorResponse

Réponse d’erreur décrivant pourquoi l’opération a échoué.

Exemples

ListModelCapacities

Exemple de requête

GET https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/providers/Microsoft.CognitiveServices/modelCapacities?api-version=2024-04-01-preview&modelFormat=OpenAI&modelName=ada&modelVersion=1

Exemple de réponse

{
  "value": [
    {
      "id": "/subscriptions/{subscriptionContext.SubscriptionId}/providers/Microsoft.CognitiveServices/locations/WestUS/models/OpenAI.ada.1/skuCapacities/Standard",
      "type": "Microsoft.CognitiveServices/locations/models/skuCapacities",
      "name": "Standard",
      "location": "WestUS",
      "properties": {
        "model": {
          "format": "OpenAI",
          "name": "ada",
          "version": "1"
        },
        "skuName": "Standard",
        "availableCapacity": 300,
        "availableFinetuneCapacity": 20
      }
    }
  ]
}

Définitions

Nom Description
CallRateLimit

Limite de débit d’appel compte Cognitive Services.

DeploymentModel

Propriétés du modèle de déploiement de compte Cognitive Services.

ErrorAdditionalInfo

Informations supplémentaires sur l’erreur de gestion des ressources.

ErrorDetail

Détail de l’erreur.

ErrorResponse

Réponse d’erreur

ModelCapacityListResult

Liste des réponses d’opération des comptes Cognitive Services.

ModelSkuCapacityProperties

ModèleSkuCapacity du compte Cognitive Services.

RequestMatchPattern
ThrottlingRule
Value

Obtient la liste des comptes Cognitive Services ModelSkuCapacity.

CallRateLimit

Limite de débit d’appel compte Cognitive Services.

Nom Type Description
count

number

Valeur de nombre de limites du taux d’appel.

renewalPeriod

number

Période de renouvellement en secondes de limite du taux d’appel.

rules

ThrottlingRule[]

DeploymentModel

Propriétés du modèle de déploiement de compte Cognitive Services.

Nom Type Description
callRateLimit

CallRateLimit

Limite de débit d’appel compte Cognitive Services.

format

string

Format du modèle de déploiement.

name

string

Nom du modèle de déploiement.

source

string

Optionnel. ID de ressource ARM source du modèle de déploiement.

version

string

Optionnel. Version du modèle de déploiement. Si la version n’est pas spécifiée, une version par défaut est affectée. La version par défaut est différente pour différents modèles et peut changer lorsqu’il existe une nouvelle version disponible pour un modèle. La version par défaut d’un modèle est disponible à partir de l’API des modèles de liste.

ErrorAdditionalInfo

Informations supplémentaires sur l’erreur de gestion des ressources.

Nom Type Description
info

object

Informations supplémentaires.

type

string

Type d’informations supplémentaire.

ErrorDetail

Détail de l’erreur.

Nom Type Description
additionalInfo

ErrorAdditionalInfo[]

Informations supplémentaires sur l’erreur.

code

string

Code d’erreur.

details

ErrorDetail[]

Détails de l’erreur.

message

string

Message d’erreur.

target

string

Cible d’erreur.

ErrorResponse

Réponse d’erreur

Nom Type Description
error

ErrorDetail

Objet d’erreur.

ModelCapacityListResult

Liste des réponses d’opération des comptes Cognitive Services.

Nom Type Description
nextLink

string

Lien utilisé pour obtenir la page suivante de ModelSkuCapacity.

value

Value[]

Obtient la liste des comptes Cognitive Services ModelSkuCapacity.

ModelSkuCapacityProperties

ModèleSkuCapacity du compte Cognitive Services.

Nom Type Description
availableCapacity

number

Capacité disponible pour le déploiement avec ce modèle et cette référence SKU.

availableFinetuneCapacity

number

Capacité disponible pour le déploiement avec une version affinée de ce modèle et de la référence SKU.

model

DeploymentModel

Propriétés du modèle de déploiement de compte Cognitive Services.

skuName

string

RequestMatchPattern

Nom Type Description
method

string

path

string

ThrottlingRule

Nom Type Description
count

number

dynamicThrottlingEnabled

boolean

key

string

matchPatterns

RequestMatchPattern[]

minCount

number

renewalPeriod

number

Value

Obtient la liste des comptes Cognitive Services ModelSkuCapacity.

Nom Type Description
id

string

ID de ressource complet pour la ressource. ex - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

location

string

Emplacement de la capacité de référence SKU du modèle.

name

string

Nom de la ressource

properties

ModelSkuCapacityProperties

ModèleSkuCapacity du compte Cognitive Services.

type

string

Type de la ressource. Par exemple, « Microsoft.Compute/virtualMachines » ou « Microsoft.Storage/storageAccounts »