Freigeben über


Inference Groups - List

Auflisten von Rückschlussgruppen.

GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/inferencePools/{poolName}/groups?api-version=2025-04-01-preview
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/inferencePools/{poolName}/groups?api-version=2025-04-01-preview&count={count}&$skip={$skip}&tags={tags}&properties={properties}&orderBy={orderBy}

URI-Parameter

Name In Erforderlich Typ Beschreibung
poolName
path True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9\-_]{0,254}$

Name des InferencePools.

resourceGroupName
path True

string

minLength: 1
maxLength: 90

Der Name der Ressourcengruppe. Bei dem Namen wird die Groß-/Kleinschreibung nicht beachtet.

subscriptionId
path True

string

minLength: 1

Die ID des Zielabonnements.

workspaceName
path True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$

Name des Azure Machine Learning-Arbeitsbereichs.

api-version
query True

string

minLength: 1

Hierbei handelt es sich um die für diesen Vorgang zu verwendende API-Version.

$skip
query

string

Fortsetzungstoken für Paginierung.

count
query

integer (int32)

Anzahl der InferenceGroup, die auf einer Ergebnisseite abgerufen werden soll.

orderBy
query

OrderString

Die Option zum Sortieren der Antwort.

properties
query

string

Eine Reihe von Eigenschaften, mit denen die zurückgegebenen Modelle gefiltert werden sollen. Es handelt sich um eine durch Trennzeichen getrennte Zeichenfolge von Eigenschaftenschlüssel und/oder Eigenschaftenschlüssel=Wert Beispiel: propKey1,propKey2,propKey3=value3 .

tags
query

string

Eine Gruppe von Tags, mit denen die zurückgegebenen Modelle gefiltert werden sollen. Es handelt sich um eine durch Trennzeichen getrennte Zeichenfolge von Tags key oder tags key=value. Beispiel: tagKey1,tagKey2,tagKey3=value3 .

Antworten

Name Typ Beschreibung
200 OK

InferenceGroupTrackedResourceArmPaginatedResult

Erfolg

Other Status Codes

ErrorResponse

Fehler

Beispiele

List Workspace Inference Group.

Beispielanforderung

GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/inferencePools/string/groups?api-version=2025-04-01-preview&count=1&tags=string&properties=string&orderBy=CreatedAtDesc

Beispiel für eine Antwort

{
  "value": [
    {
      "id": "string",
      "name": "string",
      "type": "string",
      "properties": {
        "description": "string",
        "properties": [
          {
            "key": "string",
            "value": "string"
          }
        ],
        "provisioningState": "Failed",
        "environmentConfiguration": {
          "environmentId": "azureml://registries/test-registry/models/enginefeed/versions/1",
          "environmentVariables": [
            {
              "key": "string",
              "value": "string"
            }
          ],
          "livenessProbe": {
            "failureThreshold": 1,
            "successThreshold": 1,
            "timeout": "PT5M",
            "period": "PT5M",
            "initialDelay": "PT5M"
          },
          "readinessProbe": {
            "failureThreshold": 1,
            "successThreshold": 1,
            "timeout": "PT5M",
            "period": "PT5M",
            "initialDelay": "PT5M"
          },
          "startupProbe": {
            "failureThreshold": 1,
            "successThreshold": 1,
            "timeout": "PT5M",
            "period": "PT5M",
            "initialDelay": "PT5M"
          }
        },
        "nodeSkuType": "string",
        "scaleUnitSize": 1,
        "modelConfiguration": {
          "modelId": "azureml://registries/test-registry/models/modelabc/versions/1"
        }
      },
      "systemData": {
        "createdAt": "2020-01-01T12:34:56.999+00:17",
        "createdBy": "string",
        "createdByType": "Key",
        "lastModifiedAt": "2020-01-01T12:34:56.999+00:17",
        "lastModifiedBy": "string",
        "lastModifiedByType": "User"
      },
      "tags": {},
      "location": "string",
      "kind": "string",
      "identity": {
        "type": "SystemAssigned",
        "principalId": "00000000-1111-2222-3333-444444444444",
        "tenantId": "00000000-1111-2222-3333-444444444444",
        "userAssignedIdentities": {
          "string": {
            "principalId": "00000000-1111-2222-3333-444444444444",
            "clientId": "00000000-1111-2222-3333-444444444444"
          }
        }
      },
      "sku": {
        "name": "string",
        "tier": "Free",
        "size": "string",
        "family": "string",
        "capacity": 1
      }
    }
  ],
  "nextLink": "string"
}

Definitionen

Name Beschreibung
createdByType

Der Identitätstyp, der die Ressource erstellt hat.

ErrorAdditionalInfo

Der Ressourcenverwaltungsfehler zusätzliche Informationen.

ErrorDetail

Das Fehlerdetails.

ErrorResponse

Fehlerantwort

GroupEnvironmentConfiguration

Konfigurationsoptionen für die Umgebung.

GroupModelConfiguration

Optionen für die Modellkonfiguration.

InferenceGroup

Konfiguration der Rückschlussgruppe

InferenceGroupTrackedResource
InferenceGroupTrackedResourceArmPaginatedResult

Eine paginierte Liste von InferenceGroup-Entitäten.

ManagedServiceIdentity

Verwaltete Dienstidentität (vom System zugewiesene und/oder vom Benutzer zugewiesene Identitäten)

ManagedServiceIdentityType

Typ der verwalteten Dienstidentität (wobei systemAssigned- und UserAssigned-Typen zulässig sind).

OrderString
PoolProvisioningState

Stand der Bereitstellung poolbezogener Ressourcen.

ProbeSettings

Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration.

Sku

Die Definition des Ressourcenmodells, die SKU darstellt

SkuTier

Dieses Feld muss vom Ressourcenanbieter implementiert werden, wenn der Dienst mehr als eine Ebene aufweist, für einen PUT jedoch nicht erforderlich ist.

StringStringKeyValuePair
systemData

Metadaten zur Erstellung und letzten Änderung der Ressource.

UserAssignedIdentity

Benutzer zugewiesene Identitätseigenschaften

createdByType

Der Identitätstyp, der die Ressource erstellt hat.

Wert Beschreibung
Application
Key
ManagedIdentity
User

ErrorAdditionalInfo

Der Ressourcenverwaltungsfehler zusätzliche Informationen.

Name Typ Beschreibung
info

object

Die zusätzlichen Informationen.

type

string

Der zusätzliche Informationstyp.

ErrorDetail

Das Fehlerdetails.

Name Typ Beschreibung
additionalInfo

ErrorAdditionalInfo[]

Die zusätzlichen Informationen des Fehlers.

code

string

Der Fehlercode.

details

ErrorDetail[]

Die Fehlerdetails.

message

string

Die Fehlermeldung.

target

string

Das Fehlerziel.

ErrorResponse

Fehlerantwort

Name Typ Beschreibung
error

ErrorDetail

Das Fehlerobjekt.

GroupEnvironmentConfiguration

Konfigurationsoptionen für die Umgebung.

Name Typ Beschreibung
environmentId

string

ARM-Ressourcen-ID der Umgebungsspezifikation für den Rückschlusspool.

environmentVariables

StringStringKeyValuePair[]

Umgebungsvariablenkonfiguration für den Rückschlusspool.

livenessProbe

ProbeSettings

Liveness-Probe überwacht die Integrität des Containers regelmäßig.

readinessProbe

ProbeSettings

Die Bereitschaftssonde überprüft, ob der Container für den Datenverkehr bereit ist. Die Eigenschaften und Standardwerte sind identisch mit der Livenesssonde.

startupProbe

ProbeSettings

Dadurch wird überprüft, ob die Anwendung innerhalb eines Containers gestartet wird. Startsonden werden vor einem anderen Sonde ausgeführt, und deaktiviert, sofern sie nicht erfolgreich abgeschlossen wurde, andere Probes.

GroupModelConfiguration

Optionen für die Modellkonfiguration.

Name Typ Beschreibung
modelId

string

Der URI-Pfad zum Modell.

InferenceGroup

Konfiguration der Rückschlussgruppe

Name Typ Beschreibung
description

string

Beschreibung der Ressource.

environmentConfiguration

GroupEnvironmentConfiguration

Ruft die Umgebungskonfiguration für die Ableitungsgruppe ab oder legt sie fest. Wird verwendet, wenn PoolType=ScaleUnit.

modelConfiguration

GroupModelConfiguration

Ruft die Modellkonfiguration für die Ableitungsgruppe ab oder legt sie fest. Wird verwendet, wenn PoolType=ScaleUnit.

nodeSkuType

string

Ruft den Computeinstanztyp ab oder legt diesen fest.

properties

StringStringKeyValuePair[]

Eigenschaftenwörterbuch. Eigenschaften können hinzugefügt, aber nicht entfernt oder geändert werden.

provisioningState

PoolProvisioningState

Bereitstellungsstatus für die Rückschlussgruppe.

scaleUnitSize

integer (int32)

Ruft die Größe der Skalierungseinheit ab oder legt sie fest.

InferenceGroupTrackedResource

Name Typ Beschreibung
id

string

Vollqualifizierte Ressourcen-ID für die Ressource. Ex - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

identity

ManagedServiceIdentity

Verwaltete Dienstidentität (vom System zugewiesene und/oder vom Benutzer zugewiesene Identitäten)

kind

string

Metadaten, die von Portal/Tooling/etc. verwendet werden, um unterschiedliche UX-Oberflächen für Ressourcen desselben Typs zu rendern.

location

string

Der geografische Standort, an dem sich die Ressource befindet

name

string

Der Name der Ressource

properties

InferenceGroup

[Erforderlich] Zusätzliche Attribute der Entität.

sku

Sku

Sku-Details, die für den ARM-Vertrag für die automatische Skalierung erforderlich sind.

systemData

systemData

Azure Resource Manager-Metadaten, die createdBy- und modifiedBy-Informationen enthalten.

tags

object

Ressourcentags.

type

string

Der Typ der Ressource. Z. B. "Microsoft.Compute/virtualMachines" oder "Microsoft.Storage/storageAccounts"

InferenceGroupTrackedResourceArmPaginatedResult

Eine paginierte Liste von InferenceGroup-Entitäten.

Name Typ Beschreibung
nextLink

string

Der Link zur nächsten Seite von InferenceGroup-Objekten. Wenn null ist, gibt es keine zusätzlichen Seiten.

value

InferenceGroupTrackedResource[]

Ein Array von Objekten vom Typ InferenceGroup.

ManagedServiceIdentity

Verwaltete Dienstidentität (vom System zugewiesene und/oder vom Benutzer zugewiesene Identitäten)

Name Typ Beschreibung
principalId

string (uuid)

Die Dienstprinzipal-ID der vom System zugewiesenen Identität. Diese Eigenschaft wird nur für eine vom System zugewiesene Identität bereitgestellt.

tenantId

string (uuid)

Die Mandanten-ID der vom System zugewiesenen Identität. Diese Eigenschaft wird nur für eine vom System zugewiesene Identität bereitgestellt.

type

ManagedServiceIdentityType

Typ der verwalteten Dienstidentität (wobei systemAssigned- und UserAssigned-Typen zulässig sind).

userAssignedIdentities

<string,  UserAssignedIdentity>

User-Assigned Identitäten
Die Gruppe der benutzerzuweisungen Identitäten, die der Ressource zugeordnet sind. Die Wörterbuchschlüssel "userAssignedIdentities" sind ARM-Ressourcen-IDs im Formular: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Die Wörterbuchwerte können leere Objekte ({}) in Anforderungen sein.

ManagedServiceIdentityType

Typ der verwalteten Dienstidentität (wobei systemAssigned- und UserAssigned-Typen zulässig sind).

Wert Beschreibung
None
SystemAssigned
SystemAssigned,UserAssigned
UserAssigned

OrderString

Wert Beschreibung
CreatedAtAsc
CreatedAtDesc
UpdatedAtAsc
UpdatedAtDesc

PoolProvisioningState

Stand der Bereitstellung poolbezogener Ressourcen.

Wert Beschreibung
Canceled
Creating
Deleting
Failed
Succeeded
Updating

ProbeSettings

Konfiguration der Bereitstellungscontainer-Live-/Bereitschaftstestkonfiguration.

Name Typ Standardwert Beschreibung
failureThreshold

integer (int32)

30

Die Anzahl der Fehler, die zugelassen werden sollen, bevor ein fehlerhafter Status zurückgegeben wird.

initialDelay

string (duration)

Die Verzögerung vor der ersten Probe im ISO 8601-Format.

period

string (duration)

PT10S

Die Dauer zwischen Probes im ISO 8601-Format.

successThreshold

integer (int32)

1

Die Anzahl der erfolgreichen Probe, bevor ein fehlerfreier Status zurückgegeben wird.

timeout

string (duration)

PT2S

Das Timeout der Probe im ISO 8601-Format.

Sku

Die Definition des Ressourcenmodells, die SKU darstellt

Name Typ Beschreibung
capacity

integer (int32)

Wenn die SKU skalierungs-/in unterstützt, sollte die Ganze Kapazität eingeschlossen werden. Wenn eine Skalierung für die Ressource nicht möglich ist, wird dies möglicherweise weggelassen.

family

string

Wenn der Dienst über unterschiedliche Hardwaregenerationen verfügt, kann dies für dieselbe SKU hier erfasst werden.

name

string

Der Name der SKU. Ex - P3. Es handelt sich in der Regel um einen Buchstaben+Zahlencode.

size

string

Die SKU-Größe. Wenn das Namensfeld die Kombination aus Ebene und einem anderen Wert ist, wäre dies der eigenständige Code.

tier

SkuTier

Dieses Feld muss vom Ressourcenanbieter implementiert werden, wenn der Dienst mehr als eine Ebene aufweist, für einen PUT jedoch nicht erforderlich ist.

SkuTier

Dieses Feld muss vom Ressourcenanbieter implementiert werden, wenn der Dienst mehr als eine Ebene aufweist, für einen PUT jedoch nicht erforderlich ist.

Wert Beschreibung
Basic
Free
Premium
Standard

StringStringKeyValuePair

Name Typ Beschreibung
key

string

value

string

systemData

Metadaten zur Erstellung und letzten Änderung der Ressource.

Name Typ Beschreibung
createdAt

string (date-time)

Der Zeitstempel der Ressourcenerstellung (UTC).

createdBy

string

Die Identität, die die Ressource erstellt hat.

createdByType

createdByType

Der Identitätstyp, der die Ressource erstellt hat.

lastModifiedAt

string (date-time)

Der Zeitstempel der letzten Änderung der Ressource (UTC)

lastModifiedBy

string

Die Identität, die die Ressource zuletzt geändert hat.

lastModifiedByType

createdByType

Der Identitätstyp, der die Ressource zuletzt geändert hat.

UserAssignedIdentity

Benutzer zugewiesene Identitätseigenschaften

Name Typ Beschreibung
clientId

string (uuid)

Die Client-ID der zugewiesenen Identität.

principalId

string (uuid)

Die Prinzipal-ID der zugewiesenen Identität.