Delen via


Online Deployments - List

Implementaties van deductie-eindpunten weergeven.

GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2024-04-01
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2024-04-01&$orderBy={$orderBy}&$top={$top}&$skip={$skip}

URI-parameters

Name In Vereist Type Description
endpointName
path True

string

Naam van eindpunt deductie.

resourceGroupName
path True

string

De naam van de resourcegroep. De naam is niet hoofdlettergevoelig.

subscriptionId
path True

string

De id van het doelabonnement.

workspaceName
path True

string

Naam van Azure Machine Learning-werkruimte.

Regex-patroon: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$

api-version
query True

string

De API-versie die voor deze bewerking moet worden gebruikt.

$orderBy
query

string

Volgorde van lijst.

$skip
query

string

Vervolgtoken voor paginering.

$top
query

integer

int32

Boven aan lijst.

Antwoorden

Name Type Description
200 OK

OnlineDeploymentTrackedResourceArmPaginatedResult

Geslaagd

Other Status Codes

ErrorResponse

Fout

Voorbeelden

List Online Deployments.

Voorbeeldaanvraag

GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2024-04-01&$orderBy=string&$top=1

Voorbeeldrespons

{
  "value": [
    {
      "id": "string",
      "name": "string",
      "type": "string",
      "properties": {
        "description": "string",
        "properties": {
          "string": "string"
        },
        "codeConfiguration": {
          "codeId": "string",
          "scoringScript": "string"
        },
        "environmentId": "string",
        "environmentVariables": {
          "string": "string"
        },
        "scaleSettings": {
          "scaleType": "Default"
        },
        "requestSettings": {
          "maxQueueWait": "PT5M",
          "requestTimeout": "PT5M",
          "maxConcurrentRequestsPerInstance": 1
        },
        "modelMountPath": "string",
        "appInsightsEnabled": false,
        "livenessProbe": {
          "failureThreshold": 1,
          "successThreshold": 1,
          "timeout": "PT5M",
          "period": "PT5M",
          "initialDelay": "PT5M"
        },
        "provisioningState": "Creating",
        "instanceType": "string",
        "model": "string",
        "endpointComputeType": "Kubernetes",
        "containerResourceRequirements": {
          "containerResourceRequests": {
            "cpu": "\"1\"",
            "memory": "\"2Gi\"",
            "gpu": "\"1\""
          },
          "containerResourceLimits": {
            "cpu": "\"1\"",
            "memory": "\"2Gi\"",
            "gpu": "\"1\""
          }
        }
      },
      "systemData": {
        "createdAt": "2020-01-01T12:34:56.999Z",
        "createdBy": "string",
        "createdByType": "User",
        "lastModifiedAt": "2020-01-01T12:34:56.999Z",
        "lastModifiedBy": "string",
        "lastModifiedByType": "User"
      },
      "tags": {},
      "location": "string",
      "kind": "string",
      "identity": {
        "type": "SystemAssigned",
        "principalId": "00000000-1111-2222-3333-444444444444",
        "tenantId": "00000000-1111-2222-3333-444444444444",
        "userAssignedIdentities": {
          "string": {
            "principalId": "00000000-1111-2222-3333-444444444444",
            "clientId": "00000000-1111-2222-3333-444444444444"
          }
        }
      },
      "sku": {
        "name": "string",
        "tier": "Free",
        "size": "string",
        "family": "string",
        "capacity": 1
      }
    }
  ],
  "nextLink": "string"
}

Definities

Name Description
CodeConfiguration

Configuratie voor een scorecodeasset.

Collection
ContainerResourceRequirements

Resourcevereisten voor elk containerexemplementatie binnen een online-implementatie.

ContainerResourceSettings
createdByType

Het type identiteit waarmee de resource is gemaakt.

DataCollectionMode
DataCollector
DefaultScaleSettings
DeploymentProvisioningState

Mogelijke waarden voor DeploymentProvisioningState.

EgressPublicNetworkAccessType

Opsomming om te bepalen of PublicNetworkAccess is ingeschakeld of uitgeschakeld voor uitgaand verkeer van een implementatie.

EndpointComputeType

Opsomming om het rekentype van het eindpunt te bepalen.

ErrorAdditionalInfo

Aanvullende informatie over de resourcebeheerfout.

ErrorDetail

De foutdetails.

ErrorResponse

Foutreactie

KubernetesOnlineDeployment

Eigenschappen die specifiek zijn voor een KubernetesOnlineDeployment.

ManagedOnlineDeployment

Eigenschappen die specifiek zijn voor een ManagedOnlineDeployment.

ManagedServiceIdentity

Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten)

ManagedServiceIdentityType

Type beheerde service-identiteit (waarbij zowel SystemAssigned als UserAssigned zijn toegestaan).

OnlineDeploymentTrackedResource
OnlineDeploymentTrackedResourceArmPaginatedResult

Een gepagineerde lijst met OnlineDeployment-entiteiten.

OnlineRequestSettings

Configuratie van scoreaanvragen voor online-implementatie.

ProbeSettings

Configuratie van implementatiecontainer-/gereedheidstest.

RequestLogging
RollingRateType
ScaleType
Sku

De definitie van het resourcemodel die de SKU vertegenwoordigt

SkuTier

Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT.

systemData

Metagegevens met betrekking tot het maken en laatste wijzigen van de resource.

TargetUtilizationScaleSettings
UserAssignedIdentity

Eigenschappen van door de gebruiker toegewezen identiteit

CodeConfiguration

Configuratie voor een scorecodeasset.

Name Type Description
codeId

string

ARM-resource-id van de code-asset.

scoringScript

string

[Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py"

Collection

Name Type Default value Description
clientId

string

De msi-client-id die wordt gebruikt voor het verzamelen van logboekregistratie naar blob-opslag. Als deze null is, kiest de back-end een geregistreerde eindpuntidentiteit voor verificatie.

dataCollectionMode

DataCollectionMode

Disabled

Gegevensverzameling in- of uitschakelen.

dataId

string

De resource-id van de arm van de gegevensasset. De clientzijde zorgt ervoor dat de gegevensasset naar de blob-opslag wijst en dat de back-end gegevens verzamelt naar de blob-opslag.

samplingRate

number

1

De steekproeffrequentie voor verzameling. Steekproeffrequentie 1,0 betekent dat we standaard 100% van de gegevens verzamelen.

ContainerResourceRequirements

Resourcevereisten voor elk containerexemplementatie binnen een online-implementatie.

Name Type Description
containerResourceLimits

ContainerResourceSettings

Informatie over containerresourcelimiet:

containerResourceRequests

ContainerResourceSettings

Informatie over aanvraag van containerresource:

ContainerResourceSettings

Name Type Description
cpu

string

Aantal vCPU's aanvraag/limiet voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

gpu

string

Aantal Nvidia GPU-kaarten aanvraag/limiet voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

memory

string

Aanvraag/limiet voor geheugengrootte voor container. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

createdByType

Het type identiteit waarmee de resource is gemaakt.

Name Type Description
Application

string

Key

string

ManagedIdentity

string

User

string

DataCollectionMode

Name Type Description
Disabled

string

Enabled

string

DataCollector

Name Type Default value Description
collections

<string,  Collection>

[Vereist] De configuratie van de verzameling. Elke verzameling heeft een eigen configuratie voor het verzamelen van modelgegevens en de naam van de verzameling kan een willekeurige tekenreeks zijn. Modelgegevensverzamelaar kan worden gebruikt voor logboekregistratie van nettoladingen of aangepaste logboekregistratie of beide. Verzamelingsaanvragen en -antwoorden zijn gereserveerd voor logboekregistratie van nettoladingen, andere zijn voor aangepaste logboekregistratie.

requestLogging

RequestLogging

De configuratie van aanvraaglogboekregistratie voor mdc bevat geavanceerde instellingen voor logboekregistratie voor alle verzamelingen. Dit is niet verplicht.

rollingRate

RollingRateType

Hour

Wanneer modelgegevens worden verzameld naar blobopslag, moeten we de gegevens naar een ander pad verplaatsen om te voorkomen dat ze allemaal in één blobbestand worden geregistreerd. Als de doorlopende snelheid uur is, worden alle gegevens verzameld in het blobpad /jjjj/MM/dd/HH/. Als het dag is, worden alle gegevens verzameld in het blobpad /jjjj/MM/dd/. Het andere voordeel van het doorlopende pad is dat de gebruikersinterface voor modelbewaking zeer snel een tijdsbereik met gegevens kan selecteren.

DefaultScaleSettings

Name Type Description
scaleType string:

Default

[Vereist] Type algoritme voor het schalen van implementaties

DeploymentProvisioningState

Mogelijke waarden voor DeploymentProvisioningState.

Name Type Description
Canceled

string

Creating

string

Deleting

string

Failed

string

Scaling

string

Succeeded

string

Updating

string

EgressPublicNetworkAccessType

Opsomming om te bepalen of PublicNetworkAccess is ingeschakeld of uitgeschakeld voor uitgaand verkeer van een implementatie.

Name Type Description
Disabled

string

Enabled

string

EndpointComputeType

Opsomming om het rekentype van het eindpunt te bepalen.

Name Type Description
AzureMLCompute

string

Kubernetes

string

Managed

string

ErrorAdditionalInfo

Aanvullende informatie over de resourcebeheerfout.

Name Type Description
info

object

De aanvullende informatie.

type

string

Het type aanvullende informatie.

ErrorDetail

De foutdetails.

Name Type Description
additionalInfo

ErrorAdditionalInfo[]

De fout aanvullende informatie.

code

string

De foutcode.

details

ErrorDetail[]

De foutdetails.

message

string

Het foutbericht.

target

string

Het foutdoel.

ErrorResponse

Foutreactie

Name Type Description
error

ErrorDetail

Het foutobject.

KubernetesOnlineDeployment

Eigenschappen die specifiek zijn voor een KubernetesOnlineDeployment.

Name Type Default value Description
appInsightsEnabled

boolean

False

Als dit waar is, schakelt u Application Insights-logboekregistratie in.

codeConfiguration

CodeConfiguration

Codeconfiguratie voor de eindpuntimplementatie.

containerResourceRequirements

ContainerResourceRequirements

De resourcevereisten voor de container (CPU en geheugen).

dataCollector

DataCollector

Bij de mdc-configuratie schakelen we mdc uit wanneer deze null is.

description

string

Beschrijving van de eindpuntimplementatie.

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

Als deze optie is ingeschakeld, staat u openbare netwerktoegang voor uitgaand verkeer toe. Als uitgeschakeld, wordt er een beveiligd uitgaand verkeer gemaakt. Standaardinstelling: ingeschakeld.

endpointComputeType string:

Kubernetes

[Vereist] Het rekentype van het eindpunt.

environmentId

string

ARM-resource-id of AssetId van de omgevingsspecificatie voor de eindpuntimplementatie.

environmentVariables

object

Configuratie van omgevingsvariabelen voor de implementatie.

instanceType

string

Type rekenproces.

livenessProbe

ProbeSettings

De statustest controleert regelmatig de status van de container.

model

string

Het URI-pad naar het model.

modelMountPath

string

Het pad voor het koppelen van het model in een aangepaste container.

properties

object

Eigenschappenwoordenlijst. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd.

provisioningState

DeploymentProvisioningState

Inrichtingsstatus voor de eindpuntimplementatie.

readinessProbe

ProbeSettings

De gereedheidstest valideert of de container gereed is voor verkeer. De eigenschappen en standaardwaarden zijn hetzelfde als de statustest.

requestSettings

OnlineRequestSettings

Aanvraaginstellingen voor de implementatie.

scaleSettings OnlineScaleSettings:

Schaalinstellingen voor de implementatie. Als deze null is of niet is opgegeven, wordt de standaardinstelling TargetUtilizationScaleSettings voor KubernetesOnlineDeployment en DefaultScaleSettings voor ManagedOnlineDeployment gebruikt.

ManagedOnlineDeployment

Eigenschappen die specifiek zijn voor een ManagedOnlineDeployment.

Name Type Default value Description
appInsightsEnabled

boolean

False

Als dit waar is, schakelt u Application Insights-logboekregistratie in.

codeConfiguration

CodeConfiguration

Codeconfiguratie voor de eindpuntimplementatie.

dataCollector

DataCollector

Bij de mdc-configuratie schakelen we mdc uit wanneer deze null is.

description

string

Beschrijving van de eindpuntimplementatie.

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

Als deze optie is ingeschakeld, staat u openbare netwerktoegang voor uitgaand verkeer toe. Als uitgeschakeld, wordt er een beveiligd uitgaand verkeer gemaakt. Standaardinstelling: ingeschakeld.

endpointComputeType string:

Managed

[Vereist] Het rekentype van het eindpunt.

environmentId

string

ARM-resource-id of AssetId van de omgevingsspecificatie voor de eindpuntimplementatie.

environmentVariables

object

Configuratie van omgevingsvariabelen voor de implementatie.

instanceType

string

Type rekenproces.

livenessProbe

ProbeSettings

De statustest controleert regelmatig de status van de container.

model

string

Het URI-pad naar het model.

modelMountPath

string

Het pad voor het koppelen van het model in een aangepaste container.

properties

object

Eigenschappenwoordenlijst. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd.

provisioningState

DeploymentProvisioningState

Inrichtingsstatus voor de eindpuntimplementatie.

readinessProbe

ProbeSettings

De gereedheidstest valideert of de container gereed is voor verkeer. De eigenschappen en standaardwaarden zijn hetzelfde als de statustest.

requestSettings

OnlineRequestSettings

Aanvraaginstellingen voor de implementatie.

scaleSettings OnlineScaleSettings:

Schaalinstellingen voor de implementatie. Als deze null is of niet is opgegeven, wordt de standaardinstelling TargetUtilizationScaleSettings voor KubernetesOnlineDeployment en DefaultScaleSettings voor ManagedOnlineDeployment gebruikt.

ManagedServiceIdentity

Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten)

Name Type Description
principalId

string

De service-principal-id van de door het systeem toegewezen identiteit. Deze eigenschap wordt alleen opgegeven voor een door het systeem toegewezen identiteit.

tenantId

string

De tenant-id van de door het systeem toegewezen identiteit. Deze eigenschap wordt alleen opgegeven voor een door het systeem toegewezen identiteit.

type

ManagedServiceIdentityType

Type beheerde service-identiteit (waarbij zowel SystemAssigned als UserAssigned zijn toegestaan).

userAssignedIdentities

<string,  UserAssignedIdentity>

User-Assigned identiteiten
De set door de gebruiker toegewezen identiteiten die aan de resource zijn gekoppeld. De userAssignedIdentities-woordenlijstsleutels zijn ARM-resource-id's in de volgende notatie: '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. De woordenlijstwaarden kunnen lege objecten ({}) in aanvragen zijn.

ManagedServiceIdentityType

Type beheerde service-identiteit (waarbij zowel SystemAssigned als UserAssigned zijn toegestaan).

Name Type Description
None

string

SystemAssigned

string

SystemAssigned,UserAssigned

string

UserAssigned

string

OnlineDeploymentTrackedResource

Name Type Description
id

string

Volledig gekwalificeerde resource-id voor de resource. Bijvoorbeeld - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

identity

ManagedServiceIdentity

Beheerde service-identiteit (door het systeem toegewezen en/of door de gebruiker toegewezen identiteiten)

kind

string

Metagegevens die worden gebruikt door portal/hulpprogramma's/enzovoort om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type.

location

string

De geografische locatie waar de resource zich bevindt

name

string

De naam van de resource

properties OnlineDeployment:

[Vereist] Aanvullende kenmerken van de entiteit.

sku

Sku

SKU-gegevens vereist voor het ARM-contract voor automatisch schalen.

systemData

systemData

Azure Resource Manager metagegevens met informatie over createdBy en modifiedBy.

tags

object

Resourcetags.

type

string

Het type resource. Bijvoorbeeld 'Microsoft.Compute/virtualMachines' of 'Microsoft.Storage/storageAccounts'

OnlineDeploymentTrackedResourceArmPaginatedResult

Een gepagineerde lijst met OnlineDeployment-entiteiten.

Name Type Description
nextLink

string

De koppeling naar de volgende pagina van OnlineDeployment-objecten. Als dit null is, zijn er geen extra pagina's.

value

OnlineDeploymentTrackedResource[]

Een matrix met objecten van het type OnlineDeployment.

OnlineRequestSettings

Configuratie van scoreaanvragen voor online-implementatie.

Name Type Default value Description
maxConcurrentRequestsPerInstance

integer

1

Het aantal maximaal toegestane gelijktijdige aanvragen per knooppunt per implementatie. Standaardwaarde is 1.

maxQueueWait

string

PT0.5S

(Afgeschaft voor beheerde online-eindpunten) De maximale hoeveelheid tijd dat een aanvraag in de wachtrij blijft in ISO 8601-indeling. De standaardwaarde is 500 ms. (Verhoog nu request_timeout_ms om rekening te houden met eventuele vertragingen in netwerken/wachtrijen)

requestTimeout

string

PT5S

De time-out voor scores in ISO 8601-indeling. De standaardwaarde is 5000 ms.

ProbeSettings

Configuratie van implementatiecontainer-/gereedheidstest.

Name Type Default value Description
failureThreshold

integer

30

Het aantal fouten dat moet worden toegestaan voordat de status Niet in orde wordt geretourneerd.

initialDelay

string

De vertraging voor de eerste test in ISO 8601-indeling.

period

string

PT10S

De tijdsduur tussen tests in ISO 8601-indeling.

successThreshold

integer

1

Het aantal geslaagde tests voordat de status In orde wordt geretourneerd.

timeout

string

PT2S

De testtime-out in ISO 8601-indeling.

RequestLogging

Name Type Description
captureHeaders

string[]

Voor logboekregistratie van nettoladingen verzamelen we standaard alleen nettoladingen. Als klanten ook de opgegeven headers willen verzamelen, kunnen ze deze instellen in captureHeaders, zodat de back-end deze headers samen met de nettolading verzamelt.

RollingRateType

Name Type Description
Day

string

Hour

string

Minute

string

Month

string

Year

string

ScaleType

Name Type Description
Default

string

TargetUtilization

string

Sku

De definitie van het resourcemodel die de SKU vertegenwoordigt

Name Type Description
capacity

integer

Als de SKU uitschalen/inschalen ondersteunt, moet het gehele getal van de capaciteit worden opgenomen. Als uitschalen/inschalen niet mogelijk is voor de resource, kan dit worden weggelaten.

family

string

Als de service verschillende generaties hardware voor dezelfde SKU heeft, kan die hier worden vastgelegd.

name

string

De naam van de SKU. Ex - P3. Het is meestal een letter+cijfercode

size

string

De SKU-grootte. Wanneer het naamveld de combinatie van laag en een andere waarde is, is dit de zelfstandige code.

tier

SkuTier

Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT.

SkuTier

Dit veld moet worden geïmplementeerd door de resourceprovider als de service meer dan één laag heeft, maar niet vereist is voor een PUT.

Name Type Description
Basic

string

Free

string

Premium

string

Standard

string

systemData

Metagegevens met betrekking tot het maken en laatste wijzigen van de resource.

Name Type Description
createdAt

string

De tijdstempel van het maken van resources (UTC).

createdBy

string

De identiteit die de resource heeft gemaakt.

createdByType

createdByType

Het type identiteit waarmee de resource is gemaakt.

lastModifiedAt

string

Het tijdstempel van de laatste wijziging van de resource (UTC)

lastModifiedBy

string

De identiteit die de resource het laatst heeft gewijzigd.

lastModifiedByType

createdByType

Het type identiteit dat de resource het laatst heeft gewijzigd.

TargetUtilizationScaleSettings

Name Type Default value Description
maxInstances

integer

1

Het maximum aantal exemplaren waarnaar de implementatie kan worden geschaald. Het quotum wordt gereserveerd voor max_instances.

minInstances

integer

1

Het minimale aantal exemplaren dat altijd aanwezig moet zijn.

pollingInterval

string

PT1S

Het polling-interval in ISO 8691-indeling. Alleen ondersteuning voor duur met een nauwkeurigheid van slechts seconden.

scaleType string:

TargetUtilization

[Vereist] Type algoritme voor het schalen van implementaties

targetUtilizationPercentage

integer

70

Doel-CPU-gebruik voor de automatische schaalaanpassing.

UserAssignedIdentity

Eigenschappen van door de gebruiker toegewezen identiteit

Name Type Description
clientId

string

De client-id van de toegewezen identiteit.

principalId

string

De principal-id van de toegewezen identiteit.