Megosztás a következőn keresztül:


Online Deployments - List

Következtetési végpont üzembe helyezésének listázása.

GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2024-10-01
GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.MachineLearningServices/workspaces/{workspaceName}/onlineEndpoints/{endpointName}/deployments?api-version=2024-10-01&$orderBy={$orderBy}&$top={$top}&$skip={$skip}

URI-paraméterek

Name In Kötelező Típus Description
endpointName
path True

string

Következtetésvégpont neve.

resourceGroupName
path True

string

minLength: 1
maxLength: 90

Az erőforráscsoport neve. A név nem megkülönbözteti a kis- és nagybetűket.

subscriptionId
path True

string

minLength: 1

A cél-előfizetés azonosítója.

workspaceName
path True

string

pattern: ^[a-zA-Z0-9][a-zA-Z0-9_-]{2,32}$

Az Azure Machine Learning-munkaterület neve.

api-version
query True

string

minLength: 1

A művelethez használni kívánt API-verzió.

$orderBy
query

string

A lista sorrendje.

$skip
query

string

Folytatási jogkivonat lapozáshoz.

$top
query

integer (int32)

A lista tetején.

Válaszok

Name Típus Description
200 OK

OnlineDeploymentTrackedResourceArmPaginatedResult

Siker

Other Status Codes

ErrorResponse

Hiba

Példák

List Online Deployments.

Mintakérelem

GET https://management.azure.com/subscriptions/00000000-1111-2222-3333-444444444444/resourceGroups/test-rg/providers/Microsoft.MachineLearningServices/workspaces/my-aml-workspace/onlineEndpoints/testEndpointName/deployments?api-version=2024-10-01&$orderBy=string&$top=1

Mintaválasz

{
  "value": [
    {
      "id": "string",
      "name": "string",
      "type": "string",
      "properties": {
        "description": "string",
        "properties": {
          "string": "string"
        },
        "codeConfiguration": {
          "codeId": "string",
          "scoringScript": "string"
        },
        "environmentId": "string",
        "environmentVariables": {
          "string": "string"
        },
        "scaleSettings": {
          "scaleType": "Default"
        },
        "requestSettings": {
          "maxQueueWait": "PT5M",
          "requestTimeout": "PT5M",
          "maxConcurrentRequestsPerInstance": 1
        },
        "modelMountPath": "string",
        "appInsightsEnabled": false,
        "livenessProbe": {
          "failureThreshold": 1,
          "successThreshold": 1,
          "timeout": "PT5M",
          "period": "PT5M",
          "initialDelay": "PT5M"
        },
        "provisioningState": "Creating",
        "instanceType": "string",
        "model": "string",
        "endpointComputeType": "Kubernetes",
        "containerResourceRequirements": {
          "containerResourceRequests": {
            "cpu": "\"1\"",
            "memory": "\"2Gi\"",
            "gpu": "\"1\""
          },
          "containerResourceLimits": {
            "cpu": "\"1\"",
            "memory": "\"2Gi\"",
            "gpu": "\"1\""
          }
        }
      },
      "systemData": {
        "createdAt": "2020-01-01T12:34:56.999Z",
        "createdBy": "string",
        "createdByType": "User",
        "lastModifiedAt": "2020-01-01T12:34:56.999Z",
        "lastModifiedBy": "string",
        "lastModifiedByType": "User"
      },
      "tags": {},
      "location": "string",
      "kind": "string",
      "identity": {
        "type": "SystemAssigned",
        "principalId": "00000000-1111-2222-3333-444444444444",
        "tenantId": "00000000-1111-2222-3333-444444444444",
        "userAssignedIdentities": {
          "string": {
            "principalId": "00000000-1111-2222-3333-444444444444",
            "clientId": "00000000-1111-2222-3333-444444444444"
          }
        }
      },
      "sku": {
        "name": "string",
        "tier": "Free",
        "size": "string",
        "family": "string",
        "capacity": 1
      }
    }
  ],
  "nextLink": "string"
}

Definíciók

Name Description
CodeConfiguration

Pontozókód-objektum konfigurációja.

Collection
ContainerResourceRequirements

Az online üzemelő példányokon belüli egyes tárolópéldányok erőforráskövetelményei.

ContainerResourceSettings
createdByType

Az erőforrást létrehozó identitás típusa.

DataCollectionMode
DataCollector
DefaultScaleSettings
DeploymentProvisioningState

A DeploymentProvisioningState lehetséges értékei.

EgressPublicNetworkAccessType

Enum annak megállapításához, hogy a PublicNetworkAccess engedélyezve vagy letiltva van-e az üzembe helyezés kimenő forgalmához.

EndpointComputeType

Enum a végpont számítási típusának meghatározásához.

ErrorAdditionalInfo

Az erőforrás-kezelési hiba további információi.

ErrorDetail

A hiba részletei.

ErrorResponse

Hibaválasz

KubernetesOnlineDeployment

A KubernetesOnlineDeployment tulajdonsága.

ManagedOnlineDeployment

A ManagedOnlineDeploymentre jellemző tulajdonságok.

ManagedServiceIdentity

Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások)

ManagedServiceIdentityType

A felügyelt szolgáltatás identitásának típusa (ahol a SystemAssigned és a UserAssigned típus is engedélyezett).

OnlineDeploymentTrackedResource
OnlineDeploymentTrackedResourceArmPaginatedResult

Az OnlineDeployment entitások lapszámozott listája.

OnlineRequestSettings

Online üzembehelyezési pontozási kérelmek konfigurációja.

ProbeSettings

Az üzembehelyezési tároló élettartamának/készültségi mintavételének konfigurációja.

RequestLogging
RollingRateType
ScaleType
Sku

A termékváltozatot képviselő erőforrásmodell-definíció

SkuTier

Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges.

systemData

Az erőforrás létrehozásával és utolsó módosításával kapcsolatos metaadatok.

TargetUtilizationScaleSettings
UserAssignedIdentity

Felhasználó által hozzárendelt identitástulajdonságok

CodeConfiguration

Pontozókód-objektum konfigurációja.

Name Típus Description
codeId

string

A kódobjektum ARM-erőforrás-azonosítója.

scoringScript

string

minLength: 1
pattern: [a-zA-Z0-9_]

[Kötelező] Az indításkor végrehajtandó szkript. Pl.. "score.py"

Collection

Name Típus Alapértelmezett érték Description
clientId

string

A blobtárolóba történő naplózás gyűjtéséhez használt MSI-ügyfélazonosító. Null érték esetén a háttérrendszer kiválaszt egy regisztrált végponti identitást a hitelesítéshez.

dataCollectionMode

DataCollectionMode

Disabled

Adatgyűjtés engedélyezése vagy letiltása.

dataId

string

Az adategység arm-erőforrás-azonosítója. Az ügyféloldal biztosítja, hogy az adategység a blobtárolóra mutasson, a háttérrendszer pedig adatokat gyűjt a blobtárolóba.

samplingRate

number (double)

1

A gyűjtés mintavételezési sebessége. Az 1.0 mintavételezési sebesség azt jelenti, hogy alapértelmezés szerint 100% adatot gyűjtünk össze.

ContainerResourceRequirements

Az online üzemelő példányokon belüli egyes tárolópéldányok erőforráskövetelményei.

Name Típus Description
containerResourceLimits

ContainerResourceSettings

Tárolóerőforrás-korlát adatai:

containerResourceRequests

ContainerResourceSettings

Tárolóerőforrás-kérelem adatai:

ContainerResourceSettings

Name Típus Description
cpu

string

A tárolóhoz tartozó vCPU-kérések/korlátok száma. További információ: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

gpu

string

Nvidia GPU-kártyák kérésének/korlátjának száma a tárolóhoz. További információ: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

memory

string

Tároló memóriaméret-kérése/korlátja. További információ: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/

createdByType

Az erőforrást létrehozó identitás típusa.

Érték Description
Application
Key
ManagedIdentity
User

DataCollectionMode

Érték Description
Disabled
Enabled

DataCollector

Name Típus Alapértelmezett érték Description
collections

<string,  Collection>

[Kötelező] A gyűjtemény konfigurációja. Minden gyűjtemény saját konfigurációval rendelkezik a modelladatok gyűjtéséhez, és a gyűjtemény neve tetszőleges sztring lehet. A modelladatgyűjtő hasznos adatnaplózáshoz, egyéni naplózáshoz vagy mindkettőhöz használható. A gyűjteménykérés és a válasz a hasznos adatok naplózására van fenntartva, mások egyéni naplózásra szolgálnak.

requestLogging

RequestLogging

Az mdc kérésnaplózási konfigurációja az összes gyűjtemény speciális naplózási beállításait tartalmazza. Nem kötelező.

rollingRate

RollingRateType

Hour

Amikor a modelladatokat a blobtárolóba gyűjti, az adatokat más elérési útra kell dobnunk, hogy ne naplózzuk őket egyetlen blobfájlba. Ha a gördülési sebesség óra, a rendszer minden adatot a /éééé/HH/HH/blobútvonalon gyűjt. Ha ez a nap, az összes adat a blob elérési útján lesz összegyűjtve /ééééé/MM/dd/. A gördülő út másik előnye, hogy a modellmonitorozási felhasználói felület nagyon gyorsan képes kiválasztani egy adattartományt.

DefaultScaleSettings

Name Típus Description
scaleType string:

Default

[Kötelező] Az üzembehelyezési skálázási algoritmus típusa

DeploymentProvisioningState

A DeploymentProvisioningState lehetséges értékei.

Érték Description
Canceled
Creating
Deleting
Failed
Scaling
Succeeded
Updating

EgressPublicNetworkAccessType

Enum annak megállapításához, hogy a PublicNetworkAccess engedélyezve vagy letiltva van-e az üzembe helyezés kimenő forgalmához.

Érték Description
Disabled
Enabled

EndpointComputeType

Enum a végpont számítási típusának meghatározásához.

Érték Description
AzureMLCompute
Kubernetes
Managed

ErrorAdditionalInfo

Az erőforrás-kezelési hiba további információi.

Name Típus Description
info

object

A további információk.

type

string

A további információtípus.

ErrorDetail

A hiba részletei.

Name Típus Description
additionalInfo

ErrorAdditionalInfo[]

A hiba további információi.

code

string

A hibakód.

details

ErrorDetail[]

A hiba részletei.

message

string

A hibaüzenet.

target

string

A hibacél.

ErrorResponse

Hibaválasz

Name Típus Description
error

ErrorDetail

A hibaobjektum.

KubernetesOnlineDeployment

A KubernetesOnlineDeployment tulajdonsága.

Name Típus Alapértelmezett érték Description
appInsightsEnabled

boolean

False

Ha igaz, engedélyezi az Application Insights naplózását.

codeConfiguration

CodeConfiguration

A végpont üzembe helyezésének kódkonfigurációja.

containerResourceRequirements

ContainerResourceRequirements

A tároló erőforráskövetelményei (processzor és memória).

dataCollector

DataCollector

Az mdc-konfiguráció null érték esetén letiltja az mdc-t.

description

string

A végpont üzembe helyezésének leírása.

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

Ha engedélyezve van, engedélyezze a kimenő hálózati hozzáférést. Ha le van tiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve.

endpointComputeType string:

Kubernetes

[Kötelező] A végpont számítási típusa.

environmentId

string

A végponttelepítés környezeti specifikációjának ARM-erőforrás-azonosítója vagy AssetId-azonosítója.

environmentVariables

object

Környezeti változók konfigurálása az üzembe helyezéshez.

instanceType

string

Standard_F4s_v2

Számítási példány típusa. Alapértelmezett: Standard_F4s_v2.

livenessProbe

ProbeSettings

A Liveness-mintavétel rendszeresen figyeli a tároló állapotát.

model

string

A modell URI-elérési útja.

modelMountPath

string

A modell egyéni tárolóban való csatlakoztatásának elérési útja.

properties

object

Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók.

provisioningState

DeploymentProvisioningState

A végpont üzembe helyezésének kiépítési állapota.

readinessProbe

ProbeSettings

A készültségi mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élőség-mintavétellel.

requestSettings

OnlineRequestSettings

Az üzembe helyezés beállításainak kérése.

scaleSettings OnlineScaleSettings:

Az üzembe helyezés méretezési beállításai. Ha null értékű vagy nincs megadva, alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings és a ManagedOnlineDeployment alapértelmezettScaleSettings értéke.

startupProbe

ProbeSettings

Az indítási mintavétel ellenőrzi, hogy egy tárolón belüli alkalmazás sikeresen elindult-e.

ManagedOnlineDeployment

A ManagedOnlineDeploymentre jellemző tulajdonságok.

Name Típus Alapértelmezett érték Description
appInsightsEnabled

boolean

False

Ha igaz, engedélyezi az Application Insights naplózását.

codeConfiguration

CodeConfiguration

A végpont üzembe helyezésének kódkonfigurációja.

dataCollector

DataCollector

Az mdc-konfiguráció null érték esetén letiltja az mdc-t.

description

string

A végpont üzembe helyezésének leírása.

egressPublicNetworkAccess

EgressPublicNetworkAccessType

Enabled

Ha engedélyezve van, engedélyezze a kimenő hálózati hozzáférést. Ha le van tiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve.

endpointComputeType string:

Managed

[Kötelező] A végpont számítási típusa.

environmentId

string

A végponttelepítés környezeti specifikációjának ARM-erőforrás-azonosítója vagy AssetId-azonosítója.

environmentVariables

object

Környezeti változók konfigurálása az üzembe helyezéshez.

instanceType

string

Standard_F4s_v2

Számítási példány típusa. Alapértelmezett: Standard_F4s_v2.

livenessProbe

ProbeSettings

A Liveness-mintavétel rendszeresen figyeli a tároló állapotát.

model

string

A modell URI-elérési útja.

modelMountPath

string

A modell egyéni tárolóban való csatlakoztatásának elérési útja.

properties

object

Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók.

provisioningState

DeploymentProvisioningState

A végpont üzembe helyezésének kiépítési állapota.

readinessProbe

ProbeSettings

A készültségi mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élőség-mintavétellel.

requestSettings

OnlineRequestSettings

Az üzembe helyezés beállításainak kérése.

scaleSettings OnlineScaleSettings:

Az üzembe helyezés méretezési beállításai. Ha null értékű vagy nincs megadva, alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings és a ManagedOnlineDeployment alapértelmezettScaleSettings értéke.

startupProbe

ProbeSettings

Az indítási mintavétel ellenőrzi, hogy egy tárolón belüli alkalmazás sikeresen elindult-e.

ManagedServiceIdentity

Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások)

Name Típus Description
principalId

string (uuid)

A rendszer által hozzárendelt identitás szolgáltatásnév-azonosítója. Ez a tulajdonság csak a rendszer által hozzárendelt identitáshoz lesz megadva.

tenantId

string (uuid)

A rendszer által hozzárendelt identitás bérlőazonosítója. Ez a tulajdonság csak a rendszer által hozzárendelt identitáshoz lesz megadva.

type

ManagedServiceIdentityType

A felügyelt szolgáltatás identitásának típusa (ahol a SystemAssigned és a UserAssigned típus is engedélyezett).

userAssignedIdentities

<string,  UserAssignedIdentity>

User-Assigned identitások
Az erőforráshoz társított felhasználó által hozzárendelt identitások készlete. A userAssignedIdentities szótárkulcsok arm-erőforrásazonosítók lesznek a következő formában: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. A szótár értékei lehetnek üres objektumok ({}) a kérelmekben.

ManagedServiceIdentityType

A felügyelt szolgáltatás identitásának típusa (ahol a SystemAssigned és a UserAssigned típus is engedélyezett).

Érték Description
None
SystemAssigned
SystemAssigned,UserAssigned
UserAssigned

OnlineDeploymentTrackedResource

Name Típus Description
id

string

Az erőforrás teljes erőforrás-azonosítója. Ex - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

identity

ManagedServiceIdentity

Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások)

kind

string

A portál/eszközhasználat/stb. által használt metaadatok különböző UX-élményeket jelenítenek meg az azonos típusú erőforrásokhoz.

location

string

Az a földrajzi hely, ahol az erőforrás él

name

string

Az erőforrás neve

properties OnlineDeployment:

[Kötelező] Az entitás további attribútumai.

sku

Sku

Az automatikus skálázáshoz szükséges ARM-szerződéshez szükséges termékváltozat részletei.

systemData

systemData

A createdBy és a modifiedBy adatokat tartalmazó Azure Resource Manager-metaadatok.

tags

object

Erőforráscímkék.

type

string

Az erőforrás típusa. Pl. "Microsoft.Compute/virtualMachines" vagy "Microsoft.Storage/storageAccounts"

OnlineDeploymentTrackedResourceArmPaginatedResult

Az OnlineDeployment entitások lapszámozott listája.

Name Típus Description
nextLink

string

Az OnlineDeployment objektumok következő oldalára mutató hivatkozás. Null érték esetén nincsenek további lapok.

value

OnlineDeploymentTrackedResource[]

OnlineDeployment típusú objektumok tömbje.

OnlineRequestSettings

Online üzembehelyezési pontozási kérelmek konfigurációja.

Name Típus Alapértelmezett érték Description
maxConcurrentRequestsPerInstance

integer (int32)

1

Az üzemelő példányonként engedélyezett csomópontonkénti egyidejű kérelmek maximális száma. Alapértelmezett érték: 1.

maxQueueWait

string (duration)

PT0.5S

(Elavult a felügyelt online végpontok esetében) A kérések maximális időtartama ISO 8601 formátumban marad az üzenetsorban. Alapértelmezés szerint 500 ms. (Most növelje a request_timeout_ms, hogy figyelembe vegyék a hálózat/üzenetsor késését)

requestTimeout

string (duration)

PT5S

A pontozási időtúllépés ISO 8601 formátumban. Alapértelmezés szerint 5000 ms.

ProbeSettings

Az üzembehelyezési tároló élettartamának/készültségi mintavételének konfigurációja.

Name Típus Alapértelmezett érték Description
failureThreshold

integer (int32)

30

Azoknak a hibáknak a száma, amelyek engedélyezve lesznek, mielőtt nem megfelelő állapotot ad vissza.

initialDelay

string (duration)

Az ISO 8601 formátumú első mintavétel előtti késleltetés.

period

string (duration)

PT10S

Az ISO 8601 formátumú mintavételek közötti időtartam.

successThreshold

integer (int32)

1

A sikeres mintavételek száma az állapot visszaadása előtt.

timeout

string (duration)

PT2S

A mintavétel időtúllépése ISO 8601 formátumban.

RequestLogging

Name Típus Description
captureHeaders

string[]

A hasznos adatok naplózásához alapértelmezés szerint csak hasznos adatokat gyűjtünk. Ha az ügyfelek a megadott fejléceket is szeretnék összegyűjteni, beállíthatják őket a captureHeadersben, hogy a háttérrendszer ezeket a fejléceket és a hasznos adatokat is összegyűjtse.

RollingRateType

Érték Description
Day
Hour
Minute
Month
Year

ScaleType

Érték Description
Default
TargetUtilization

Sku

A termékváltozatot képviselő erőforrásmodell-definíció

Name Típus Description
capacity

integer (int32)

Ha az SKU támogatja a vertikális felskálázást/azt, akkor a kapacitás egészét is tartalmaznia kell. Ha az erőforrás esetében nem lehetséges a vertikális felskálázás/beskálázás, akkor ez kihagyható.

family

string

Ha a szolgáltatás különböző hardvergenerációval rendelkezik ugyanahhoz az SKU-hoz, akkor ezt itt rögzítheti.

name

string

Az termékváltozat neve. Ex - P3. Ez általában egy betű+szám kód

size

string

A termékváltozat mérete. Ha a névmező a réteg és más értékek kombinációja, akkor ez a különálló kód.

tier

SkuTier

Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges.

SkuTier

Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges.

Érték Description
Basic
Free
Premium
Standard

systemData

Az erőforrás létrehozásával és utolsó módosításával kapcsolatos metaadatok.

Name Típus Description
createdAt

string (date-time)

Az erőforrás-létrehozás időbélyege (UTC).

createdBy

string

Az erőforrást létrehozó identitás.

createdByType

createdByType

Az erőforrást létrehozó identitás típusa.

lastModifiedAt

string (date-time)

Az erőforrás utolsó módosításának időbélyege (UTC)

lastModifiedBy

string

Az erőforrást legutóbb módosító identitás.

lastModifiedByType

createdByType

Az erőforrást legutóbb módosító identitás típusa.

TargetUtilizationScaleSettings

Name Típus Alapértelmezett érték Description
maxInstances

integer (int32)

1

A példányok maximális száma, amelyekre az üzembe helyezés méretezhető. A kvóta max_instances lesz fenntartva.

minInstances

integer (int32)

1

A mindig jelen lévő példányok minimális száma.

pollingInterval

string (duration)

PT1S

A lekérdezési időköz ISO 8691 formátumban. Csak másodperces pontossággal támogatja az időtartamot.

scaleType string:

TargetUtilization

[Kötelező] Az üzembehelyezési skálázási algoritmus típusa

targetUtilizationPercentage

integer (int32)

70

Cél CPU-használat az automatikus skálázáshoz.

UserAssignedIdentity

Felhasználó által hozzárendelt identitástulajdonságok

Name Típus Description
clientId

string (uuid)

A hozzárendelt identitás ügyfélazonosítója.

principalId

string (uuid)

A hozzárendelt identitás egyszerű azonosítója.