Share via


Microsoft.MachineLearningServices-munkaterületek/onlineEndpoints/deployments 2022-06-01-preview

Bicep-erőforrásdefiníció

A munkaterületek/onlineEndpoints/deployments erőforrástípus üzembe helyezhető olyan műveletekkel, amelyek a következőket célják:

Az egyes API-verziók módosított tulajdonságainak listáját a változásnaplóban találja.

Erőforrás formátuma

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments erőforrás létrehozásához adja hozzá a következő Bicep-et a sablonhoz.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-06-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties objektumok

Állítsa be az endpointComputeType tulajdonságot az objektum típusának megadásához.

Kubernetes esetén használja a következőt:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Felügyelt esetén használja a következőt:

  endpointComputeType: 'Managed'

OnlineScaleSettings objektumok

Állítsa be a scaleType tulajdonságot az objektum típusának megadásához.

Alapértelmezés szerint használja a következőt:

  scaleType: 'Default'

A TargetUtilization esetében használja a következőt:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Tulajdonságértékek

munkaterületek/onlineEndpoints/deployments

Név Leírás Érték
name Az erőforrás neve

Megtudhatja, hogyan állíthatja be a gyermekerőforrások nevét és típusát a Bicepben.
sztring (kötelező)
location Az a földrajzi hely, ahol az erőforrás él sztring (kötelező)
tags Erőforráscímkék. Címkenevek és -értékek szótára. Címkék megtekintése sablonokban
Sku Az automatikus skálázási ARM-szerződéshez szükséges termékváltozat részletei. Sku
Fajta A portál/eszközhasználat/stb. által használt metaadatok az azonos típusú erőforrások különböző felhasználói felületi élményének megjelenítéséhez. sztring
Szülő A Bicepben megadhatja egy gyermekerőforrás szülőerőforrását. Ezt a tulajdonságot csak akkor kell hozzáadnia, ha a gyermekerőforrás a szülőerőforráson kívül van deklarálva.

További információ: Gyermekerőforrás a szülőerőforráson kívül.
A típus erőforrásának szimbolikus neve: onlineEndpoints
identity Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások) ManagedServiceIdentity
properties [Kötelező] Az entitás további attribútumai. OnlineDeploymentProperties (kötelező)

ManagedServiceIdentity

Név Leírás Érték
típus A felügyeltszolgáltatás-identitás típusa (ahol a SystemAssigned és a UserAssigned típus egyaránt engedélyezett). "Nincs"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (kötelező)
userAssignedIdentities Az erőforráshoz társított felhasználó által hozzárendelt identitások halmaza. A userAssignedIdentities szótárkulcsok arm-erőforrás-azonosítók lesznek a következő űrlapon: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. A szótár értékei üres objektumok ({}) lehetnek a kérésekben. UserAssignedIdentities

UserAssignedIdentities

Név Leírás Érték
{testreszabott tulajdonság} UserAssignedIdentity

UserAssignedIdentity

Ez az objektum nem tartalmaz az üzembe helyezés során beállítandó tulajdonságokat. Minden tulajdonság a ReadOnly.

OnlineDeploymentProperties

Név Leírás Érték
appInsightsEnabled Ha igaz, engedélyezi az Application Insights naplózását. logikai
codeConfiguration Kódkonfiguráció a végpont üzembe helyezéséhez. CodeConfiguration
leírás A végpont üzembe helyezésének leírása. sztring
egressPublicNetworkAccess Ha engedélyezve van, engedélyezze a kimenő nyilvános hálózati hozzáférést. Ha letiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve. "Letiltva"
"Engedélyezve"
environmentId A végpont üzembe helyezésének környezeti specifikációjának ARM-erőforrás-azonosítója. sztring
environmentVariables Környezeti változók konfigurálása az üzembe helyezéshez. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Számítási példány típusa. sztring
livenessProbe Az élőképesség-mintavétel rendszeresen figyeli a tároló állapotát. ProbeSettings
modell A modell URI-elérési útja. sztring
modelMountPath A modell egyéni tárolóba való csatlakoztatásának útvonala. sztring
properties Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók. EndpointDeploymentPropertiesBaseProperties
readinessProbe A készültségi mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élőképesség-mintavétellel. ProbeSettings
requestSettings Az üzembe helyezés beállításainak kérése. OnlineRequestSettings
scaleSettings Az üzembe helyezés skálázási beállításai.
Ha null értékű, vagy nincs megadva,
alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings értéke.
és a DefaultScaleSettings for ManagedOnlineDeployment értékre.
OnlineScaleSettings
endpointComputeType Az objektumtípus beállítása Kubernetes
Felügyelt (kötelező)

CodeConfiguration

Név Leírás Érték
codeId A kódeszköz ARM-erőforrás-azonosítója. sztring
scoringScript [Kötelező] Az indításkor végrehajtandó szkript. például: "score.py" sztring (kötelező)

Korlátok:
Minimális hossz = 1
Minta = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Név Leírás Érték
{testreszabott tulajdonság} sztring
{testreszabott tulajdonság} sztring

ProbeSettings

Név Leírás Érték
failureThreshold Azoknak a hibáknak a száma, amelyek engedélyezve lesznek, mielőtt nem kifogástalan állapotot ad vissza. int
initialDelay Az ISO 8601 formátumú első mintavétel előtti késleltetés. sztring
period Az ISO 8601 formátumú mintavételek közötti időtartam. sztring
successThreshold A sikeres mintavételek száma, mielőtt kifogástalan állapotot ad vissza. int
timeout A mintavétel időtúllépése ISO 8601 formátumban. sztring

EndpointDeploymentPropertiesBaseProperties

Név Leírás Érték
{testreszabott tulajdonság} sztring
{testreszabott tulajdonság} sztring

OnlineRequestSettings

Név Leírás Érték
maxConcurrentRequestsPerInstance Az üzemelő példányonként engedélyezett csomópontonkénti egyidejű kérelmek maximális száma. Alapértelmezés szerint 1. int
maxQueueWait A kérések maximális időtartama ISO 8601 formátumban marad az üzenetsorban.
Alapértelmezés szerint 500 ms.
sztring
requestTimeout A pontozási időtúllépés ISO 8601 formátumban.
Alapértelmezés szerint 5000 ms.
sztring

OnlineScaleSettings

Név Leírás Érték
scaleType Az objektumtípus beállítása Alapértelmezett
TargetUtilization (kötelező)

DefaultScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "Alapértelmezett" (kötelező)

TargetUtilizationScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "TargetUtilization" (kötelező)
maxInstances A példányok maximális száma, amelyekre az üzembe helyezés méretezhető. A kvóta max_instances lesz fenntartva. int
minInstances A mindig jelen lévő példányok minimális száma. int
pollingInterval A lekérdezési időköz ISO 8691 formátumban. Csak az időtartamot támogatja olyan pontossággal, mint a Másodperc. sztring
targetUtilizationPercentage Cél CPU-használat az automatikus skálázóhoz. int

KubernetesOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Kubernetes" (kötelező)
containerResourceRequirements A tároló erőforráskövetelményei (processzor és memória). ContainerResourceRequirements

ContainerResourceRequirements

Név Leírás Érték
containerResourceLimits Tárolóerőforrás-korlát adatai: ContainerResourceSettings
containerResourceRequests Tárolóerőforrás-kérelem adatai: ContainerResourceSettings

ContainerResourceSettings

Név Leírás Érték
Cpu A tárolóra vonatkozó vCPU-kérések száma/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
Gpu Nvidia GPU-kártyák kérésének/korlátjának száma a tárolóhoz. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
memória Tároló memóriaméret-kérése/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring

ManagedOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Felügyelt" (kötelező)

SKU

Név Leírás Érték
capacity Ha a termékváltozat támogatja a vertikális felskálázást/in, akkor a kapacitás egész számának szerepelnie kell. Ha az erőforrás esetében nem lehetséges a vertikális felskálázás/beskálázás, akkor ez kihagyható. int
family Ha a szolgáltatás különböző hardvergenerációkkal rendelkezik ugyanahhoz a termékváltozathoz, akkor az itt rögzíthető. sztring
name A termékváltozat neve. Ex - P3. Ez általában egy betű+szám kód sztring (kötelező)
size A termékváltozat mérete. Ha a névmező a szint és egy másik érték kombinációja, akkor ez a különálló kód. sztring
tier Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges. "Alapszintű"
"Ingyenes"
"Prémium"
"Standard"

ARM-sablon erőforrásdefiníciója

A munkaterületek/onlineEndpoints/deployments erőforrástípus üzembe helyezhető olyan műveletekkel, amelyek a következőket célják:

Az egyes API-verziók módosított tulajdonságainak listáját a változásnaplóban találja.

Erőforrás formátuma

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments erőforrás létrehozásához adja hozzá a következő JSON-t a sablonhoz.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2022-06-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties objektumok

Állítsa be az endpointComputeType tulajdonságot az objektum típusának megadásához.

Kubernetes esetén használja a következőt:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Felügyelt esetén használja a következőt:

  "endpointComputeType": "Managed"

OnlineScaleSettings objektumok

Állítsa be a scaleType tulajdonságot az objektum típusának megadásához.

Alapértelmezés szerint használja a következőt:

  "scaleType": "Default"

A TargetUtilization esetében használja a következőt:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Tulajdonságértékek

munkaterületek/onlineEndpoints/deployments

Név Leírás Érték
típus Az erőforrás típusa "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"
apiVersion Az erőforrás API-verziója "2022-06-01-preview"
name Az erőforrás neve

Megtudhatja, hogyan állíthatja be a gyermekerőforrások nevét és típusát A JSON ARM-sablonokban.
sztring (kötelező)
location Az a földrajzi hely, ahol az erőforrás él sztring (kötelező)
tags Erőforráscímkék. Címkenevek és -értékek szótára. Címkék megtekintése sablonokban
Sku Az automatikus skálázási ARM-szerződéshez szükséges termékváltozat részletei. Sku
Fajta A portál/eszközhasználat/stb. által használt metaadatok az azonos típusú erőforrások különböző felhasználói felületi élményének megjelenítéséhez. sztring
identity Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások) ManagedServiceIdentity
properties [Kötelező] Az entitás további attribútumai. OnlineDeploymentProperties (kötelező)

ManagedServiceIdentity

Név Leírás Érték
típus A felügyeltszolgáltatás-identitás típusa (ahol a SystemAssigned és a UserAssigned típus egyaránt engedélyezett). "Nincs"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (kötelező)
userAssignedIdentities Az erőforráshoz társított felhasználó által hozzárendelt identitások halmaza. A userAssignedIdentities szótárkulcsok arm-erőforrás-azonosítók lesznek a következő űrlapon: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. A szótár értékei üres objektumok ({}) lehetnek a kérésekben. UserAssignedIdentities

UserAssignedIdentities

Név Leírás Érték
{testreszabott tulajdonság} UserAssignedIdentity

UserAssignedIdentity

Ez az objektum nem tartalmaz az üzembe helyezés során beállítandó tulajdonságokat. Minden tulajdonság a ReadOnly.

OnlineDeploymentProperties

Név Leírás Érték
appInsightsEnabled Ha igaz, engedélyezi az Application Insights naplózását. logikai
codeConfiguration Kódkonfiguráció a végpont üzembe helyezéséhez. CodeConfiguration
leírás A végpont üzembe helyezésének leírása. sztring
egressPublicNetworkAccess Ha engedélyezve van, engedélyezze a kimenő forgalom nyilvános hálózati hozzáférését. Ha le van tiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve. "Letiltva"
"Engedélyezve"
environmentId A végpont üzembe helyezésének környezeti specifikációjának ARM-erőforrás-azonosítója. sztring
environmentVariables Környezeti változók konfigurálása az üzembe helyezéshez. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Számítási példány típusa. sztring
livenessProbe Az élettartam-mintavétel rendszeresen figyeli a tároló állapotát. ProbeSettings
modell A modell URI-elérési útja. sztring
modelMountPath A modell egyéni tárolóban való csatlakoztatásának útvonala. sztring
properties Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók. EndpointDeploymentPropertiesBaseProperties
readinessProbe A készenlét-mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élettartam-mintavétellel. ProbeSettings
requestSettings Az üzemelő példány beállításainak kérése. OnlineRequestSettings
scaleSettings Az üzembe helyezés méretezési beállításai.
Ha null értékű, vagy nincs megadva,
Alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings értéke
és a DefaultScaleSettings for ManagedOnlineDeployment értékre.
OnlineScaleSettings
endpointComputeType Az objektum típusának beállítása Kubernetes
Felügyelt (kötelező)

CodeConfiguration

Név Leírás Érték
codeId A kódobjektum ARM-erőforrás-azonosítója. sztring
scoringScript [Kötelező] Az indításkor végrehajtandó szkript. például: "score.py" sztring (kötelező)

Korlátok:
Minimális hossz = 1
Minta = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Név Leírás Érték
{customized property} sztring
{customized property} sztring

ProbeSettings

Név Leírás Érték
failureThreshold Azoknak a hibáknak a száma, amelyek engedélyezve lesznek, mielőtt nem kifogástalan állapotot ad vissza. int
initialDelay Az ISO 8601 formátumú első mintavétel előtti késleltetés. sztring
period Az ISO 8601 formátumú mintavételek közötti időtartam. sztring
successThreshold A sikeres mintavételek száma, mielőtt kifogástalan állapotot ad vissza. int
timeout A mintavétel időtúllépése ISO 8601 formátumban. sztring

EndpointDeploymentPropertiesBaseProperties

Név Leírás Érték
{customized property} sztring
{customized property} sztring

OnlineRequestSettings

Név Leírás Érték
maxConcurrentRequestsPerInstance Az üzemelő példányonként engedélyezett csomópontonkénti egyidejű kérelmek maximális száma. Alapértelmezés szerint 1. int
maxQueueWait A kérések maximális időtartama ISO 8601 formátumban marad az üzenetsorban.
Alapértelmezés szerint 500 ms.
sztring
requestTimeout A pontozási időtúllépés ISO 8601 formátumban.
Alapértelmezés szerint 5000 ms.
sztring

OnlineScaleSettings

Név Leírás Érték
scaleType Az objektumtípus beállítása Alapértelmezett
TargetUtilization (kötelező)

DefaultScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "Alapértelmezett" (kötelező)

TargetUtilizationScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "TargetUtilization" (kötelező)
maxInstances A példányok maximális száma, amelyekre az üzembe helyezés méretezhető. A kvóta max_instances lesz fenntartva. int
minInstances A mindig jelen lévő példányok minimális száma. int
pollingInterval A lekérdezési időköz ISO 8691 formátumban. Csak az időtartamot támogatja olyan pontossággal, mint a Másodperc. sztring
targetUtilizationPercentage Cél CPU-használat az automatikus skálázóhoz. int

KubernetesOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Kubernetes" (kötelező)
containerResourceRequirements A tároló erőforráskövetelményei (processzor és memória). ContainerResourceRequirements

ContainerResourceRequirements

Név Leírás Érték
containerResourceLimits Tárolóerőforrás-korlát adatai: ContainerResourceSettings
containerResourceRequests Tárolóerőforrás-kérelem adatai: ContainerResourceSettings

ContainerResourceSettings

Név Leírás Érték
Cpu A tárolóra vonatkozó vCPU-kérések száma/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
Gpu Nvidia GPU-kártyák kérésének/korlátjának száma a tárolóhoz. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
memória Tároló memóriaméret-kérése/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring

ManagedOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Felügyelt" (kötelező)

SKU

Név Leírás Érték
capacity Ha a termékváltozat támogatja a vertikális felskálázást/in, akkor a kapacitás egész számának szerepelnie kell. Ha az erőforrás esetében nem lehetséges a vertikális felskálázás/beskálázás, akkor ez kihagyható. int
family Ha a szolgáltatás különböző hardvergenerációkkal rendelkezik ugyanahhoz a termékváltozathoz, akkor az itt rögzíthető. sztring
name A termékváltozat neve. Ex - P3. Ez általában egy betű+szám kód sztring (kötelező)
size A termékváltozat mérete. Ha a névmező a szint és egy másik érték kombinációja, akkor ez a különálló kód. sztring
tier Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges. "Alapszintű"
"Ingyenes"
"Prémium"
"Standard"

Terraform (AzAPI-szolgáltató) erőforrásdefiníció

A munkaterületek/onlineEndpoints/deployments erőforrástípus üzembe helyezhető olyan műveletekkel, amelyek a következőket célják:

  • Erőforráscsoportok

Az egyes API-verziók módosított tulajdonságainak listáját a változásnaplóban találja.

Erőforrás formátuma

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments erőforrás létrehozásához adja hozzá a következő Terraformot a sablonhoz.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-06-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

OnlineDeploymentProperties objektumok

Állítsa be az endpointComputeType tulajdonságot az objektum típusának megadásához.

Kubernetes esetén használja a következőt:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Felügyelt esetén használja a következőt:

  endpointComputeType = "Managed"

OnlineScaleSettings objektumok

Állítsa be a scaleType tulajdonságot az objektum típusának megadásához.

Alapértelmezés szerint használja a következőt:

  scaleType = "Default"

A TargetUtilization esetében használja a következőt:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Tulajdonságértékek

munkaterületek/onlineEndpoints/deployments

Név Leírás Érték
típus Az erőforrás típusa "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-06-01-preview"
name Az erőforrás neve sztring (kötelező)
location Az a földrajzi hely, ahol az erőforrás él sztring (kötelező)
parent_id Az erőforrás szülőjének azonosítója. Típusú erőforrás azonosítója: onlineEndpoints
tags Erőforráscímkék. Címkenevek és -értékek szótára.
Sku Az automatikus skálázási ARM-szerződéshez szükséges termékváltozat részletei. Sku
Fajta A portál/eszközhasználat/stb. által használt metaadatok az azonos típusú erőforrások különböző felhasználói felületi élményének megjelenítéséhez. sztring
identity Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások) ManagedServiceIdentity
properties [Kötelező] Az entitás további attribútumai. OnlineDeploymentProperties (kötelező)

ManagedServiceIdentity

Név Leírás Érték
típus A felügyeltszolgáltatás-identitás típusa (ahol a SystemAssigned és a UserAssigned típus egyaránt engedélyezett). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (kötelező)
identity_ids Az erőforráshoz társított felhasználó által hozzárendelt identitások halmaza. A userAssignedIdentities szótárkulcsok arm-erőforrás-azonosítók lesznek a következő űrlapon: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. A szótár értékei üres objektumok ({}) lehetnek a kérésekben. Felhasználói identitásazonosítók tömbje.

UserAssignedIdentities

Név Leírás Érték
{testreszabott tulajdonság} UserAssignedIdentity

UserAssignedIdentity

Ez az objektum nem tartalmaz az üzembe helyezés során beállítandó tulajdonságokat. Minden tulajdonság a ReadOnly.

OnlineDeploymentProperties

Név Leírás Érték
appInsightsEnabled Ha igaz, engedélyezi az Application Insights naplózását. logikai
codeConfiguration Kódkonfiguráció a végpont üzembe helyezéséhez. CodeConfiguration
leírás A végpont üzembe helyezésének leírása. sztring
egressPublicNetworkAccess Ha engedélyezve van, engedélyezze a kimenő forgalom nyilvános hálózati hozzáférését. Ha le van tiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve. "Letiltva"
"Engedélyezve"
environmentId A végpont üzembe helyezésének környezeti specifikációjának ARM-erőforrás-azonosítója. sztring
environmentVariables Környezeti változók konfigurálása az üzembe helyezéshez. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Számítási példány típusa. sztring
livenessProbe Az élettartam-mintavétel rendszeresen figyeli a tároló állapotát. ProbeSettings
modell A modell URI-elérési útja. sztring
modelMountPath A modell egyéni tárolóban való csatlakoztatásának útvonala. sztring
properties Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók. EndpointDeploymentPropertiesBaseProperties
readinessProbe A készenlét-mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élettartam-mintavétellel. ProbeSettings
requestSettings Az üzemelő példány beállításainak kérése. OnlineRequestSettings
scaleSettings Az üzembe helyezés méretezési beállításai.
Ha null értékű, vagy nincs megadva,
Alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings értéke
és a DefaultScaleSettings for ManagedOnlineDeployment értékre.
OnlineScaleSettings
endpointComputeType Az objektum típusának beállítása Kubernetes
Felügyelt (kötelező)

CodeConfiguration

Név Leírás Érték
codeId A kódobjektum ARM-erőforrás-azonosítója. sztring
scoringScript [Kötelező] Az indításkor végrehajtandó szkript. például: "score.py" sztring (kötelező)

Korlátok:
Minimális hossz = 1
Minta = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Név Leírás Érték
{customized property} sztring
{customized property} sztring

ProbeSettings

Név Leírás Érték
failureThreshold Azoknak a hibáknak a száma, amelyek engedélyezve lesznek, mielőtt nem kifogástalan állapotot ad vissza. int
initialDelay Az ISO 8601 formátumú első mintavétel előtti késleltetés. sztring
period Az ISO 8601 formátumú mintavételek közötti időtartam. sztring
successThreshold A sikeres mintavételek száma, mielőtt kifogástalan állapotot ad vissza. int
timeout A mintavétel időtúllépése ISO 8601 formátumban. sztring

EndpointDeploymentPropertiesBaseProperties

Név Leírás Érték
{customized property} sztring
{customized property} sztring

OnlineRequestSettings

Név Leírás Érték
maxConcurrentRequestsPerInstance Az üzemelő példányonként engedélyezett csomópontonkénti egyidejű kérelmek maximális száma. Alapértelmezés szerint 1. int
maxQueueWait A kérések maximális időtartama ISO 8601 formátumban marad az üzenetsorban.
Alapértelmezés szerint 500 ms.
sztring
requestTimeout A pontozási időtúllépés ISO 8601 formátumban.
Alapértelmezés szerint 5000 ms.
sztring

OnlineScaleSettings

Név Leírás Érték
scaleType Az objektum típusának beállítása Alapértelmezett
TargetUtilization (kötelező)

DefaultScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "Alapértelmezett" (kötelező)

TargetUtilizationScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "TargetUtilization" (kötelező)
maxInstances A példányok maximális száma, amelyekre az üzembe helyezés méretezhető. A kvóta max_instances lesz fenntartva. int
minInstances A mindig jelen lévő példányok minimális száma. int
pollingInterval A lekérdezési időköz ISO 8691 formátumban. Csak a másodperc pontosságú időtartamot támogatja. sztring
targetUtilizationPercentage Az automatikus skálázási eszköz cél cpu-használata. int

KubernetesOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Kubernetes" (kötelező)
containerResourceRequirements A tároló erőforrás-követelményei (processzor és memória). ContainerResourceRequirements

ContainerResourceRequirements

Név Leírás Érték
containerResourceLimits Tárolóerőforrás-korlát adatai: ContainerResourceSettings
containerResourceRequests Tárolóerőforrás-kérelem adatai: ContainerResourceSettings

ContainerResourceSettings

Név Leírás Érték
Cpu A tárolóhoz tartozó vCPU-kérések száma/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
Gpu Nvidia GPU-kártyák kérésének/korlátjának száma a tárolóhoz. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
memória Tároló memóriaméret-kérése/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring

ManagedOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Felügyelt" (kötelező)

SKU

Név Leírás Érték
capacity Ha a termékváltozat támogatja a fel- és leskálázást, akkor a kapacitás egészét is tartalmaznia kell. Ha az erőforráshoz nem lehet vertikális felskálázást/beskálázást végezni, ez kihagyható. int
family Ha a szolgáltatás különböző hardvergenerációkkal rendelkezik ugyanahhoz a termékváltozathoz, akkor az itt rögzíthető. sztring
name A termékváltozat neve. Ex - P3. Ez általában egy betű+szám kód sztring (kötelező)
size A termékváltozat mérete. Ha a névmező a szint és egy másik érték kombinációja, akkor ez a különálló kód. sztring
tier Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges. "Alapszintű"
"Ingyenes"
"Prémium"
"Standard"