Share via


Microsoft.MachineLearningServices-munkaterületek/onlineEndpoints/deployments 2022-10-01

Bicep-erőforrásdefiníció

A munkaterületek/onlineEndpoints/deployments erőforrástípus üzembe helyezhető a következő célműveletekkel:

Az egyes API-verziók módosított tulajdonságainak listáját a változásnaplóban találja.

Erőforrás formátuma

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments erőforrás létrehozásához adja hozzá a következő Bicep-et a sablonhoz.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties objektumok

Állítsa be az endpointComputeType tulajdonságot az objektum típusának megadásához.

A Kubernetes esetében használja a következőt:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Felügyelt esetén használja a következőt:

  endpointComputeType: 'Managed'

OnlineScaleSettings objektumok

Állítsa be a scaleType tulajdonságot az objektum típusának megadásához.

Alapértelmezett beállításként használja a következőt:

  scaleType: 'Default'

A TargetUtilization esetében használja a következőt:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Tulajdonságértékek

workspaces/onlineEndpoints/deployments

Név Leírás Érték
name Az erőforrás neve

Megtudhatja, hogyan állíthatja be a gyermekerőforrások nevét és típusát a Bicepben.
sztring (kötelező)
location A földrajzi hely, ahol az erőforrás él sztring (kötelező)
tags Erőforráscímkék. Címkenevek és -értékek szótára. Címkék megtekintése sablonokban
Sku Az automatikus skálázáshoz szükséges ARM-szerződés termékváltozatának részletei. Sku
Fajta A portál/eszközök/stb. által az azonos típusú erőforrások különböző felhasználói felületi élményeinek megjelenítéséhez használt metaadatok. sztring
Szülő A Bicepben megadhatja egy gyermekerőforrás szülőerőforrását. Ezt a tulajdonságot csak akkor kell hozzáadnia, ha a gyermekerőforrás a szülőerőforráson kívül van deklarálva.

További információ: Gyermekerőforrás a szülőerőforráson kívül.
Az erőforrástípus szimbolikus neve: onlineEndpoints
identity Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások) ManagedServiceIdentity
properties [Kötelező] Az entitás további attribútumai. OnlineDeploymentProperties (kötelező)

ManagedServiceIdentity

Név Leírás Érték
típus A felügyeltszolgáltatás-identitás típusa (ahol a SystemAssigned és a UserAssigned típus egyaránt engedélyezett). "Nincs"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (kötelező)
userAssignedIdentities Az erőforráshoz társított felhasználó által hozzárendelt identitások halmaza. A userAssignedIdentities szótárkulcsok ARM-erőforrás-azonosítók lesznek a következő formában: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. A szótárértékek üres objektumok ({}) lehetnek a kérésekben. UserAssignedIdentities

UserAssignedIdentities

Név Leírás Érték
{customized property} UserAssignedIdentity

UserAssignedIdentity

Ez az objektum nem tartalmaz az üzembe helyezés során beállítandó tulajdonságokat. Minden tulajdonság readOnly.

OnlineDeploymentProperties

Név Leírás Érték
appInsightsEnabled Ha igaz, engedélyezi az Application Insights naplózását. logikai
codeConfiguration Kódkonfiguráció a végpont üzembe helyezéséhez. CodeConfiguration
leírás A végpont üzembe helyezésének leírása. sztring
egressPublicNetworkAccess Ha engedélyezve van, engedélyezze a kimenő forgalom nyilvános hálózati hozzáférését. Ha le van tiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve. "Letiltva"
"Engedélyezve"
environmentId A végpont üzembe helyezésének környezeti specifikációjának ARM-erőforrás-azonosítója vagy AssetId azonosítója. sztring
environmentVariables Környezeti változók konfigurálása az üzembe helyezéshez. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Számítási példány típusa. sztring
livenessProbe Az élettartam-mintavétel rendszeresen figyeli a tároló állapotát. ProbeSettings
modell A modell URI-elérési útja. sztring
modelMountPath A modell egyéni tárolóban való csatlakoztatásának útvonala. sztring
properties Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók. EndpointDeploymentPropertiesBaseProperties
readinessProbe A készenlét-mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élettartam-mintavétellel. ProbeSettings
requestSettings Az üzemelő példány beállításainak kérése. OnlineRequestSettings
scaleSettings Az üzembe helyezés méretezési beállításai.
Ha null értékű, vagy nincs megadva,
Alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings értéke
és a DefaultScaleSettings for ManagedOnlineDeployment értékre.
OnlineScaleSettings
endpointComputeType Az objektum típusának beállítása Kubernetes
Felügyelt (kötelező)

CodeConfiguration

Név Leírás Érték
codeId A kódobjektum ARM-erőforrás-azonosítója. sztring
scoringScript [Kötelező] Az indításkor végrehajtandó szkript. például: "score.py" sztring (kötelező)

Korlátok:
Minimális hossz = 1
Minta = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Név Leírás Érték
{customized property} sztring
{customized property} sztring

ProbeSettings

Név Leírás Érték
failureThreshold Azoknak a hibáknak a száma, amelyek engedélyezve lesznek, mielőtt nem kifogástalan állapotot ad vissza. int
initialDelay Az ISO 8601 formátumú első mintavétel előtti késleltetés. sztring
period Az ISO 8601 formátumú mintavételek közötti időtartam. sztring
successThreshold A sikeres mintavételek száma, mielőtt kifogástalan állapotot ad vissza. int
timeout A mintavétel időtúllépése ISO 8601 formátumban. sztring

EndpointDeploymentPropertiesBaseProperties

Név Leírás Érték
{customized property} sztring
{customized property} sztring

OnlineRequestSettings

Név Leírás Érték
maxConcurrentRequestsPerInstance Az üzemelő példányonként engedélyezett csomópontonkénti egyidejű kérelmek maximális száma. Alapértelmezés szerint 1. int
maxQueueWait A kérések maximális időtartama ISO 8601 formátumban marad az üzenetsorban.
Alapértelmezés szerint 500 ms.
sztring
requestTimeout A pontozási időtúllépés ISO 8601 formátumban.
Alapértelmezés szerint 5000 ms.
sztring

OnlineScaleSettings

Név Leírás Érték
scaleType Az objektumtípus beállítása Alapértelmezett
TargetUtilization (kötelező)

DefaultScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "Alapértelmezett" (kötelező)

TargetUtilizationScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "TargetUtilization" (kötelező)
maxInstances A példányok maximális száma, amelyekre az üzembe helyezés méretezhető. A kvóta max_instances lesz fenntartva. int
minInstances A mindig jelen lévő példányok minimális száma. int
pollingInterval A lekérdezési időköz ISO 8691 formátumban. Csak az időtartamot támogatja olyan pontossággal, mint a Másodperc. sztring
targetUtilizationPercentage Cél CPU-használat az automatikus skálázóhoz. int

KubernetesOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Kubernetes" (kötelező)
containerResourceRequirements A tároló erőforráskövetelményei (processzor és memória). ContainerResourceRequirements

ContainerResourceRequirements

Név Leírás Érték
containerResourceLimits Tárolóerőforrás-korlát adatai: ContainerResourceSettings
containerResourceRequests Tárolóerőforrás-kérelem adatai: ContainerResourceSettings

ContainerResourceSettings

Név Leírás Érték
Cpu A tárolóra vonatkozó vCPU-kérések száma/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
Gpu Nvidia GPU-kártyák kérésének/korlátjának száma a tárolóhoz. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
memória Tároló memóriaméret-kérése/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring

ManagedOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Felügyelt" (kötelező)

SKU

Név Leírás Érték
capacity Ha a termékváltozat támogatja a vertikális felskálázást/in, akkor a kapacitás egész számának szerepelnie kell. Ha az erőforrás esetében nem lehetséges a vertikális felskálázás/beskálázás, akkor ez kihagyható. int
family Ha a szolgáltatás különböző hardvergenerációkkal rendelkezik ugyanahhoz a termékváltozathoz, akkor az itt rögzíthető. sztring
name A termékváltozat neve. Ex - P3. Ez általában egy betű+szám kód sztring (kötelező)
size A termékváltozat mérete. Ha a névmező a szint és egy másik érték kombinációja, akkor ez a különálló kód. sztring
tier Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges. "Alapszintű"
"Ingyenes"
"Prémium"
"Standard"

ARM-sablon erőforrásdefiníciója

A munkaterületek/onlineEndpoints/deployments erőforrástípus üzembe helyezhető olyan műveletekkel, amelyek a következőket célják:

Az egyes API-verziók módosított tulajdonságainak listáját a változásnaplóban találja.

Erőforrás formátuma

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments erőforrás létrehozásához adja hozzá a következő JSON-t a sablonhoz.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2022-10-01",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties objektumok

Állítsa be az endpointComputeType tulajdonságot az objektum típusának megadásához.

Kubernetes esetén használja a következőt:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Felügyelt esetén használja a következőt:

  "endpointComputeType": "Managed"

OnlineScaleSettings objektumok

Állítsa be a scaleType tulajdonságot az objektum típusának megadásához.

Alapértelmezés szerint használja a következőt:

  "scaleType": "Default"

A TargetUtilization esetében használja a következőt:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Tulajdonságértékek

munkaterületek/onlineEndpoints/deployments

Név Leírás Érték
típus Az erőforrás típusa "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"
apiVersion Az erőforrás API-verziója '2022-10-01'
name Az erőforrás neve

Megtudhatja, hogyan állíthatja be a gyermekerőforrások nevét és típusát A JSON ARM-sablonokban.
sztring (kötelező)
location Az a földrajzi hely, ahol az erőforrás él sztring (kötelező)
tags Erőforráscímkék. Címkenevek és -értékek szótára. Címkék megtekintése sablonokban
Sku Az automatikus skálázási ARM-szerződéshez szükséges termékváltozat részletei. Sku
Fajta A portál/eszközhasználat/stb. által használt metaadatok az azonos típusú erőforrások különböző felhasználói felületi élményének megjelenítéséhez. sztring
identity Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások) ManagedServiceIdentity
properties [Kötelező] Az entitás további attribútumai. OnlineDeploymentProperties (kötelező)

ManagedServiceIdentity

Név Leírás Érték
típus A felügyeltszolgáltatás-identitás típusa (ahol a SystemAssigned és a UserAssigned típus egyaránt engedélyezett). "Nincs"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (kötelező)
userAssignedIdentities Az erőforráshoz társított felhasználó által hozzárendelt identitások halmaza. A userAssignedIdentities szótárkulcsok arm-erőforrás-azonosítók lesznek a következő űrlapon: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. A szótár értékei üres objektumok ({}) lehetnek a kérésekben. UserAssignedIdentities

UserAssignedIdentities

Név Leírás Érték
{testreszabott tulajdonság} UserAssignedIdentity

UserAssignedIdentity

Ez az objektum nem tartalmaz az üzembe helyezés során beállítandó tulajdonságokat. Minden tulajdonság a ReadOnly.

OnlineDeploymentProperties

Név Leírás Érték
appInsightsEnabled Ha igaz, engedélyezi az Application Insights naplózását. logikai
codeConfiguration Kódkonfiguráció a végpont üzembe helyezéséhez. CodeConfiguration
leírás A végpont üzembe helyezésének leírása. sztring
egressPublicNetworkAccess Ha engedélyezve van, engedélyezze a kimenő nyilvános hálózati hozzáférést. Ha letiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve. "Letiltva"
"Engedélyezve"
environmentId A végpont üzembe helyezésének környezeti specifikációjának ARM-erőforrás-azonosítója vagy AssetId azonosítója. sztring
environmentVariables Környezeti változók konfigurálása az üzembe helyezéshez. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Számítási példány típusa. sztring
livenessProbe Az élőképesség-mintavétel rendszeresen figyeli a tároló állapotát. ProbeSettings
modell A modell URI-elérési útja. sztring
modelMountPath A modell egyéni tárolóba való csatlakoztatásának útvonala. sztring
properties Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók. EndpointDeploymentPropertiesBaseProperties
readinessProbe A készültségi mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élőképesség-mintavétellel. ProbeSettings
requestSettings Az üzembe helyezés beállításainak kérése. OnlineRequestSettings
scaleSettings Az üzembe helyezés skálázási beállításai.
Ha null értékű, vagy nincs megadva,
alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings értéke.
és a DefaultScaleSettings for ManagedOnlineDeployment értékre.
OnlineScaleSettings
endpointComputeType Az objektumtípus beállítása Kubernetes
Felügyelt (kötelező)

CodeConfiguration

Név Leírás Érték
codeId A kódeszköz ARM-erőforrás-azonosítója. sztring
scoringScript [Kötelező] Az indításkor végrehajtandó szkript. például: "score.py" sztring (kötelező)

Korlátok:
Minimális hossz = 1
Minta = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Név Leírás Érték
{testreszabott tulajdonság} sztring
{testreszabott tulajdonság} sztring

ProbeSettings

Név Leírás Érték
failureThreshold Azoknak a hibáknak a száma, amelyek engedélyezve lesznek, mielőtt nem kifogástalan állapotot ad vissza. int
initialDelay Az ISO 8601 formátumú első mintavétel előtti késleltetés. sztring
period Az ISO 8601 formátumú mintavételek közötti időtartam. sztring
successThreshold A sikeres mintavételek száma, mielőtt kifogástalan állapotot ad vissza. int
timeout A mintavétel időtúllépése ISO 8601 formátumban. sztring

EndpointDeploymentPropertiesBaseProperties

Név Leírás Érték
{testreszabott tulajdonság} sztring
{testreszabott tulajdonság} sztring

OnlineRequestSettings

Név Leírás Érték
maxConcurrentRequestsPerInstance Az üzemelő példányonként engedélyezett csomópontonkénti egyidejű kérelmek maximális száma. Alapértelmezés szerint 1. int
maxQueueWait A kérések maximális időtartama ISO 8601 formátumban marad az üzenetsorban.
Alapértelmezés szerint 500 ms.
sztring
requestTimeout A pontozási időtúllépés ISO 8601 formátumban.
Alapértelmezés szerint 5000 ms.
sztring

OnlineScaleSettings

Név Leírás Érték
scaleType Az objektumtípus beállítása Alapértelmezett
TargetUtilization (kötelező)

DefaultScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "Alapértelmezett" (kötelező)

TargetUtilizationScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "TargetUtilization" (kötelező)
maxInstances A példányok maximális száma, amelyekre az üzembe helyezés méretezhető. A kvóta max_instances lesz fenntartva. int
minInstances A mindig jelen lévő példányok minimális száma. int
pollingInterval A lekérdezési időköz ISO 8691 formátumban. Csak az időtartamot támogatja olyan pontossággal, mint a Másodperc. sztring
targetUtilizationPercentage Cél CPU-használat az automatikus skálázóhoz. int

KubernetesOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Kubernetes" (kötelező)
containerResourceRequirements A tároló erőforráskövetelményei (processzor és memória). ContainerResourceRequirements

ContainerResourceRequirements

Név Leírás Érték
containerResourceLimits Tárolóerőforrás-korlát adatai: ContainerResourceSettings
containerResourceRequests Tárolóerőforrás-kérelem adatai: ContainerResourceSettings

ContainerResourceSettings

Név Leírás Érték
Cpu A tárolóra vonatkozó vCPU-kérések száma/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
Gpu Nvidia GPU-kártyák kérésének/korlátjának száma a tárolóhoz. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
memória Tároló memóriaméret-kérése/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring

ManagedOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Felügyelt" (kötelező)

SKU

Név Leírás Érték
capacity Ha a termékváltozat támogatja a vertikális felskálázást/in, akkor a kapacitás egész számának szerepelnie kell. Ha az erőforrás esetében nem lehetséges a vertikális felskálázás/beskálázás, akkor ez kihagyható. int
family Ha a szolgáltatás különböző hardvergenerációkkal rendelkezik ugyanahhoz a termékváltozathoz, akkor az itt rögzíthető. sztring
name A termékváltozat neve. Ex - P3. Ez általában egy betű+szám kód sztring (kötelező)
size A termékváltozat mérete. Ha a névmező a szint és egy másik érték kombinációja, akkor ez a különálló kód. sztring
tier Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges. "Alapszintű"
"Ingyenes"
"Prémium"
"Standard"

Terraform (AzAPI-szolgáltató) erőforrásdefiníció

A munkaterületek/onlineEndpoints/deployments erőforrástípus üzembe helyezhető olyan műveletekkel, amelyek a következőket célják:

  • Erőforráscsoportok

Az egyes API-verziók módosított tulajdonságainak listáját a változásnaplóban találja.

Erőforrás formátuma

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments erőforrás létrehozásához adja hozzá a következő Terraformot a sablonhoz.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

OnlineDeploymentProperties objektumok

Állítsa be az endpointComputeType tulajdonságot az objektum típusának megadásához.

Kubernetes esetén használja a következőt:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Felügyelt esetén használja a következőt:

  endpointComputeType = "Managed"

OnlineScaleSettings objektumok

Állítsa be a scaleType tulajdonságot az objektum típusának megadásához.

Alapértelmezés szerint használja a következőt:

  scaleType = "Default"

A TargetUtilization esetében használja a következőt:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Tulajdonságértékek

munkaterületek/onlineEndpoints/deployments

Név Leírás Érték
típus Az erőforrás típusa "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01"
name Az erőforrás neve sztring (kötelező)
location Az a földrajzi hely, ahol az erőforrás él sztring (kötelező)
parent_id Az erőforrás szülőjének azonosítója. Típusú erőforrás azonosítója: onlineEndpoints
tags Erőforráscímkék. Címkenevek és -értékek szótára.
Sku Az automatikus skálázási ARM-szerződéshez szükséges termékváltozat részletei. Sku
Fajta A portál/eszközhasználat/stb. által használt metaadatok az azonos típusú erőforrások különböző felhasználói felületi élményének megjelenítéséhez. sztring
identity Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások) ManagedServiceIdentity
properties [Kötelező] Az entitás további attribútumai. OnlineDeploymentProperties (kötelező)

ManagedServiceIdentity

Név Leírás Érték
típus A felügyeltszolgáltatás-identitás típusa (ahol a SystemAssigned és a UserAssigned típus egyaránt engedélyezett). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (kötelező)
identity_ids Az erőforráshoz társított felhasználó által hozzárendelt identitások halmaza. A userAssignedIdentities szótárkulcsok arm-erőforrás-azonosítók lesznek a következő űrlapon: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. A szótár értékei üres objektumok ({}) lehetnek a kérésekben. Felhasználói identitásazonosítók tömbje.

UserAssignedIdentities

Név Leírás Érték
{testreszabott tulajdonság} UserAssignedIdentity

UserAssignedIdentity

Ez az objektum nem tartalmaz az üzembe helyezés során beállítandó tulajdonságokat. Minden tulajdonság a ReadOnly.

OnlineDeploymentProperties

Név Leírás Érték
appInsightsEnabled Ha igaz, engedélyezi az Application Insights naplózását. logikai
codeConfiguration Kódkonfiguráció a végpont üzembe helyezéséhez. CodeConfiguration
leírás A végpont üzembe helyezésének leírása. sztring
egressPublicNetworkAccess Ha engedélyezve van, engedélyezze a kimenő nyilvános hálózati hozzáférést. Ha letiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve. "Letiltva"
"Engedélyezve"
environmentId A végpont üzembe helyezésének környezeti specifikációjának ARM-erőforrás-azonosítója vagy AssetId azonosítója. sztring
environmentVariables Környezeti változók konfigurálása az üzembe helyezéshez. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Számítási példány típusa. sztring
livenessProbe Az élőképesség-mintavétel rendszeresen figyeli a tároló állapotát. ProbeSettings
modell A modell URI-elérési útja. sztring
modelMountPath A modell egyéni tárolóba való csatlakoztatásának útvonala. sztring
properties Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók. EndpointDeploymentPropertiesBaseProperties
readinessProbe A készültségi mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élőképesség-mintavétellel. ProbeSettings
requestSettings Az üzembe helyezés beállításainak kérése. OnlineRequestSettings
scaleSettings Az üzembe helyezés skálázási beállításai.
Ha null értékű, vagy nincs megadva,
alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings értéke.
és a DefaultScaleSettings for ManagedOnlineDeployment értékre.
OnlineScaleSettings
endpointComputeType Az objektumtípus beállítása Kubernetes
Felügyelt (kötelező)

CodeConfiguration

Név Leírás Érték
codeId A kódeszköz ARM-erőforrás-azonosítója. sztring
scoringScript [Kötelező] Az indításkor végrehajtandó szkript. például: "score.py" sztring (kötelező)

Korlátok:
Minimális hossz = 1
Minta = [a-zA-Z0-9_]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Név Leírás Érték
{testreszabott tulajdonság} sztring
{testreszabott tulajdonság} sztring

ProbeSettings

Név Leírás Érték
failureThreshold Azoknak a hibáknak a száma, amelyek engedélyezve lesznek, mielőtt nem kifogástalan állapotot ad vissza. int
initialDelay Az ISO 8601 formátumú első mintavétel előtti késleltetés. sztring
period Az ISO 8601 formátumú mintavételek közötti időtartam. sztring
successThreshold A sikeres mintavételek száma, mielőtt kifogástalan állapotot ad vissza. int
timeout A mintavétel időtúllépése ISO 8601 formátumban. sztring

EndpointDeploymentPropertiesBaseProperties

Név Leírás Érték
{testreszabott tulajdonság} sztring
{testreszabott tulajdonság} sztring

OnlineRequestSettings

Név Leírás Érték
maxConcurrentRequestsPerInstance Az üzemelő példányonként engedélyezett csomópontonkénti egyidejű kérelmek maximális száma. Alapértelmezés szerint 1. int
maxQueueWait A kérések maximális időtartama ISO 8601 formátumban marad az üzenetsorban.
Alapértelmezés szerint 500 ms.
sztring
requestTimeout A pontozási időtúllépés ISO 8601 formátumban.
Alapértelmezés szerint 5000 ms.
sztring

OnlineScaleSettings

Név Leírás Érték
scaleType Az objektum típusának beállítása Alapértelmezett
TargetUtilization (kötelező)

DefaultScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "Alapértelmezett" (kötelező)

TargetUtilizationScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "TargetUtilization" (kötelező)
maxInstances A példányok maximális száma, amelyekre az üzembe helyezés méretezhető. A kvóta max_instances lesz fenntartva. int
minInstances A mindig jelen lévő példányok minimális száma. int
pollingInterval A lekérdezési időköz ISO 8691 formátumban. Csak a másodperc pontosságú időtartamot támogatja. sztring
targetUtilizationPercentage Az automatikus skálázási eszköz cél cpu-használata. int

KubernetesOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Kubernetes" (kötelező)
containerResourceRequirements A tároló erőforrás-követelményei (processzor és memória). ContainerResourceRequirements

ContainerResourceRequirements

Név Leírás Érték
containerResourceLimits Tárolóerőforrás-korlát adatai: ContainerResourceSettings
containerResourceRequests Tárolóerőforrás-kérelem adatai: ContainerResourceSettings

ContainerResourceSettings

Név Leírás Érték
Cpu A tárolóhoz tartozó vCPU-kérések száma/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
Gpu Nvidia GPU-kártyák kérésének/korlátjának száma a tárolóhoz. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
memória Tároló memóriaméret-kérése/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring

ManagedOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Felügyelt" (kötelező)

SKU

Név Leírás Érték
capacity Ha a termékváltozat támogatja a fel- és leskálázást, akkor a kapacitás egészét is tartalmaznia kell. Ha az erőforráshoz nem lehet vertikális felskálázást/beskálázást végezni, ez kihagyható. int
family Ha a szolgáltatás eltérő hardvergenerációval rendelkezik ugyanahhoz a termékváltozathoz, akkor az itt rögzíthető. sztring
name A termékváltozat neve. Ex - P3. Ez általában egy betű+szám kód sztring (kötelező)
size A termékváltozat mérete. Ha a névmező a réteg és más értékek kombinációja, ez a különálló kód. sztring
tier Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges. "Alapszintű"
"Ingyenes"
"Prémium"
"Standard"