Share via


Microsoft.MachineLearningServices-munkaterületek/onlineEndpoints/deployments 2023-06-01-preview

Bicep-erőforrásdefiníció

A munkaterületek/onlineEndpoints/deployments erőforrástípus üzembe helyezhető a következő célműveletekkel:

Az egyes API-verziók módosított tulajdonságainak listáját a változásnaplóban találja.

Erőforrás formátuma

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments erőforrás létrehozásához adja hozzá a következő Bicep-et a sablonhoz.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    dataCollector: {
      collections: {
        {customized property}: {
          clientId: 'string'
          dataCollectionMode: 'string'
          dataId: 'string'
          samplingRate: int
        }
      }
      requestLogging: {
        captureHeaders: [
          'string'
        ]
      }
      rollingRate: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties objektumok

Állítsa be az endpointComputeType tulajdonságot az objektum típusának megadásához.

A Kubernetes esetében használja a következőt:

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Felügyelt esetén használja a következőt:

  endpointComputeType: 'Managed'

OnlineScaleSettings objektumok

Állítsa be a scaleType tulajdonságot az objektum típusának megadásához.

Alapértelmezett beállításként használja a következőt:

  scaleType: 'Default'

A TargetUtilization esetében használja a következőt:

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Tulajdonságértékek

workspaces/onlineEndpoints/deployments

Név Leírás Érték
name Az erőforrás neve

Megtudhatja, hogyan állíthatja be a gyermekerőforrások nevét és típusát a Bicepben.
sztring (kötelező)
location A földrajzi hely, ahol az erőforrás él sztring (kötelező)
tags Erőforráscímkék. Címkenevek és -értékek szótára. Címkék megtekintése sablonokban
Sku Az automatikus skálázáshoz szükséges ARM-szerződés termékváltozatának részletei. Sku
Fajta A portál/eszközök/stb. által az azonos típusú erőforrások különböző felhasználói felületi élményeinek megjelenítéséhez használt metaadatok. sztring
Szülő A Bicepben megadhatja egy gyermekerőforrás szülőerőforrását. Ezt a tulajdonságot csak akkor kell hozzáadnia, ha a gyermekerőforrás a szülőerőforráson kívül van deklarálva.

További információ: Gyermekerőforrás a szülőerőforráson kívül.
Az erőforrástípus szimbolikus neve: onlineEndpoints
identity Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások) ManagedServiceIdentity
properties [Kötelező] Az entitás további attribútumai. OnlineDeploymentProperties (kötelező)

ManagedServiceIdentity

Név Leírás Érték
típus A felügyeltszolgáltatás-identitás típusa (ahol a SystemAssigned és a UserAssigned típus egyaránt engedélyezett). "Nincs"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (kötelező)
userAssignedIdentities Az erőforráshoz társított felhasználó által hozzárendelt identitások halmaza. A userAssignedIdentities szótárkulcsok ARM-erőforrás-azonosítók lesznek a következő formában: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. A szótárértékek üres objektumok ({}) lehetnek a kérésekben. UserAssignedIdentities

UserAssignedIdentities

Név Leírás Érték
{customized property} UserAssignedIdentity

UserAssignedIdentity

Ez az objektum nem tartalmaz az üzembe helyezés során beállítandó tulajdonságokat. Minden tulajdonság readOnly.

OnlineDeploymentProperties

Név Leírás Érték
appInsightsEnabled Ha igaz, engedélyezi az Application Insights naplózását. logikai
codeConfiguration Kódkonfiguráció a végpont üzembe helyezéséhez. CodeConfiguration
dataCollector Az mdc konfigurációja null érték esetén letiltja az mdc-t. DataCollector
leírás A végpont üzembe helyezésének leírása. sztring
egressPublicNetworkAccess Ha engedélyezve van, engedélyezze a kimenő forgalom nyilvános hálózati hozzáférését. Ha le van tiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve. "Letiltva"
"Engedélyezve"
environmentId A végpont üzembe helyezésének környezeti specifikációjának ARM-erőforrás-azonosítója. sztring
environmentVariables Környezeti változók konfigurálása az üzembe helyezéshez. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Számítási példány típusa. sztring
livenessProbe Az élettartam-mintavétel rendszeresen figyeli a tároló állapotát. ProbeSettings
modell A modell URI-elérési útja. sztring
modelMountPath A modell egyéni tárolóban való csatlakoztatásának útvonala. sztring
properties Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók. EndpointDeploymentPropertiesBaseProperties
readinessProbe A készenlét-mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élettartam-mintavétellel. ProbeSettings
requestSettings Az üzemelő példány beállításainak kérése. OnlineRequestSettings
scaleSettings Az üzembe helyezés méretezési beállításai.
Ha null értékű, vagy nincs megadva,
Alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings értéke
és a DefaultScaleSettings for ManagedOnlineDeployment értékre.
OnlineScaleSettings
endpointComputeType Az objektum típusának beállítása Kubernetes
Felügyelt (kötelező)

CodeConfiguration

Név Leírás Érték
codeId A kódobjektum ARM-erőforrás-azonosítója. sztring
scoringScript [Kötelező] Az indításkor végrehajtandó szkript. például: "score.py" sztring (kötelező)

Korlátok:
Minimális hossz = 1
Minta = [a-zA-Z0-9_]

DataCollector

Név Leírás Érték
Gyűjtemények [Kötelező] A gyűjtemény konfigurációja. Minden gyűjtemény saját konfigurációval rendelkezik a modelladatok gyűjtéséhez, és a gyűjtemény neve tetszőleges sztring lehet.
A modelladatgyűjtő hasznos adatnaplózáshoz, egyéni naplózáshoz vagy mindkettőhöz használható. A gyűjtési kérések és válaszok a hasznos adatok naplózására vannak fenntartva, mások egyéni naplózásra szolgálnak.
DataCollectorCollections (kötelező)
requestLogging Az mdc kérésnaplózási konfigurációja az összes gyűjtemény speciális naplózási beállításait tartalmazza. Ez nem kötelező. RequestLogging
rollingRate Amikor a modelladatokat a blobtárolóba gyűjti a rendszer, az adatokat más elérési útra kell forgatnunk, hogy ne kelljen mindegyiket egyetlen blobfájlban naplóznunk.
Ha a gördülő sebesség óra, a rendszer minden adatot a /yyyy/MM/dd/HH/ blobútvonalon gyűjt.
Ha ez a nap, a rendszer minden adatot a /yyyy/MM/dd/ blobútvonalon gyűjt.
A gördülő út másik előnye, hogy a modellmonitorozási felhasználói felület nagyon gyorsan képes kiválasztani egy adattartományt.
"Nap"
"Óra"
"Perc"
"Hónap"
"Év"

DataCollectorCollections

Név Leírás Érték
{customized property} Gyűjtemény

Gyűjtemény

Név Leírás Érték
ügyfél-azonosító A Blob Storage-ba történő naplózás gyűjtéséhez használt MSI-ügyfélazonosító. Ha null értékű, a háttérrendszer kiválaszt egy regisztrált végponti identitást a hitelesítéshez. sztring
dataCollectionMode Adatgyűjtés engedélyezése vagy letiltása. "Letiltva"
"Engedélyezve"
dataId Az adategység ARM-erőforrás-azonosítója. Az ügyféloldal biztosítja, hogy az adategység a blobtárolóra mutasson, a háttérrendszer pedig adatokat gyűjt a blobtárolóba. sztring
samplingRate A begyűjtés mintavételezési sebessége. Az 1,0-s mintavételezési arány azt jelenti, hogy alapértelmezés szerint az adatok 100%-át gyűjtjük. int

RequestLogging

Név Leírás Érték
captureHeaders A hasznos adatok naplózásához alapértelmezés szerint csak hasznos adatokat gyűjtünk. Ha az ügyfelek a megadott fejléceket is szeretnék összegyűjteni, a captureHeadersben beállíthatják őket, hogy a háttérrendszer a hasznos adatokkal együtt gyűjtse össze ezeket a fejléceket. sztring[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Név Leírás Érték
{customized property} sztring
{customized property} sztring

ProbeSettings

Név Leírás Érték
failureThreshold Azoknak a hibáknak a száma, amelyek engedélyezve lesznek, mielőtt nem kifogástalan állapotot ad vissza. int
initialDelay Az ISO 8601 formátumú első mintavétel előtti késleltetés. sztring
period Az ISO 8601 formátumú mintavételek közötti időtartam. sztring
successThreshold A sikeres mintavételek száma, mielőtt kifogástalan állapotot ad vissza. int
timeout A mintavétel időtúllépése ISO 8601 formátumban. sztring

EndpointDeploymentPropertiesBaseProperties

Név Leírás Érték
{customized property} sztring
{customized property} sztring

OnlineRequestSettings

Név Leírás Érték
maxConcurrentRequestsPerInstance Az üzemelő példányonként engedélyezett csomópontonkénti egyidejű kérelmek maximális száma. Alapértelmezés szerint 1. int
maxQueueWait A kérések maximális időtartama ISO 8601 formátumban marad az üzenetsorban.
Alapértelmezés szerint 500 ms.
sztring
requestTimeout A pontozási időtúllépés ISO 8601 formátumban.
Alapértelmezés szerint 5000 ms.
sztring

OnlineScaleSettings

Név Leírás Érték
scaleType Az objektum típusának beállítása Alapértelmezett
TargetUtilization (kötelező)

DefaultScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "Alapértelmezett" (kötelező)

TargetUtilizationScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "TargetUtilization" (kötelező)
maxInstances A példányok maximális száma, amelyekre az üzembe helyezés méretezhető. A kvóta max_instances lesz fenntartva. int
minInstances A mindig jelen lévő példányok minimális száma. int
pollingInterval A lekérdezési időköz ISO 8691 formátumban. Csak a másodperc pontosságú időtartamot támogatja. sztring
targetUtilizationPercentage Az automatikus skálázási eszköz cél cpu-használata. int

KubernetesOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Kubernetes" (kötelező)
containerResourceRequirements A tároló erőforrás-követelményei (processzor és memória). ContainerResourceRequirements

ContainerResourceRequirements

Név Leírás Érték
containerResourceLimits Tárolóerőforrás-korlát adatai: ContainerResourceSettings
containerResourceRequests Tárolóerőforrás-kérelem adatai: ContainerResourceSettings

ContainerResourceSettings

Név Leírás Érték
Cpu A tárolóhoz tartozó vCPU-kérések száma/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
Gpu Nvidia GPU-kártyák kérésének/korlátjának száma a tárolóhoz. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
memória Tároló memóriaméret-kérése/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring

ManagedOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Felügyelt" (kötelező)

SKU

Név Leírás Érték
capacity Ha a termékváltozat támogatja a fel- és leskálázást, akkor a kapacitás egészét is tartalmaznia kell. Ha az erőforráshoz nem lehet vertikális felskálázást/beskálázást végezni, ez kihagyható. int
family Ha a szolgáltatás eltérő hardvergenerációval rendelkezik ugyanahhoz a termékváltozathoz, akkor az itt rögzíthető. sztring
name A termékváltozat neve. Ex - P3. Ez általában egy betű+szám kód sztring (kötelező)
size A termékváltozat mérete. Ha a névmező a réteg és más értékek kombinációja, ez a különálló kód. sztring
tier Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges. "Alapszintű"
"Ingyenes"
"Prémium"
"Standard"

ARM-sablon erőforrás-definíciója

A munkaterületek/onlineEndpoints/deployments erőforrástípus üzembe helyezhető a következő célműveletekkel:

Az egyes API-verziók módosított tulajdonságainak listáját a változásnaplóban találja.

Erőforrás formátuma

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments erőforrás létrehozásához adja hozzá a következő JSON-t a sablonhoz.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-06-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "dataCollector": {
      "collections": {
        "{customized property}": {
          "clientId": "string",
          "dataCollectionMode": "string",
          "dataId": "string",
          "samplingRate": "int"
        }
      },
      "requestLogging": {
        "captureHeaders": [ "string" ]
      },
      "rollingRate": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

OnlineDeploymentProperties objektumok

Állítsa be az endpointComputeType tulajdonságot az objektum típusának megadásához.

A Kubernetes esetében használja a következőt:

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Felügyelt esetén használja a következőt:

  "endpointComputeType": "Managed"

OnlineScaleSettings objektumok

Állítsa be a scaleType tulajdonságot az objektum típusának megadásához.

Alapértelmezett beállításként használja a következőt:

  "scaleType": "Default"

A TargetUtilization esetében használja a következőt:

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Tulajdonságértékek

workspaces/onlineEndpoints/deployments

Név Leírás Érték
típus Az erőforrás típusa "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments"
apiVersion Az erőforrás API-verziója '2023-06-01-preview"
name Az erőforrás neve

Megtudhatja, hogyan állíthatja be a gyermekerőforrások nevét és típusát JSON ARM-sablonokban.
sztring (kötelező)
location A földrajzi hely, ahol az erőforrás él sztring (kötelező)
tags Erőforráscímkék. Címkenevek és -értékek szótára. Címkék megtekintése sablonokban
Sku Az automatikus skálázáshoz szükséges ARM-szerződés termékváltozatának részletei. Sku
Fajta A portál/eszközök/stb. által az azonos típusú erőforrások különböző felhasználói felületi élményeinek megjelenítéséhez használt metaadatok. sztring
identity Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások) ManagedServiceIdentity
properties [Kötelező] Az entitás további attribútumai. OnlineDeploymentProperties (kötelező)

ManagedServiceIdentity

Név Leírás Érték
típus A felügyeltszolgáltatás-identitás típusa (ahol a SystemAssigned és a UserAssigned típus egyaránt engedélyezett). "Nincs"
"SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (kötelező)
userAssignedIdentities Az erőforráshoz társított felhasználó által hozzárendelt identitások halmaza. A userAssignedIdentities szótárkulcsok ARM-erőforrás-azonosítók lesznek a következő formában: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. A szótárértékek üres objektumok ({}) lehetnek a kérésekben. UserAssignedIdentities

UserAssignedIdentities

Név Leírás Érték
{customized property} UserAssignedIdentity

UserAssignedIdentity

Ez az objektum nem tartalmaz az üzembe helyezés során beállítandó tulajdonságokat. Minden tulajdonság readOnly.

OnlineDeploymentProperties

Név Leírás Érték
appInsightsEnabled Ha igaz, engedélyezi az Application Insights naplózását. logikai
codeConfiguration Kódkonfiguráció a végpont üzembe helyezéséhez. CodeConfiguration
dataCollector Az mdc konfigurációja null érték esetén letiltja az mdc-t. DataCollector
leírás A végpont üzembe helyezésének leírása. sztring
egressPublicNetworkAccess Ha engedélyezve van, engedélyezze a kimenő forgalom nyilvános hálózati hozzáférését. Ha le van tiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve. "Letiltva"
"Engedélyezve"
environmentId A végpont üzembe helyezésének környezeti specifikációjának ARM-erőforrás-azonosítója. sztring
environmentVariables Környezeti változók konfigurálása az üzembe helyezéshez. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Számítási példány típusa. sztring
livenessProbe Az élettartam-mintavétel rendszeresen figyeli a tároló állapotát. ProbeSettings
modell A modell URI-elérési útja. sztring
modelMountPath A modell egyéni tárolóban való csatlakoztatásának útvonala. sztring
properties Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók. EndpointDeploymentPropertiesBaseProperties
readinessProbe A készenlét-mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élettartam-mintavétellel. ProbeSettings
requestSettings Az üzemelő példány beállításainak kérése. OnlineRequestSettings
scaleSettings Az üzembe helyezés skálázási beállításai.
Ha null értékű, vagy nincs megadva,
alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings értéke.
és a DefaultScaleSettings for ManagedOnlineDeployment értékre.
OnlineScaleSettings
endpointComputeType Az objektumtípus beállítása Kubernetes
Felügyelt (kötelező)

CodeConfiguration

Név Leírás Érték
codeId A kódeszköz ARM-erőforrás-azonosítója. sztring
scoringScript [Kötelező] Az indításkor végrehajtandó szkript. például: "score.py" sztring (kötelező)

Korlátok:
Minimális hossz = 1
Minta = [a-zA-Z0-9_]

DataCollector

Név Leírás Érték
Gyűjtemények [Kötelező] A gyűjtemény konfigurációja. Minden gyűjtemény saját konfigurációval rendelkezik a modelladatok gyűjtéséhez, és a gyűjtemény neve tetszőleges sztring lehet.
A modelladatgyűjtő hasznos adatnaplózáshoz, egyéni naplózáshoz vagy mindkettőhöz használható. A gyűjteménykérés és a válasz hasznos adatok naplózására van fenntartva, mások egyéni naplózásra szolgálnak.
DataCollectorCollections (kötelező)
requestLogging Az mdc kérésnaplózási konfigurációja az összes gyűjtemény speciális naplózási beállításait tartalmazza. Ez nem kötelező. RequestLogging
rollingRate Amikor a modelladatokat a blobtárolóba gyűjti, az adatokat más elérési útra kell gördíteni, hogy elkerülje az összes adat egyetlen blobfájlban való naplózását.
Ha a gördülési sebesség óra, a rendszer minden adatot a /yyyy/MM/dd/HH/ blobútvonalon gyűjt.
Ha ez a nap, minden adatot a /yyyy/MM/dd/ blobútvonalon gyűjtünk.
A gördülő út másik előnye, hogy a modellmonitorozási felhasználói felület nagyon gyorsan képes az adatok időtartományának kiválasztására.
"Nap"
"Óra"
"Perc"
"Hónap"
"Év"

DataCollectorCollections

Név Leírás Érték
{testreszabott tulajdonság} Gyűjtemény

Gyűjtemény

Név Leírás Érték
ügyfél-azonosító A blobtárolóba történő naplózás gyűjtéséhez használt msi-ügyfélazonosító. Ha null értékű, a háttérrendszer egy regisztrált végponti identitást választ a hitelesítéshez. sztring
dataCollectionMode Adatgyűjtés engedélyezése vagy letiltása. "Letiltva"
"Engedélyezve"
dataId Az adategység arm erőforrás-azonosítója. Az ügyféloldal biztosítja, hogy az adategység a blobtárolóra mutasson, a háttérrendszer pedig adatokat gyűjt a blobtárolóba. sztring
mintavételezési sebesség A mintavételezési arány a gyűjteményhez. Az 1,0-s mintavételezési arány azt jelenti, hogy alapértelmezés szerint az adatok 100%-át gyűjtjük össze. int

RequestLogging

Név Leírás Érték
captureHeaders A hasznos adatok naplózásához alapértelmezés szerint csak hasznos adatokat gyűjtünk. Ha az ügyfelek a megadott fejléceket is szeretnék összegyűjteni, beállíthatják őket a captureHeadersben, hogy a háttérrendszer a hasznos adatokkal együtt gyűjtse össze ezeket a fejléceket. sztring[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Név Leírás Érték
{testreszabott tulajdonság} sztring
{testreszabott tulajdonság} sztring

ProbeSettings

Név Leírás Érték
failureThreshold Azoknak a hibáknak a száma, amelyek engedélyezve lesznek, mielőtt nem kifogástalan állapotot ad vissza. int
initialDelay Az ISO 8601 formátumú első mintavétel előtti késleltetés. sztring
period Az ISO 8601 formátumú mintavételek közötti időtartam. sztring
successThreshold A sikeres mintavételek száma, mielőtt kifogástalan állapotot ad vissza. int
timeout A mintavétel időtúllépése ISO 8601 formátumban. sztring

EndpointDeploymentPropertiesBaseProperties

Név Leírás Érték
{customized property} sztring
{customized property} sztring

OnlineRequestSettings

Név Leírás Érték
maxConcurrentRequestsPerInstance Az üzemelő példányonként engedélyezett csomópontonkénti egyidejű kérelmek maximális száma. Alapértelmezés szerint 1. int
maxQueueWait A kérések maximális időtartama ISO 8601 formátumban marad az üzenetsorban.
Alapértelmezés szerint 500 ms.
sztring
requestTimeout A pontozási időtúllépés ISO 8601 formátumban.
Alapértelmezés szerint 5000 ms.
sztring

OnlineScaleSettings

Név Leírás Érték
scaleType Az objektum típusának beállítása Alapértelmezett
TargetUtilization (kötelező)

DefaultScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "Alapértelmezett" (kötelező)

TargetUtilizationScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "TargetUtilization" (kötelező)
maxInstances A példányok maximális száma, amelyekre az üzembe helyezés méretezhető. A kvóta max_instances lesz fenntartva. int
minInstances A mindig jelen lévő példányok minimális száma. int
pollingInterval A lekérdezési időköz ISO 8691 formátumban. Csak a másodperc pontosságú időtartamot támogatja. sztring
targetUtilizationPercentage Az automatikus skálázási eszköz cél cpu-használata. int

KubernetesOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Kubernetes" (kötelező)
containerResourceRequirements A tároló erőforrás-követelményei (processzor és memória). ContainerResourceRequirements

ContainerResourceRequirements

Név Leírás Érték
containerResourceLimits Tárolóerőforrás-korlát adatai: ContainerResourceSettings
containerResourceRequests Tárolóerőforrás-kérelem adatai: ContainerResourceSettings

ContainerResourceSettings

Név Leírás Érték
Cpu A tárolóhoz tartozó vCPU-kérések száma/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
Gpu Nvidia GPU-kártyák kérésének/korlátjának száma a tárolóhoz. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
memória Tároló memóriaméret-kérése/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring

ManagedOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Felügyelt" (kötelező)

SKU

Név Leírás Érték
capacity Ha a termékváltozat támogatja a vertikális felskálázást/in, akkor a kapacitás egész számának szerepelnie kell. Ha az erőforrás esetében nem lehetséges a vertikális felskálázás/beskálázás, akkor ez kihagyható. int
family Ha a szolgáltatás különböző hardvergenerációkkal rendelkezik ugyanahhoz a termékváltozathoz, akkor az itt rögzíthető. sztring
name A termékváltozat neve. Ex - P3. Ez általában egy betű+szám kód sztring (kötelező)
size A termékváltozat mérete. Ha a névmező a szint és egy másik érték kombinációja, akkor ez a különálló kód. sztring
tier Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges. "Alapszintű"
"Ingyenes"
"Prémium"
"Standard"

Terraform (AzAPI-szolgáltató) erőforrásdefiníció

A munkaterületek/onlineEndpoints/deployments erőforrástípus üzembe helyezhető olyan műveletekkel, amelyek a következőket célják:

  • Erőforráscsoportok

Az egyes API-verziók módosított tulajdonságainak listáját a változásnaplóban találja.

Erőforrás formátuma

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments erőforrás létrehozásához adja hozzá a következő Terraformot a sablonhoz.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      dataCollector = {
        collections = {
          {customized property} = {
            clientId = "string"
            dataCollectionMode = "string"
            dataId = "string"
            samplingRate = int
          }
        }
        requestLogging = {
          captureHeaders = [
            "string"
          ]
        }
        rollingRate = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

OnlineDeploymentProperties objektumok

Állítsa be az endpointComputeType tulajdonságot az objektum típusának megadásához.

Kubernetes esetén használja a következőt:

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Felügyelt esetén használja a következőt:

  endpointComputeType = "Managed"

OnlineScaleSettings objektumok

Állítsa be a scaleType tulajdonságot az objektum típusának megadásához.

Alapértelmezés szerint használja a következőt:

  scaleType = "Default"

A TargetUtilization esetében használja a következőt:

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Tulajdonságértékek

munkaterületek/onlineEndpoints/deployments

Név Leírás Érték
típus Az erőforrás típusa "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview"
name Az erőforrás neve sztring (kötelező)
location Az a földrajzi hely, ahol az erőforrás él sztring (kötelező)
parent_id Az erőforrás szülőjének azonosítója. Típusú erőforrás azonosítója: onlineEndpoints
tags Erőforráscímkék. Címkenevek és -értékek szótára.
Sku Az automatikus skálázási ARM-szerződéshez szükséges termékváltozat részletei. Sku
Fajta A portál/eszközhasználat/stb. által használt metaadatok az azonos típusú erőforrások különböző felhasználói felületi élményének megjelenítéséhez. sztring
identity Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások) ManagedServiceIdentity
properties [Kötelező] Az entitás további attribútumai. OnlineDeploymentProperties (kötelező)

ManagedServiceIdentity

Név Leírás Érték
típus A felügyeltszolgáltatás-identitás típusa (ahol a SystemAssigned és a UserAssigned típus egyaránt engedélyezett). "SystemAssigned"
"SystemAssigned,UserAssigned"
"UserAssigned" (kötelező)
identity_ids Az erőforráshoz társított felhasználó által hozzárendelt identitások halmaza. A userAssignedIdentities szótárkulcsok arm-erőforrás-azonosítók lesznek a következő űrlapon: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. A szótár értékei üres objektumok ({}) lehetnek a kérésekben. Felhasználói identitásazonosítók tömbje.

UserAssignedIdentities

Név Leírás Érték
{customized property} UserAssignedIdentity

UserAssignedIdentity

Ez az objektum nem tartalmaz az üzembe helyezés során beállítandó tulajdonságokat. Minden tulajdonság readOnly.

OnlineDeploymentProperties

Név Leírás Érték
appInsightsEnabled Ha igaz, engedélyezi az Application Insights naplózását. logikai
codeConfiguration Kódkonfiguráció a végpont üzembe helyezéséhez. CodeConfiguration
dataCollector Az mdc konfigurációja null érték esetén letiltja az mdc-t. DataCollector
leírás A végpont üzembe helyezésének leírása. sztring
egressPublicNetworkAccess Ha engedélyezve van, engedélyezze a kimenő forgalom nyilvános hálózati hozzáférését. Ha le van tiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve. "Letiltva"
"Engedélyezve"
environmentId A végpont üzembe helyezésének környezeti specifikációjának ARM-erőforrás-azonosítója. sztring
environmentVariables Környezeti változók konfigurálása az üzembe helyezéshez. EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType Számítási példány típusa. sztring
livenessProbe Az élettartam-mintavétel rendszeresen figyeli a tároló állapotát. ProbeSettings
modell A modell URI-elérési útja. sztring
modelMountPath A modell egyéni tárolóban való csatlakoztatásának útvonala. sztring
properties Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók. EndpointDeploymentPropertiesBaseProperties
readinessProbe A készenlét-mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élettartam-mintavétellel. ProbeSettings
requestSettings Az üzemelő példány beállításainak kérése. OnlineRequestSettings
scaleSettings Az üzembe helyezés méretezési beállításai.
Ha null értékű, vagy nincs megadva,
Alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings értéke
és a DefaultScaleSettings for ManagedOnlineDeployment értékre.
OnlineScaleSettings
endpointComputeType Az objektum típusának beállítása Kubernetes
Felügyelt (kötelező)

CodeConfiguration

Név Leírás Érték
codeId A kódobjektum ARM-erőforrás-azonosítója. sztring
scoringScript [Kötelező] Az indításkor végrehajtandó szkript. például: "score.py" sztring (kötelező)

Korlátok:
Minimális hossz = 1
Minta = [a-zA-Z0-9_]

DataCollector

Név Leírás Érték
Gyűjtemények [Kötelező] A gyűjtemény konfigurációja. Minden gyűjtemény saját konfigurációval rendelkezik a modelladatok gyűjtéséhez, és a gyűjtemény neve tetszőleges sztring lehet.
A modelladatgyűjtő hasznos adatnaplózáshoz, egyéni naplózáshoz vagy mindkettőhöz használható. A gyűjtési kérések és válaszok a hasznos adatok naplózására vannak fenntartva, mások egyéni naplózásra szolgálnak.
DataCollectorCollections (kötelező)
requestLogging Az mdc kérésnaplózási konfigurációja az összes gyűjtemény speciális naplózási beállításait tartalmazza. Ez nem kötelező. RequestLogging
rollingRate Amikor a modelladatokat a blobtárolóba gyűjti a rendszer, az adatokat más elérési útra kell forgatnunk, hogy ne kelljen mindegyiket egyetlen blobfájlban naplóznunk.
Ha a gördülő sebesség óra, a rendszer minden adatot a /yyyy/MM/dd/HH/ blobútvonalon gyűjt.
Ha ez a nap, a rendszer minden adatot a /yyyy/MM/dd/ blobútvonalon gyűjt.
A gördülő út másik előnye, hogy a modellmonitorozási felhasználói felület nagyon gyorsan képes kiválasztani egy adattartományt.
"Nap"
"Óra"
"Perc"
"Hónap"
"Év"

DataCollectorCollections

Név Leírás Érték
{customized property} Gyűjtemény

Gyűjtemény

Név Leírás Érték
ügyfél-azonosító A Blob Storage-ba történő naplózás gyűjtéséhez használt MSI-ügyfélazonosító. Ha null értékű, a háttérrendszer kiválaszt egy regisztrált végponti identitást a hitelesítéshez. sztring
dataCollectionMode Adatgyűjtés engedélyezése vagy letiltása. "Letiltva"
"Engedélyezve"
dataId Az adategység ARM-erőforrás-azonosítója. Az ügyféloldal biztosítja, hogy az adategység a blobtárolóra mutasson, a háttérrendszer pedig adatokat gyűjt a blobtárolóba. sztring
samplingRate A begyűjtés mintavételezési sebessége. Az 1,0-s mintavételezési arány azt jelenti, hogy alapértelmezés szerint az adatok 100%-át gyűjtjük. int

RequestLogging

Név Leírás Érték
captureHeaders A hasznos adatok naplózásához alapértelmezés szerint csak hasznos adatokat gyűjtünk. Ha az ügyfelek a megadott fejléceket is szeretnék összegyűjteni, a captureHeadersben beállíthatják őket, hogy a háttérrendszer a hasznos adatokkal együtt gyűjtse össze ezeket a fejléceket. sztring[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Név Leírás Érték
{customized property} sztring
{customized property} sztring

ProbeSettings

Név Leírás Érték
failureThreshold Azoknak a hibáknak a száma, amelyek engedélyezve lesznek, mielőtt nem kifogástalan állapotot ad vissza. int
initialDelay Az ISO 8601 formátumú első mintavétel előtti késleltetés. sztring
period Az ISO 8601 formátumú mintavételek közötti időtartam. sztring
successThreshold A sikeres mintavételek száma, mielőtt kifogástalan állapotot ad vissza. int
timeout A mintavétel időtúllépése ISO 8601 formátumban. sztring

EndpointDeploymentPropertiesBaseProperties

Név Leírás Érték
{customized property} sztring
{customized property} sztring

OnlineRequestSettings

Név Leírás Érték
maxConcurrentRequestsPerInstance Az üzemelő példányonként engedélyezett csomópontonkénti egyidejű kérelmek maximális száma. Alapértelmezés szerint 1. int
maxQueueWait A kérések maximális időtartama ISO 8601 formátumban marad az üzenetsorban.
Alapértelmezés szerint 500 ms.
sztring
requestTimeout A pontozási időtúllépés ISO 8601 formátumban.
Alapértelmezés szerint 5000 ms.
sztring

OnlineScaleSettings

Név Leírás Érték
scaleType Az objektum típusának beállítása Alapértelmezett
TargetUtilization (kötelező)

DefaultScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "Alapértelmezett" (kötelező)

TargetUtilizationScaleSettings

Név Leírás Érték
scaleType [Kötelező] Az üzembe helyezési skálázási algoritmus típusa "TargetUtilization" (kötelező)
maxInstances A példányok maximális száma, amelyekre az üzembe helyezés méretezhető. A kvóta max_instances lesz fenntartva. int
minInstances A mindig jelen lévő példányok minimális száma. int
pollingInterval A lekérdezési időköz ISO 8691 formátumban. Csak az időtartamot támogatja olyan pontossággal, mint a Másodperc. sztring
targetUtilizationPercentage Cél CPU-használat az automatikus skálázóhoz. int

KubernetesOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Kubernetes" (kötelező)
containerResourceRequirements A tároló erőforráskövetelményei (processzor és memória). ContainerResourceRequirements

ContainerResourceRequirements

Név Leírás Érték
containerResourceLimits Tárolóerőforrás-korlát adatai: ContainerResourceSettings
containerResourceRequests Tárolóerőforrás-kérelem adatai: ContainerResourceSettings

ContainerResourceSettings

Név Leírás Érték
Cpu A tárolóra vonatkozó vCPU-kérések száma/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
Gpu Nvidia GPU-kártyák kérésének/korlátjának száma a tárolóhoz. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring
memória Tároló memóriaméret-kérése/korlátja. További információ:
https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/
sztring

ManagedOnlineDeployment

Név Leírás Érték
endpointComputeType [Kötelező] A végpont számítási típusa. "Felügyelt" (kötelező)

SKU

Név Leírás Érték
capacity Ha a termékváltozat támogatja a vertikális felskálázást/in, akkor a kapacitás egész számának szerepelnie kell. Ha az erőforrás esetében nem lehetséges a vertikális felskálázás/beskálázás, akkor ez kihagyható. int
family Ha a szolgáltatás különböző hardvergenerációkkal rendelkezik ugyanahhoz a termékváltozathoz, akkor az itt rögzíthető. sztring
name A termékváltozat neve. Ex - P3. Ez általában egy betű+szám kód sztring (kötelező)
size A termékváltozat mérete. Ha a névmező a szint és egy másik érték kombinációja, akkor ez a különálló kód. sztring
tier Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges. "Alapszintű"
"Ingyenes"
"Prémium"
"Standard"