Microsoft.MachineLearningServices-munkaterületek/onlineEndpoints/deployments 2022-10-01
Bicep-erőforrásdefiníció
A munkaterületek/onlineEndpoints/deployments erőforrástípus üzembe helyezhető a következő célműveletekkel:
- Erőforráscsoportok – Lásd : Erőforráscsoport üzembehelyezési parancsai
Az egyes API-verziók módosított tulajdonságainak listáját a változásnaplóban találja.
Erőforrás formátuma
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments erőforrás létrehozásához adja hozzá a következő Bicep-et a sablonhoz.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
properties: {
{customized property}: 'string'
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentProperties objects
}
}
OnlineDeploymentProperties objektumok
Állítsa be az endpointComputeType tulajdonságot az objektum típusának megadásához.
A Kubernetes esetében használja a következőt:
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
Felügyelt esetén használja a következőt:
endpointComputeType: 'Managed'
OnlineScaleSettings objektumok
Állítsa be a scaleType tulajdonságot az objektum típusának megadásához.
Alapértelmezett beállításként használja a következőt:
scaleType: 'Default'
A TargetUtilization esetében használja a következőt:
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Tulajdonságértékek
workspaces/onlineEndpoints/deployments
Név | Leírás | Érték |
---|---|---|
name | Az erőforrás neve Megtudhatja, hogyan állíthatja be a gyermekerőforrások nevét és típusát a Bicepben. |
sztring (kötelező) |
location | A földrajzi hely, ahol az erőforrás él | sztring (kötelező) |
tags | Erőforráscímkék. | Címkenevek és -értékek szótára. Címkék megtekintése sablonokban |
Sku | Az automatikus skálázáshoz szükséges ARM-szerződés termékváltozatának részletei. | Sku |
Fajta | A portál/eszközök/stb. által az azonos típusú erőforrások különböző felhasználói felületi élményeinek megjelenítéséhez használt metaadatok. | sztring |
Szülő | A Bicepben megadhatja egy gyermekerőforrás szülőerőforrását. Ezt a tulajdonságot csak akkor kell hozzáadnia, ha a gyermekerőforrás a szülőerőforráson kívül van deklarálva. További információ: Gyermekerőforrás a szülőerőforráson kívül. |
Az erőforrástípus szimbolikus neve: onlineEndpoints |
identity | Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások) | ManagedServiceIdentity |
properties | [Kötelező] Az entitás további attribútumai. | OnlineDeploymentProperties (kötelező) |
ManagedServiceIdentity
Név | Leírás | Érték |
---|---|---|
típus | A felügyeltszolgáltatás-identitás típusa (ahol a SystemAssigned és a UserAssigned típus egyaránt engedélyezett). | "Nincs" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (kötelező) |
userAssignedIdentities | Az erőforráshoz társított felhasználó által hozzárendelt identitások halmaza. A userAssignedIdentities szótárkulcsok ARM-erőforrás-azonosítók lesznek a következő formában: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. A szótárértékek üres objektumok ({}) lehetnek a kérésekben. | UserAssignedIdentities |
UserAssignedIdentities
Név | Leírás | Érték |
---|---|---|
{customized property} | UserAssignedIdentity |
UserAssignedIdentity
Ez az objektum nem tartalmaz az üzembe helyezés során beállítandó tulajdonságokat. Minden tulajdonság readOnly.
OnlineDeploymentProperties
Név | Leírás | Érték |
---|---|---|
appInsightsEnabled | Ha igaz, engedélyezi az Application Insights naplózását. | logikai |
codeConfiguration | Kódkonfiguráció a végpont üzembe helyezéséhez. | CodeConfiguration |
leírás | A végpont üzembe helyezésének leírása. | sztring |
egressPublicNetworkAccess | Ha engedélyezve van, engedélyezze a kimenő forgalom nyilvános hálózati hozzáférését. Ha le van tiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve. | "Letiltva" "Engedélyezve" |
environmentId | A végpont üzembe helyezésének környezeti specifikációjának ARM-erőforrás-azonosítója vagy AssetId azonosítója. | sztring |
environmentVariables | Környezeti változók konfigurálása az üzembe helyezéshez. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Számítási példány típusa. | sztring |
livenessProbe | Az élettartam-mintavétel rendszeresen figyeli a tároló állapotát. | ProbeSettings |
modell | A modell URI-elérési útja. | sztring |
modelMountPath | A modell egyéni tárolóban való csatlakoztatásának útvonala. | sztring |
properties | Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | A készenlét-mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élettartam-mintavétellel. | ProbeSettings |
requestSettings | Az üzemelő példány beállításainak kérése. | OnlineRequestSettings |
scaleSettings | Az üzembe helyezés méretezési beállításai. Ha null értékű, vagy nincs megadva, Alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings értéke és a DefaultScaleSettings for ManagedOnlineDeployment értékre. |
OnlineScaleSettings |
endpointComputeType | Az objektum típusának beállítása | Kubernetes Felügyelt (kötelező) |
CodeConfiguration
Név | Leírás | Érték |
---|---|---|
codeId | A kódobjektum ARM-erőforrás-azonosítója. | sztring |
scoringScript | [Kötelező] Az indításkor végrehajtandó szkript. például: "score.py" | sztring (kötelező) Korlátok: Minimális hossz = 1 Minta = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Név | Leírás | Érték |
---|---|---|
{customized property} | sztring | |
{customized property} | sztring |
ProbeSettings
Név | Leírás | Érték |
---|---|---|
failureThreshold | Azoknak a hibáknak a száma, amelyek engedélyezve lesznek, mielőtt nem kifogástalan állapotot ad vissza. | int |
initialDelay | Az ISO 8601 formátumú első mintavétel előtti késleltetés. | sztring |
period | Az ISO 8601 formátumú mintavételek közötti időtartam. | sztring |
successThreshold | A sikeres mintavételek száma, mielőtt kifogástalan állapotot ad vissza. | int |
timeout | A mintavétel időtúllépése ISO 8601 formátumban. | sztring |
EndpointDeploymentPropertiesBaseProperties
Név | Leírás | Érték |
---|---|---|
{customized property} | sztring | |
{customized property} | sztring |
OnlineRequestSettings
Név | Leírás | Érték |
---|---|---|
maxConcurrentRequestsPerInstance | Az üzemelő példányonként engedélyezett csomópontonkénti egyidejű kérelmek maximális száma. Alapértelmezés szerint 1. | int |
maxQueueWait | A kérések maximális időtartama ISO 8601 formátumban marad az üzenetsorban. Alapértelmezés szerint 500 ms. |
sztring |
requestTimeout | A pontozási időtúllépés ISO 8601 formátumban. Alapértelmezés szerint 5000 ms. |
sztring |
OnlineScaleSettings
Név | Leírás | Érték |
---|---|---|
scaleType | Az objektumtípus beállítása | Alapértelmezett TargetUtilization (kötelező) |
DefaultScaleSettings
Név | Leírás | Érték |
---|---|---|
scaleType | [Kötelező] Az üzembe helyezési skálázási algoritmus típusa | "Alapértelmezett" (kötelező) |
TargetUtilizationScaleSettings
Név | Leírás | Érték |
---|---|---|
scaleType | [Kötelező] Az üzembe helyezési skálázási algoritmus típusa | "TargetUtilization" (kötelező) |
maxInstances | A példányok maximális száma, amelyekre az üzembe helyezés méretezhető. A kvóta max_instances lesz fenntartva. | int |
minInstances | A mindig jelen lévő példányok minimális száma. | int |
pollingInterval | A lekérdezési időköz ISO 8691 formátumban. Csak az időtartamot támogatja olyan pontossággal, mint a Másodperc. | sztring |
targetUtilizationPercentage | Cél CPU-használat az automatikus skálázóhoz. | int |
KubernetesOnlineDeployment
Név | Leírás | Érték |
---|---|---|
endpointComputeType | [Kötelező] A végpont számítási típusa. | "Kubernetes" (kötelező) |
containerResourceRequirements | A tároló erőforráskövetelményei (processzor és memória). | ContainerResourceRequirements |
ContainerResourceRequirements
Név | Leírás | Érték |
---|---|---|
containerResourceLimits | Tárolóerőforrás-korlát adatai: | ContainerResourceSettings |
containerResourceRequests | Tárolóerőforrás-kérelem adatai: | ContainerResourceSettings |
ContainerResourceSettings
Név | Leírás | Érték |
---|---|---|
Cpu | A tárolóra vonatkozó vCPU-kérések száma/korlátja. További információ: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
sztring |
Gpu | Nvidia GPU-kártyák kérésének/korlátjának száma a tárolóhoz. További információ: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
sztring |
memória | Tároló memóriaméret-kérése/korlátja. További információ: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
sztring |
ManagedOnlineDeployment
Név | Leírás | Érték |
---|---|---|
endpointComputeType | [Kötelező] A végpont számítási típusa. | "Felügyelt" (kötelező) |
SKU
Név | Leírás | Érték |
---|---|---|
capacity | Ha a termékváltozat támogatja a vertikális felskálázást/in, akkor a kapacitás egész számának szerepelnie kell. Ha az erőforrás esetében nem lehetséges a vertikális felskálázás/beskálázás, akkor ez kihagyható. | int |
family | Ha a szolgáltatás különböző hardvergenerációkkal rendelkezik ugyanahhoz a termékváltozathoz, akkor az itt rögzíthető. | sztring |
name | A termékváltozat neve. Ex - P3. Ez általában egy betű+szám kód | sztring (kötelező) |
size | A termékváltozat mérete. Ha a névmező a szint és egy másik érték kombinációja, akkor ez a különálló kód. | sztring |
tier | Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges. | "Alapszintű" "Ingyenes" "Prémium" "Standard" |
ARM-sablon erőforrásdefiníciója
A munkaterületek/onlineEndpoints/deployments erőforrástípus üzembe helyezhető olyan műveletekkel, amelyek a következőket célják:
- Erőforráscsoportok – Lásd : erőforráscsoport üzembehelyezési parancsai
Az egyes API-verziók módosított tulajdonságainak listáját a változásnaplóban találja.
Erőforrás formátuma
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments erőforrás létrehozásához adja hozzá a következő JSON-t a sablonhoz.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2022-10-01",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string",
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"properties": {
"{customized property}": "string",
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
}
OnlineDeploymentProperties objektumok
Állítsa be az endpointComputeType tulajdonságot az objektum típusának megadásához.
Kubernetes esetén használja a következőt:
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
Felügyelt esetén használja a következőt:
"endpointComputeType": "Managed"
OnlineScaleSettings objektumok
Állítsa be a scaleType tulajdonságot az objektum típusának megadásához.
Alapértelmezés szerint használja a következőt:
"scaleType": "Default"
A TargetUtilization esetében használja a következőt:
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Tulajdonságértékek
munkaterületek/onlineEndpoints/deployments
Név | Leírás | Érték |
---|---|---|
típus | Az erőforrás típusa | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments" |
apiVersion | Az erőforrás API-verziója | '2022-10-01' |
name | Az erőforrás neve Megtudhatja, hogyan állíthatja be a gyermekerőforrások nevét és típusát A JSON ARM-sablonokban. |
sztring (kötelező) |
location | Az a földrajzi hely, ahol az erőforrás él | sztring (kötelező) |
tags | Erőforráscímkék. | Címkenevek és -értékek szótára. Címkék megtekintése sablonokban |
Sku | Az automatikus skálázási ARM-szerződéshez szükséges termékváltozat részletei. | Sku |
Fajta | A portál/eszközhasználat/stb. által használt metaadatok az azonos típusú erőforrások különböző felhasználói felületi élményének megjelenítéséhez. | sztring |
identity | Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások) | ManagedServiceIdentity |
properties | [Kötelező] Az entitás további attribútumai. | OnlineDeploymentProperties (kötelező) |
ManagedServiceIdentity
Név | Leírás | Érték |
---|---|---|
típus | A felügyeltszolgáltatás-identitás típusa (ahol a SystemAssigned és a UserAssigned típus egyaránt engedélyezett). | "Nincs" "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (kötelező) |
userAssignedIdentities | Az erőforráshoz társított felhasználó által hozzárendelt identitások halmaza. A userAssignedIdentities szótárkulcsok arm-erőforrás-azonosítók lesznek a következő űrlapon: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. A szótár értékei üres objektumok ({}) lehetnek a kérésekben. | UserAssignedIdentities |
UserAssignedIdentities
Név | Leírás | Érték |
---|---|---|
{testreszabott tulajdonság} | UserAssignedIdentity |
UserAssignedIdentity
Ez az objektum nem tartalmaz az üzembe helyezés során beállítandó tulajdonságokat. Minden tulajdonság a ReadOnly.
OnlineDeploymentProperties
Név | Leírás | Érték |
---|---|---|
appInsightsEnabled | Ha igaz, engedélyezi az Application Insights naplózását. | logikai |
codeConfiguration | Kódkonfiguráció a végpont üzembe helyezéséhez. | CodeConfiguration |
leírás | A végpont üzembe helyezésének leírása. | sztring |
egressPublicNetworkAccess | Ha engedélyezve van, engedélyezze a kimenő nyilvános hálózati hozzáférést. Ha letiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve. | "Letiltva" "Engedélyezve" |
environmentId | A végpont üzembe helyezésének környezeti specifikációjának ARM-erőforrás-azonosítója vagy AssetId azonosítója. | sztring |
environmentVariables | Környezeti változók konfigurálása az üzembe helyezéshez. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Számítási példány típusa. | sztring |
livenessProbe | Az élőképesség-mintavétel rendszeresen figyeli a tároló állapotát. | ProbeSettings |
modell | A modell URI-elérési útja. | sztring |
modelMountPath | A modell egyéni tárolóba való csatlakoztatásának útvonala. | sztring |
properties | Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | A készültségi mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élőképesség-mintavétellel. | ProbeSettings |
requestSettings | Az üzembe helyezés beállításainak kérése. | OnlineRequestSettings |
scaleSettings | Az üzembe helyezés skálázási beállításai. Ha null értékű, vagy nincs megadva, alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings értéke. és a DefaultScaleSettings for ManagedOnlineDeployment értékre. |
OnlineScaleSettings |
endpointComputeType | Az objektumtípus beállítása | Kubernetes Felügyelt (kötelező) |
CodeConfiguration
Név | Leírás | Érték |
---|---|---|
codeId | A kódeszköz ARM-erőforrás-azonosítója. | sztring |
scoringScript | [Kötelező] Az indításkor végrehajtandó szkript. például: "score.py" | sztring (kötelező) Korlátok: Minimális hossz = 1 Minta = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Név | Leírás | Érték |
---|---|---|
{testreszabott tulajdonság} | sztring | |
{testreszabott tulajdonság} | sztring |
ProbeSettings
Név | Leírás | Érték |
---|---|---|
failureThreshold | Azoknak a hibáknak a száma, amelyek engedélyezve lesznek, mielőtt nem kifogástalan állapotot ad vissza. | int |
initialDelay | Az ISO 8601 formátumú első mintavétel előtti késleltetés. | sztring |
period | Az ISO 8601 formátumú mintavételek közötti időtartam. | sztring |
successThreshold | A sikeres mintavételek száma, mielőtt kifogástalan állapotot ad vissza. | int |
timeout | A mintavétel időtúllépése ISO 8601 formátumban. | sztring |
EndpointDeploymentPropertiesBaseProperties
Név | Leírás | Érték |
---|---|---|
{testreszabott tulajdonság} | sztring | |
{testreszabott tulajdonság} | sztring |
OnlineRequestSettings
Név | Leírás | Érték |
---|---|---|
maxConcurrentRequestsPerInstance | Az üzemelő példányonként engedélyezett csomópontonkénti egyidejű kérelmek maximális száma. Alapértelmezés szerint 1. | int |
maxQueueWait | A kérések maximális időtartama ISO 8601 formátumban marad az üzenetsorban. Alapértelmezés szerint 500 ms. |
sztring |
requestTimeout | A pontozási időtúllépés ISO 8601 formátumban. Alapértelmezés szerint 5000 ms. |
sztring |
OnlineScaleSettings
Név | Leírás | Érték |
---|---|---|
scaleType | Az objektumtípus beállítása | Alapértelmezett TargetUtilization (kötelező) |
DefaultScaleSettings
Név | Leírás | Érték |
---|---|---|
scaleType | [Kötelező] Az üzembe helyezési skálázási algoritmus típusa | "Alapértelmezett" (kötelező) |
TargetUtilizationScaleSettings
Név | Leírás | Érték |
---|---|---|
scaleType | [Kötelező] Az üzembe helyezési skálázási algoritmus típusa | "TargetUtilization" (kötelező) |
maxInstances | A példányok maximális száma, amelyekre az üzembe helyezés méretezhető. A kvóta max_instances lesz fenntartva. | int |
minInstances | A mindig jelen lévő példányok minimális száma. | int |
pollingInterval | A lekérdezési időköz ISO 8691 formátumban. Csak az időtartamot támogatja olyan pontossággal, mint a Másodperc. | sztring |
targetUtilizationPercentage | Cél CPU-használat az automatikus skálázóhoz. | int |
KubernetesOnlineDeployment
Név | Leírás | Érték |
---|---|---|
endpointComputeType | [Kötelező] A végpont számítási típusa. | "Kubernetes" (kötelező) |
containerResourceRequirements | A tároló erőforráskövetelményei (processzor és memória). | ContainerResourceRequirements |
ContainerResourceRequirements
Név | Leírás | Érték |
---|---|---|
containerResourceLimits | Tárolóerőforrás-korlát adatai: | ContainerResourceSettings |
containerResourceRequests | Tárolóerőforrás-kérelem adatai: | ContainerResourceSettings |
ContainerResourceSettings
Név | Leírás | Érték |
---|---|---|
Cpu | A tárolóra vonatkozó vCPU-kérések száma/korlátja. További információ: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
sztring |
Gpu | Nvidia GPU-kártyák kérésének/korlátjának száma a tárolóhoz. További információ: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
sztring |
memória | Tároló memóriaméret-kérése/korlátja. További információ: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
sztring |
ManagedOnlineDeployment
Név | Leírás | Érték |
---|---|---|
endpointComputeType | [Kötelező] A végpont számítási típusa. | "Felügyelt" (kötelező) |
SKU
Név | Leírás | Érték |
---|---|---|
capacity | Ha a termékváltozat támogatja a vertikális felskálázást/in, akkor a kapacitás egész számának szerepelnie kell. Ha az erőforrás esetében nem lehetséges a vertikális felskálázás/beskálázás, akkor ez kihagyható. | int |
family | Ha a szolgáltatás különböző hardvergenerációkkal rendelkezik ugyanahhoz a termékváltozathoz, akkor az itt rögzíthető. | sztring |
name | A termékváltozat neve. Ex - P3. Ez általában egy betű+szám kód | sztring (kötelező) |
size | A termékváltozat mérete. Ha a névmező a szint és egy másik érték kombinációja, akkor ez a különálló kód. | sztring |
tier | Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges. | "Alapszintű" "Ingyenes" "Prémium" "Standard" |
Terraform (AzAPI-szolgáltató) erőforrásdefiníció
A munkaterületek/onlineEndpoints/deployments erőforrástípus üzembe helyezhető olyan műveletekkel, amelyek a következőket célják:
- Erőforráscsoportok
Az egyes API-verziók módosított tulajdonságainak listáját a változásnaplóban találja.
Erőforrás formátuma
Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments erőforrás létrehozásához adja hozzá a következő Terraformot a sablonhoz.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
properties = {
{customized property} = "string"
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentProperties objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
OnlineDeploymentProperties objektumok
Állítsa be az endpointComputeType tulajdonságot az objektum típusának megadásához.
Kubernetes esetén használja a következőt:
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
Felügyelt esetén használja a következőt:
endpointComputeType = "Managed"
OnlineScaleSettings objektumok
Állítsa be a scaleType tulajdonságot az objektum típusának megadásához.
Alapértelmezés szerint használja a következőt:
scaleType = "Default"
A TargetUtilization esetében használja a következőt:
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Tulajdonságértékek
munkaterületek/onlineEndpoints/deployments
Név | Leírás | Érték |
---|---|---|
típus | Az erőforrás típusa | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-10-01" |
name | Az erőforrás neve | sztring (kötelező) |
location | Az a földrajzi hely, ahol az erőforrás él | sztring (kötelező) |
parent_id | Az erőforrás szülőjének azonosítója. | Típusú erőforrás azonosítója: onlineEndpoints |
tags | Erőforráscímkék. | Címkenevek és -értékek szótára. |
Sku | Az automatikus skálázási ARM-szerződéshez szükséges termékváltozat részletei. | Sku |
Fajta | A portál/eszközhasználat/stb. által használt metaadatok az azonos típusú erőforrások különböző felhasználói felületi élményének megjelenítéséhez. | sztring |
identity | Felügyeltszolgáltatás-identitás (rendszer által hozzárendelt és/vagy felhasználó által hozzárendelt identitások) | ManagedServiceIdentity |
properties | [Kötelező] Az entitás további attribútumai. | OnlineDeploymentProperties (kötelező) |
ManagedServiceIdentity
Név | Leírás | Érték |
---|---|---|
típus | A felügyeltszolgáltatás-identitás típusa (ahol a SystemAssigned és a UserAssigned típus egyaránt engedélyezett). | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" (kötelező) |
identity_ids | Az erőforráshoz társított felhasználó által hozzárendelt identitások halmaza. A userAssignedIdentities szótárkulcsok arm-erőforrás-azonosítók lesznek a következő űrlapon: "/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. A szótár értékei üres objektumok ({}) lehetnek a kérésekben. | Felhasználói identitásazonosítók tömbje. |
UserAssignedIdentities
Név | Leírás | Érték |
---|---|---|
{testreszabott tulajdonság} | UserAssignedIdentity |
UserAssignedIdentity
Ez az objektum nem tartalmaz az üzembe helyezés során beállítandó tulajdonságokat. Minden tulajdonság a ReadOnly.
OnlineDeploymentProperties
Név | Leírás | Érték |
---|---|---|
appInsightsEnabled | Ha igaz, engedélyezi az Application Insights naplózását. | logikai |
codeConfiguration | Kódkonfiguráció a végpont üzembe helyezéséhez. | CodeConfiguration |
leírás | A végpont üzembe helyezésének leírása. | sztring |
egressPublicNetworkAccess | Ha engedélyezve van, engedélyezze a kimenő nyilvános hálózati hozzáférést. Ha letiltva, ez biztonságos kimenő forgalmat hoz létre. Alapértelmezett: Engedélyezve. | "Letiltva" "Engedélyezve" |
environmentId | A végpont üzembe helyezésének környezeti specifikációjának ARM-erőforrás-azonosítója vagy AssetId azonosítója. | sztring |
environmentVariables | Környezeti változók konfigurálása az üzembe helyezéshez. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Számítási példány típusa. | sztring |
livenessProbe | Az élőképesség-mintavétel rendszeresen figyeli a tároló állapotát. | ProbeSettings |
modell | A modell URI-elérési útja. | sztring |
modelMountPath | A modell egyéni tárolóba való csatlakoztatásának útvonala. | sztring |
properties | Tulajdonságszótár. A tulajdonságok hozzáadhatók, de nem távolíthatók el és nem módosíthatók. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | A készültségi mintavétel ellenőrzi, hogy a tároló készen áll-e a forgalom kiszolgálására. A tulajdonságok és az alapértelmezett értékek megegyeznek az élőképesség-mintavétellel. | ProbeSettings |
requestSettings | Az üzembe helyezés beállításainak kérése. | OnlineRequestSettings |
scaleSettings | Az üzembe helyezés skálázási beállításai. Ha null értékű, vagy nincs megadva, alapértelmezés szerint a KubernetesOnlineDeployment TargetUtilizationScaleSettings értéke. és a DefaultScaleSettings for ManagedOnlineDeployment értékre. |
OnlineScaleSettings |
endpointComputeType | Az objektumtípus beállítása | Kubernetes Felügyelt (kötelező) |
CodeConfiguration
Név | Leírás | Érték |
---|---|---|
codeId | A kódeszköz ARM-erőforrás-azonosítója. | sztring |
scoringScript | [Kötelező] Az indításkor végrehajtandó szkript. például: "score.py" | sztring (kötelező) Korlátok: Minimális hossz = 1 Minta = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Név | Leírás | Érték |
---|---|---|
{testreszabott tulajdonság} | sztring | |
{testreszabott tulajdonság} | sztring |
ProbeSettings
Név | Leírás | Érték |
---|---|---|
failureThreshold | Azoknak a hibáknak a száma, amelyek engedélyezve lesznek, mielőtt nem kifogástalan állapotot ad vissza. | int |
initialDelay | Az ISO 8601 formátumú első mintavétel előtti késleltetés. | sztring |
period | Az ISO 8601 formátumú mintavételek közötti időtartam. | sztring |
successThreshold | A sikeres mintavételek száma, mielőtt kifogástalan állapotot ad vissza. | int |
timeout | A mintavétel időtúllépése ISO 8601 formátumban. | sztring |
EndpointDeploymentPropertiesBaseProperties
Név | Leírás | Érték |
---|---|---|
{testreszabott tulajdonság} | sztring | |
{testreszabott tulajdonság} | sztring |
OnlineRequestSettings
Név | Leírás | Érték |
---|---|---|
maxConcurrentRequestsPerInstance | Az üzemelő példányonként engedélyezett csomópontonkénti egyidejű kérelmek maximális száma. Alapértelmezés szerint 1. | int |
maxQueueWait | A kérések maximális időtartama ISO 8601 formátumban marad az üzenetsorban. Alapértelmezés szerint 500 ms. |
sztring |
requestTimeout | A pontozási időtúllépés ISO 8601 formátumban. Alapértelmezés szerint 5000 ms. |
sztring |
OnlineScaleSettings
Név | Leírás | Érték |
---|---|---|
scaleType | Az objektum típusának beállítása | Alapértelmezett TargetUtilization (kötelező) |
DefaultScaleSettings
Név | Leírás | Érték |
---|---|---|
scaleType | [Kötelező] Az üzembe helyezési skálázási algoritmus típusa | "Alapértelmezett" (kötelező) |
TargetUtilizationScaleSettings
Név | Leírás | Érték |
---|---|---|
scaleType | [Kötelező] Az üzembe helyezési skálázási algoritmus típusa | "TargetUtilization" (kötelező) |
maxInstances | A példányok maximális száma, amelyekre az üzembe helyezés méretezhető. A kvóta max_instances lesz fenntartva. | int |
minInstances | A mindig jelen lévő példányok minimális száma. | int |
pollingInterval | A lekérdezési időköz ISO 8691 formátumban. Csak a másodperc pontosságú időtartamot támogatja. | sztring |
targetUtilizationPercentage | Az automatikus skálázási eszköz cél cpu-használata. | int |
KubernetesOnlineDeployment
Név | Leírás | Érték |
---|---|---|
endpointComputeType | [Kötelező] A végpont számítási típusa. | "Kubernetes" (kötelező) |
containerResourceRequirements | A tároló erőforrás-követelményei (processzor és memória). | ContainerResourceRequirements |
ContainerResourceRequirements
Név | Leírás | Érték |
---|---|---|
containerResourceLimits | Tárolóerőforrás-korlát adatai: | ContainerResourceSettings |
containerResourceRequests | Tárolóerőforrás-kérelem adatai: | ContainerResourceSettings |
ContainerResourceSettings
Név | Leírás | Érték |
---|---|---|
Cpu | A tárolóhoz tartozó vCPU-kérések száma/korlátja. További információ: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
sztring |
Gpu | Nvidia GPU-kártyák kérésének/korlátjának száma a tárolóhoz. További információ: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
sztring |
memória | Tároló memóriaméret-kérése/korlátja. További információ: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
sztring |
ManagedOnlineDeployment
Név | Leírás | Érték |
---|---|---|
endpointComputeType | [Kötelező] A végpont számítási típusa. | "Felügyelt" (kötelező) |
SKU
Név | Leírás | Érték |
---|---|---|
capacity | Ha a termékváltozat támogatja a fel- és leskálázást, akkor a kapacitás egészét is tartalmaznia kell. Ha az erőforráshoz nem lehet vertikális felskálázást/beskálázást végezni, ez kihagyható. | int |
family | Ha a szolgáltatás eltérő hardvergenerációval rendelkezik ugyanahhoz a termékváltozathoz, akkor az itt rögzíthető. | sztring |
name | A termékváltozat neve. Ex - P3. Ez általában egy betű+szám kód | sztring (kötelező) |
size | A termékváltozat mérete. Ha a névmező a réteg és más értékek kombinációja, ez a különálló kód. | sztring |
tier | Ezt a mezőt az erőforrás-szolgáltatónak kell implementálnia, ha a szolgáltatás egynél több szinttel rendelkezik, de put esetén nem szükséges. | "Alapszintű" "Ingyenes" "Prémium" "Standard" |
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: