Microsoft.MachineLearningServices-werkruimten/onlineEndpoints/deployments 2021-03-01-preview
Bicep-resourcedefinitie
Het resourcetype werkruimten/onlineEindpunten/implementaties kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- Resourcegroepen - Zie opdrachten voor resourcegroepimplementatie
Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende Bicep toe aan uw sjabloon.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {
clientId: 'string'
principalId: 'string'
}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: {
referenceType: 'string'
// For remaining properties, see AssetReferenceBase objects
}
properties: {
{customized property}: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
maxInstances: int
minInstances: int
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeployment objects
}
}
OnlineDeployment-objecten
Stel de eigenschap endpointComputeType in om het type object op te geven.
Gebruik voor K8S:
endpointComputeType: 'K8S'
containerResourceRequirements: {
cpu: int
cpuLimit: int
fpga: int
gpu: int
memoryInGB: int
memoryInGBLimit: int
}
Gebruik voor Beheerd:
endpointComputeType: 'Managed'
instanceType: 'string'
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
AssetReferenceBase-objecten
Stel de eigenschap referenceType in om het type object op te geven.
Gebruik voor DataPath:
referenceType: 'DataPath'
datastoreId: 'string'
path: 'string'
Gebruik voor Id:
referenceType: 'Id'
assetId: 'string'
Gebruik voor OutputPath:
referenceType: 'OutputPath'
jobId: 'string'
path: 'string'
OnlineScaleSettings-objecten
Stel de eigenschap scaleType in om het type object op te geven.
Gebruik voor Automatisch:
scaleType: 'Auto'
pollingInterval: 'string'
targetUtilizationPercentage: int
Gebruik voor Handmatig:
scaleType: 'Manual'
instanceCount: int
Eigenschapswaarden
werkruimten/onlineEindpunten/implementaties
Naam | Description | Waarde |
---|---|---|
naam | De resourcenaam Meer informatie over het instellen van namen en typen voor onderliggende resources in Bicep. |
tekenreeks (vereist) |
location | De geografische locatie waar de resource zich bevindt | tekenreeks (vereist) |
tags | Resourcetags. | Woordenlijst met tagnamen en -waarden. Tags in sjablonen bekijken |
Soort | Metagegevens die worden gebruikt door portal/tooling/etc om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. | tekenreeks |
Bovenliggende | In Bicep kunt u de bovenliggende resource voor een onderliggende resource opgeven. U hoeft deze eigenschap alleen toe te voegen wanneer de onderliggende resource buiten de bovenliggende resource wordt gedeclareerd. Zie Onderliggende resource buiten bovenliggende resource voor meer informatie. |
Symbolische naam voor resource van het type: onlineEndpoints |
identity | Service-id die is gekoppeld aan een resource. | ResourceIdentity |
properties | [Vereist] Aanvullende kenmerken van de entiteit. | OnlineDeployment (vereist) |
ResourceIdentity
Naam | Description | Waarde |
---|---|---|
type | Definieert waarden voor het type ResourceIdentity. | 'Geen' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | Woordenlijst van de door de gebruiker toegewezen identiteiten, sleutel is ARM-resource-id van de UAI. | ResourceIdentityUserAssignedId-entiteiten |
ResourceIdentityUserAssignedId-entiteiten
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Naam | Description | Waarde |
---|---|---|
clientId | Ook wel toepassings-id genoemd, een unieke id die wordt gegenereerd door Azure AD die tijdens de eerste inrichting is gekoppeld aan een toepassing en service-principal. | tekenreeks |
principalId | De object-id van het service-principalobject voor uw beheerde identiteit die wordt gebruikt om op rollen gebaseerde toegang te verlenen tot een Azure-resource. | tekenreeks |
OnlineDeployment
Naam | Description | Waarde |
---|---|---|
appInsightsEnabled | Als dit waar is, schakelt u Application Insights-logboekregistratie in. | booleaans |
codeConfiguration | Codeconfiguratie voor de eindpuntimplementatie. | CodeConfiguration |
beschrijving | Beschrijving van de eindpuntimplementatie. | tekenreeks |
environmentId | ARM-resource-id van de omgevingsspecificatie voor de eindpuntimplementatie. | tekenreeks |
environmentVariables | Configuratie van omgevingsvariabelen voor de implementatie. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configuratie van implementatiecontainer-/gereedheidstest. | ProbeSettings |
model | Verwijzing naar de modelasset voor de eindpuntimplementatie. | AssetReferenceBase |
properties | Eigenschappenwoordenlijst. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. | OnlineDeploymentEigenschappen |
requestSettings | Configuratie van scoreaanvragen voor online-implementatie. | OnlineRequestSettings |
scaleSettings | Configuratie van online-implementatieschaal. | OnlineScaleSettings |
endpointComputeType | Het objecttype instellen | K8S Beheerd (vereist) |
CodeConfiguration
Naam | Description | Waarde |
---|---|---|
codeId | ARM-resource-id van de code-asset. | tekenreeks |
scoringScript | [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" | tekenreeks (vereist) Beperkingen: Minimale lengte = 1 Patroon = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks |
ProbeSettings
Naam | Description | Waarde |
---|---|---|
failureThreshold | Het aantal fouten dat moet worden toegestaan voordat de status Niet in orde wordt geretourneerd. | int |
initialDelay | De vertraging voor de eerste test in ISO 8601-indeling. | tekenreeks |
period | De tijdsduur tussen tests in ISO 8601-indeling. | tekenreeks |
successThreshold | Het aantal geslaagde tests voordat de status In orde wordt geretourneerd. | int |
timeout | De testtime-out in ISO 8601-indeling. | tekenreeks |
AssetReferenceBase
Naam | Description | Waarde |
---|---|---|
referenceType | Het objecttype instellen | DataPath Id OutputPath (vereist) |
DataPathAssetReference
Naam | Description | Waarde |
---|---|---|
referenceType | [Vereist] Hiermee geeft u het type assetreferentie op. | 'DataPath' (vereist) |
datastoreId | ARM-resource-id van het gegevensarchief waarin de asset zich bevindt. | tekenreeks |
leertraject | Het pad van het bestand/de map in het gegevensarchief. | tekenreeks |
IdAssetReference
Naam | Description | Waarde |
---|---|---|
referenceType | [Vereist] Hiermee geeft u het type assetreferentie op. | 'Id' (vereist) |
assetId | [Vereist] ARM-resource-id van de asset. | tekenreeks (vereist) Beperkingen: Patroon = [a-zA-Z0-9_] |
OutputPathAssetReference
Naam | Description | Waarde |
---|---|---|
referenceType | [Vereist] Hiermee geeft u het type assetreferentie op. | 'OutputPath' (vereist) |
jobId | ARM-resource-id van de taak. | tekenreeks |
leertraject | Het pad van het bestand/de map in de taakuitvoer. | tekenreeks |
OnlineDeploymentEigenschappen
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks |
OnlineRequestSettings
Naam | Description | Waarde |
---|---|---|
maxConcurrentRequestsPerInstance | Het aantal aanvragen dat in één keer in de wachtrij mag worden geplaatst voor deze implementatie. | int |
maxQueueWait | De maximale wachttijd voor wachtrijen in ISO 8601-indeling. Ondersteunt milliseconde precisie. | tekenreeks |
requestTimeout | De time-out van de aanvraag in ISO 8601-indeling. Ondersteunt milliseconde precisie. | tekenreeks |
OnlineScaleSettings
Naam | Description | Waarde |
---|---|---|
maxInstances | Maximum aantal exemplaren voor deze implementatie. | int |
minInstances | Minimum aantal exemplaren voor deze implementatie. | int |
scaleType | Het objecttype instellen | Automatisch Handmatig (vereist) |
AutoScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Auto' (vereist) |
pollingInterval | Het polling-interval in ISO 8691-indeling. Alleen ondersteuning voor duur met een nauwkeurigheid van slechts seconden. | tekenreeks |
targetUtilizationPercentage | Doel-CPU-gebruik voor de automatische schaalaanpassing. | int |
ManualScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Handmatig' (vereist) |
instanceCount | Vast aantal exemplaren voor deze implementatie. | int |
K8SOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'K8S' (vereist) |
containerResourceRequirements | Resourcevereisten voor elk containerexemplementatie binnen een online-implementatie. | ContainerResourceRequirements |
ContainerResourceRequirements
Naam | Description | Waarde |
---|---|---|
Cpu | De minimale hoeveelheid CPU-kernen die door de container moeten worden gebruikt. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Cpulimit | De maximale hoeveelheid CPU-kernen die door de container mogen worden gebruikt. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Fpga | Het aantal FPGA PCIE-apparaten dat aan de container wordt blootgesteld. Moet een veelvoud van 2 zijn. | int |
Gpu | Het aantal GPU-kernen in de container. | int |
memoryInGB | De minimale hoeveelheid geheugen (in GB) die door de container moet worden gebruikt. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | De maximale hoeveelheid geheugen (in GB) die door de container mag worden gebruikt. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Beheerd' (vereist) |
instanceType | Type rekenproces. | tekenreeks |
readinessProbe | Configuratie van implementatiecontainer-/gereedheidstest. | ProbeSettings |
Resourcedefinitie van ARM-sjabloon
Het resourcetype werkruimten/onlineEindpunten/implementaties kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- Resourcegroepen - Zie opdrachten voor resourcegroepimplementatie
Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende JSON toe aan uw sjabloon.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2021-03-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
"clientId": "string",
"principalId": "string"
}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": {
"referenceType": "string"
// For remaining properties, see AssetReferenceBase objects
},
"properties": {
"{customized property}": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"maxInstances": "int",
"minInstances": "int",
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeployment objects
}
}
OnlineDeployment-objecten
Stel de eigenschap endpointComputeType in om het type object op te geven.
Gebruik voor K8S:
"endpointComputeType": "K8S",
"containerResourceRequirements": {
"cpu": "int",
"cpuLimit": "int",
"fpga": "int",
"gpu": "int",
"memoryInGB": "int",
"memoryInGBLimit": "int"
}
Gebruik voor Beheerd:
"endpointComputeType": "Managed",
"instanceType": "string",
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
AssetReferenceBase-objecten
Stel de eigenschap referenceType in om het type object op te geven.
Gebruik voor DataPath:
"referenceType": "DataPath",
"datastoreId": "string",
"path": "string"
Gebruik voor Id:
"referenceType": "Id",
"assetId": "string"
Gebruik voor OutputPath:
"referenceType": "OutputPath",
"jobId": "string",
"path": "string"
OnlineScaleSettings-objecten
Stel de eigenschap scaleType in om het type object op te geven.
Voor Automatisch gebruikt u:
"scaleType": "Auto",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Voor Handmatig gebruikt u:
"scaleType": "Manual",
"instanceCount": "int"
Eigenschapswaarden
werkruimten/onlineEindpunten/implementaties
Naam | Description | Waarde |
---|---|---|
type | Het resourcetype | 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments' |
apiVersion | De resource-API-versie | '2021-03-01-preview' |
naam | De resourcenaam Meer informatie over het instellen van namen en typen voor onderliggende resources in JSON ARM-sjablonen. |
tekenreeks (vereist) |
location | De geografische locatie waar de resource zich bevindt | tekenreeks (vereist) |
tags | Resourcetags. | Woordenlijst met tagnamen en -waarden. Tags in sjablonen bekijken |
Soort | Metagegevens die worden gebruikt door portal/hulpprogramma's/enzovoort om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. | tekenreeks |
identity | Service-id die is gekoppeld aan een resource. | ResourceIdentity |
properties | [Vereist] Aanvullende kenmerken van de entiteit. | OnlineDeployment (vereist) |
ResourceIdentity
Naam | Description | Waarde |
---|---|---|
type | Hiermee definieert u waarden voor het type ResourceIdentity. | 'Geen' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | Woordenlijst van de door de gebruiker toegewezen identiteiten, sleutel is ARM-resource-id van de UAI. | Entiteiten ResourceIdentityUserAssignedId |
Entiteiten ResourceIdentityUserAssignedId
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Naam | Description | Waarde |
---|---|---|
clientId | Ook wel toepassings-id genoemd, een unieke id die wordt gegenereerd door Azure AD die tijdens de eerste inrichting is gekoppeld aan een toepassing en service-principal. | tekenreeks |
principalId | De object-id van het service-principalobject voor uw beheerde identiteit die wordt gebruikt om op rollen gebaseerde toegang te verlenen tot een Azure-resource. | tekenreeks |
OnlineDeployment
Naam | Description | Waarde |
---|---|---|
appInsightsEnabled | Als dit waar is, schakelt u Application Insights-logboekregistratie in. | booleaans |
codeConfiguration | Codeconfiguratie voor de eindpuntimplementatie. | CodeConfiguration |
beschrijving | Beschrijving van de eindpuntimplementatie. | tekenreeks |
environmentId | ARM-resource-id van de omgevingsspecificatie voor de eindpuntimplementatie. | tekenreeks |
environmentVariables | Configuratie van omgevingsvariabelen voor de implementatie. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configuratie van implementatiecontainer liveness/gereedheidstest. | ProbeSettings |
model | Verwijzing naar de modelasset voor de eindpuntimplementatie. | AssetReferenceBase |
properties | Woordenlijst met eigenschappen. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. | OnlineDeploymentEigenschappen |
requestSettings | Configuratie van scoreaanvragen voor online-implementatie. | OnlineRequestSettings |
scaleSettings | Configuratie voor het schalen van online-implementaties. | OnlineScaleSettings |
endpointComputeType | Het objecttype instellen | K8S Beheerd (vereist) |
CodeConfiguration
Naam | Description | Waarde |
---|---|---|
codeId | ARM-resource-id van de code-asset. | tekenreeks |
scoringScript | [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" | tekenreeks (vereist) Beperkingen: Minimale lengte = 1 Patroon = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks |
ProbeSettings
Naam | Description | Waarde |
---|---|---|
failureThreshold | Het aantal fouten dat moet worden toegestaan voordat een beschadigde status wordt geretourneerd. | int |
initialDelay | De vertraging voor de eerste test in ISO 8601-indeling. | tekenreeks |
period | De tijdsduur tussen tests in ISO 8601-indeling. | tekenreeks |
successThreshold | Het aantal geslaagde tests voordat een status in orde wordt geretourneerd. | int |
timeout | De testtime-out in ISO 8601-indeling. | tekenreeks |
AssetReferenceBase
Naam | Description | Waarde |
---|---|---|
referenceType | Het objecttype instellen | DataPath Id OutputPath (vereist) |
DataPathAssetReference
Naam | Description | Waarde |
---|---|---|
referenceType | [Vereist] Hiermee geeft u het type assetreferentie op. | 'DataPath' (vereist) |
datastoreId | ARM-resource-id van het gegevensarchief waarin de asset zich bevindt. | tekenreeks |
leertraject | Het pad van het bestand/de map in het gegevensarchief. | tekenreeks |
IdAssetReference
Naam | Description | Waarde |
---|---|---|
referenceType | [Vereist] Hiermee geeft u het type assetreferentie op. | 'Id' (vereist) |
assetId | [Vereist] ARM-resource-id van de asset. | tekenreeks (vereist) Beperkingen: Patroon = [a-zA-Z0-9_] |
OutputPathAssetReference
Naam | Description | Waarde |
---|---|---|
referenceType | [Vereist] Hiermee geeft u het type assetreferentie op. | 'OutputPath' (vereist) |
jobId | ARM-resource-id van de taak. | tekenreeks |
leertraject | Het pad van het bestand/de map in de taakuitvoer. | tekenreeks |
OnlineDeploymentEigenschappen
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks |
OnlineRequestSettings
Naam | Description | Waarde |
---|---|---|
maxConcurrentRequestsPerInstance | Het aantal aanvragen dat in één keer in de wachtrij mag worden geplaatst voor deze implementatie. | int |
maxQueueWait | De maximale wachttijd voor wachtrijen in ISO 8601-indeling. Ondersteunt milliseconde precisie. | tekenreeks |
requestTimeout | De time-out van de aanvraag in ISO 8601-indeling. Ondersteunt milliseconde precisie. | tekenreeks |
OnlineScaleSettings
Naam | Description | Waarde |
---|---|---|
maxInstances | Maximum aantal exemplaren voor deze implementatie. | int |
minInstances | Minimum aantal exemplaren voor deze implementatie. | int |
scaleType | Het objecttype instellen | Automatisch Handmatig (vereist) |
AutoScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Auto' (vereist) |
pollingInterval | Het polling-interval in ISO 8691-indeling. Alleen ondersteuning voor duur met een nauwkeurigheid van slechts seconden. | tekenreeks |
targetUtilizationPercentage | Doel-CPU-gebruik voor de automatische schaalaanpassing. | int |
ManualScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Handmatig' (vereist) |
instanceCount | Vast aantal exemplaren voor deze implementatie. | int |
K8SOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'K8S' (vereist) |
containerResourceRequirements | Resourcevereisten voor elk containerexemplementatie binnen een online-implementatie. | ContainerResourceRequirements |
ContainerResourceRequirements
Naam | Description | Waarde |
---|---|---|
Cpu | De minimale hoeveelheid CPU-kernen die door de container moeten worden gebruikt. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Cpulimit | De maximale hoeveelheid CPU-kernen die door de container mogen worden gebruikt. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Fpga | Het aantal FPGA PCIE-apparaten dat aan de container wordt blootgesteld. Moet een veelvoud van 2 zijn. | int |
Gpu | Het aantal GPU-kernen in de container. | int |
memoryInGB | De minimale hoeveelheid geheugen (in GB) die door de container moet worden gebruikt. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | De maximale hoeveelheid geheugen (in GB) die door de container mag worden gebruikt. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Beheerd' (vereist) |
instanceType | Type rekenproces. | tekenreeks |
readinessProbe | Configuratie van implementatiecontainer-/gereedheidstest. | ProbeSettings |
Resourcedefinitie van Terraform (AzAPI-provider)
Het resourcetype werkruimten/onlineEindpunten/implementaties kan worden geïmplementeerd met bewerkingen die zijn gericht op:
- Resourcegroepen
Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.
Resource-indeling
Als u een resource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments wilt maken, voegt u de volgende Terraform toe aan uw sjabloon.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = {
referenceType = "string"
// For remaining properties, see AssetReferenceBase objects
}
properties = {
{customized property} = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
maxInstances = int
minInstances = int
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeployment objects
}
kind = "string"
})
}
OnlineDeployment-objecten
Stel de eigenschap endpointComputeType in om het type object op te geven.
Gebruik voor K8S:
endpointComputeType = "K8S"
containerResourceRequirements = {
cpu = int
cpuLimit = int
fpga = int
gpu = int
memoryInGB = int
memoryInGBLimit = int
}
Gebruik voor Beheerd:
endpointComputeType = "Managed"
instanceType = "string"
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
AssetReferenceBase-objecten
Stel de eigenschap referenceType in om het type object op te geven.
Gebruik voor DataPath:
referenceType = "DataPath"
datastoreId = "string"
path = "string"
Gebruik voor Id:
referenceType = "Id"
assetId = "string"
Gebruik voor OutputPath:
referenceType = "OutputPath"
jobId = "string"
path = "string"
OnlineScaleSettings-objecten
Stel de eigenschap scaleType in om het type object op te geven.
Voor Automatisch gebruikt u:
scaleType = "Auto"
pollingInterval = "string"
targetUtilizationPercentage = int
Voor Handmatig gebruikt u:
scaleType = "Manual"
instanceCount = int
Eigenschapswaarden
werkruimten/onlineEindpunten/implementaties
Naam | Description | Waarde |
---|---|---|
type | Het resourcetype | "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview" |
naam | De resourcenaam | tekenreeks (vereist) |
location | De geografische locatie waar de resource zich bevindt | tekenreeks (vereist) |
parent_id | De id van de resource die het bovenliggende item voor deze resource is. | Id voor resource van het type: onlineEndpoints |
tags | Resourcetags. | Woordenlijst met tagnamen en -waarden. |
Soort | Metagegevens die worden gebruikt door portal/hulpprogramma's/enzovoort om verschillende UX-ervaringen weer te geven voor resources van hetzelfde type. | tekenreeks |
identity | Service-id die is gekoppeld aan een resource. | ResourceIdentity |
properties | [Vereist] Aanvullende kenmerken van de entiteit. | OnlineDeployment (vereist) |
ResourceIdentity
Naam | Description | Waarde |
---|---|---|
type | Hiermee definieert u waarden voor het type ResourceIdentity. | "SystemAssigned" "SystemAssigned,UserAssigned" "UserAssigned" |
identity_ids | Woordenlijst van de door de gebruiker toegewezen identiteiten, sleutel is ARM-resource-id van de UAI. | Matrix met gebruikersidentiteits-id's. |
Entiteiten ResourceIdentityUserAssignedId
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Naam | Description | Waarde |
---|---|---|
clientId | Ook wel toepassings-id genoemd, een unieke id die wordt gegenereerd door Azure AD die tijdens de eerste inrichting is gekoppeld aan een toepassing en service-principal. | tekenreeks |
principalId | De object-id van het service-principal-object voor uw beheerde identiteit die wordt gebruikt om op rollen gebaseerde toegang te verlenen tot een Azure-resource. | tekenreeks |
OnlineDeployment
Naam | Description | Waarde |
---|---|---|
appInsightsEnabled | Als dit waar is, schakelt u Application Insights-logboekregistratie in. | booleaans |
codeConfiguration | Codeconfiguratie voor de eindpuntimplementatie. | CodeConfiguration |
beschrijving | Beschrijving van de eindpuntimplementatie. | tekenreeks |
environmentId | ARM-resource-id van de omgevingsspecificatie voor de eindpuntimplementatie. | tekenreeks |
environmentVariables | Configuratie van omgevingsvariabelen voor de implementatie. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configuratie van implementatiecontainer-/gereedheidstest. | ProbeSettings |
model | Verwijzing naar de modelasset voor de eindpuntimplementatie. | AssetReferenceBase |
properties | Eigenschappenwoordenlijst. Eigenschappen kunnen worden toegevoegd, maar niet worden verwijderd of gewijzigd. | OnlineDeploymentEigenschappen |
requestSettings | Configuratie van scoreaanvragen voor online-implementatie. | OnlineRequestSettings |
scaleSettings | Configuratie van online-implementatieschaal. | OnlineScaleSettings |
endpointComputeType | Het objecttype instellen | K8S Beheerd (vereist) |
CodeConfiguration
Naam | Description | Waarde |
---|---|---|
codeId | ARM-resource-id van de code-asset. | tekenreeks |
scoringScript | [Vereist] Het script dat moet worden uitgevoerd bij het opstarten. bijvoorbeeld "score.py" | tekenreeks (vereist) Beperkingen: Minimale lengte = 1 Patroon = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks |
ProbeSettings
Naam | Description | Waarde |
---|---|---|
failureThreshold | Het aantal fouten dat moet worden toegestaan voordat de status Niet in orde wordt geretourneerd. | int |
initialDelay | De vertraging voor de eerste test in ISO 8601-indeling. | tekenreeks |
period | De tijdsduur tussen tests in ISO 8601-indeling. | tekenreeks |
successThreshold | Het aantal geslaagde tests voordat de status In orde wordt geretourneerd. | int |
timeout | De testtime-out in ISO 8601-indeling. | tekenreeks |
AssetReferenceBase
Naam | Description | Waarde |
---|---|---|
referenceType | Het objecttype instellen | DataPath Id OutputPath (vereist) |
DataPathAssetReference
Naam | Description | Waarde |
---|---|---|
referenceType | [Vereist] Hiermee geeft u het type assetreferentie op. | 'DataPath' (vereist) |
datastoreId | ARM-resource-id van het gegevensarchief waar de asset zich bevindt. | tekenreeks |
leertraject | Het pad van het bestand/de map in het gegevensarchief. | tekenreeks |
IdAssetReference
Naam | Description | Waarde |
---|---|---|
referenceType | [Vereist] Hiermee geeft u het type assetreferentie op. | "Id" (vereist) |
assetId | [Vereist] ARM-resource-id van de asset. | tekenreeks (vereist) Beperkingen: Patroon = [a-zA-Z0-9_] |
OutputPathAssetReference
Naam | Description | Waarde |
---|---|---|
referenceType | [Vereist] Hiermee geeft u het type assetreferentie op. | "OutputPath" (vereist) |
jobId | ARM-resource-id van de taak. | tekenreeks |
leertraject | Het pad van het bestand/de map in de taakuitvoer. | tekenreeks |
OnlineDeploymentEigenschappen
Naam | Description | Waarde |
---|---|---|
{aangepaste eigenschap} | tekenreeks |
OnlineRequestSettings
Naam | Description | Waarde |
---|---|---|
maxConcurrentRequestsPerInstance | Het aantal aanvragen dat in één keer in de wachtrij mag worden geplaatst voor deze implementatie. | int |
maxQueueWait | De maximale wachtrijwachttijd in ISO 8601-indeling. Ondersteunt precisie in milliseconden. | tekenreeks |
requestTimeout | De time-out van de aanvraag in ISO 8601-indeling. Ondersteunt precisie in milliseconden. | tekenreeks |
OnlineScaleSettings
Naam | Description | Waarde |
---|---|---|
maxInstances | Maximum aantal exemplaren voor deze implementatie. | int |
minInstances | Minimum aantal exemplaren voor deze implementatie. | int |
scaleType | Het objecttype instellen | Automatisch Handmatig (vereist) |
Instellingen voor automatisch schalen
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | 'Auto' (vereist) |
pollingInterval | Het polling-interval in ISO 8691-indeling. Alleen ondersteuning voor duur met precisie zo laag als seconden. | tekenreeks |
targetUtilizationPercentage | Doel-CPU-gebruik voor de automatische schaalaanpassing. | int |
ManualScaleSettings
Naam | Description | Waarde |
---|---|---|
scaleType | [Vereist] Type algoritme voor het schalen van implementaties | "Handmatig" (vereist) |
instanceCount | Vast aantal exemplaren voor deze implementatie. | int |
K8SOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | "K8S" (vereist) |
containerResourceRequirements | Resourcevereisten voor elk containerexemplementatie binnen een online-implementatie. | ContainerResourceRequirements |
ContainerResourceRequirements
Naam | Description | Waarde |
---|---|---|
Cpu | De minimale hoeveelheid CPU-kernen die door de container moeten worden gebruikt. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Cpulimit | De maximale hoeveelheid CPU-kernen die door de container mogen worden gebruikt. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Fpga | Het aantal FPGA PCIE-apparaten dat aan de container wordt blootgesteld. Moet een veelvoud van 2 zijn. | int |
Gpu | Het aantal GPU-kernen in de container. | int |
memoryInGB | De minimale hoeveelheid geheugen (in GB) die door de container moet worden gebruikt. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | De maximale hoeveelheid geheugen (in GB) die door de container mag worden gebruikt. Meer informatie: https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
Naam | Description | Waarde |
---|---|---|
endpointComputeType | [Vereist] Het rekentype van het eindpunt. | 'Beheerd' (vereist) |
instanceType | Type rekenproces. | tekenreeks |
readinessProbe | Configuratie van implementatiecontainer-/gereedheidstest. | ProbeSettings |
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor