Espaces de travail Microsoft.MachineLearningServices/onlineEndpoints/deployments 2021-03-01-preview
Définition de ressource Bicep
Le type de ressource workspaces/onlineEndpoints/deployments peut être déployé avec des opérations qui ciblent :
- Groupes de ressources - Voir commandes de déploiement de groupe de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version d’API, consultez journal des modifications.
Format des ressources
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, ajoutez le Bicep suivant à votre modèle.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {
clientId: 'string'
principalId: 'string'
}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
}
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: {
referenceType: 'string'
// For remaining properties, see AssetReferenceBase objects
}
properties: {
{customized property}: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
maxInstances: int
minInstances: int
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeployment objects
}
}
Objets OnlineDeployment
Définissez la propriété endpointComputeType pour spécifier le type d’objet.
Pour K8S, utilisez :
endpointComputeType: 'K8S'
containerResourceRequirements: {
cpu: int
cpuLimit: int
fpga: int
gpu: int
memoryInGB: int
memoryInGBLimit: int
}
Pour Géré, utilisez :
endpointComputeType: 'Managed'
instanceType: 'string'
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
Objets AssetReferenceBase
Définissez la propriété referenceType pour spécifier le type d’objet.
Pour DataPath, utilisez :
referenceType: 'DataPath'
datastoreId: 'string'
path: 'string'
Pour ID, utilisez :
referenceType: 'Id'
assetId: 'string'
Pour OutputPath, utilisez :
referenceType: 'OutputPath'
jobId: 'string'
path: 'string'
Objets OnlineScaleSettings
Définissez la propriété scaleType pour spécifier le type d’objet.
Pour Auto, utilisez :
scaleType: 'Auto'
pollingInterval: 'string'
targetUtilizationPercentage: int
Pour Manuel, utilisez :
scaleType: 'Manual'
instanceCount: int
Valeurs de propriétés
workspaces/onlineEndpoints/deployments
Nom | Description | Valeur |
---|---|---|
name | Nom de la ressource Découvrez comment définir des noms et des types pour des ressources enfants dans Bicep. |
string (obligatoire) |
location | Emplacement géographique où réside la ressource | string (obligatoire) |
tags | Balises de ressource. | Dictionnaire de noms et de valeurs d’étiquettes. Voir Balises dans les modèles |
kind | Métadonnées utilisées par le portail/les outils/etc pour afficher différentes expériences d’expérience utilisateur pour des ressources du même type. | string |
parent | Dans Bicep, vous pouvez spécifier la ressource parente pour une ressource enfant. Vous devez uniquement ajouter cette propriété lorsque la ressource enfant est déclarée en dehors de la ressource parente. Pour plus d’informations, consultez Ressource enfant en dehors de la ressource parente. |
Nom symbolique de la ressource de type : onlineEndpoints |
identité | Identité de service associée à une ressource. | ResourceIdentity |
properties | [Obligatoire] Attributs supplémentaires de l’entité. | OnlineDeployment (obligatoire) |
ResourceIdentity
Nom | Description | Valeur |
---|---|---|
type | Définit les valeurs d’un type ResourceIdentity. | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | Dictionnaire des identités affectées par l’utilisateur, la clé est l’ID de ressource ARM de l’UAI. | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Nom | Description | Valeur |
---|---|---|
clientId | Aka ID d’application, identificateur unique généré par Azure AD qui est lié à une application et à un principal de service lors de son approvisionnement initial. | string |
principalId | ID d’objet de l’objet principal de service pour votre identité managée qui est utilisé pour accorder l’accès en fonction du rôle à une ressource Azure. | string |
OnlineDeployment
Nom | Description | Valeur |
---|---|---|
appInsightsEnabled | Si la valeur est true, active la journalisation Application Insights. | bool |
codeConfiguration | Configuration du code pour le déploiement du point de terminaison. | CodeConfiguration |
description | Description du déploiement du point de terminaison. | string |
environmentId | ID de ressource ARM de la spécification d’environnement pour le déploiement du point de terminaison. | string |
environmentVariables | Configuration des variables d’environnement pour le déploiement. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configuration de la sonde liveness/readiness du conteneur de déploiement. | ProbeSettings |
model | Référence à la ressource de modèle pour le déploiement du point de terminaison. | AssetReferenceBase |
properties | Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. | OnlineDeploymentProperties |
requestSettings | Configuration des demandes de scoring de déploiement en ligne. | OnlineRequestSettings |
scaleSettings | Configuration de mise à l’échelle du déploiement en ligne. | OnlineScaleSettings |
endpointComputeType | Définir le type d’objet | K8S Managé (obligatoire) |
CodeConfiguration
Nom | Description | Valeur |
---|---|---|
codeId | ID de ressource ARM de la ressource de code. | string |
scoringScript | [Obligatoire] Script à exécuter au démarrage. par exemple « score.py » | chaîne (obligatoire) Contraintes : Longueur minimale = 1 Modèle = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | string |
ProbeSettings
Nom | Description | Valeur |
---|---|---|
failureThreshold | Nombre d’échecs à autoriser avant de retourner un status défectueux. | int |
initialDelay | Délai avant la première sonde au format ISO 8601. | string |
period | Durée entre les sondes au format ISO 8601. | string |
successThreshold | Nombre de sondes réussies avant de retourner un status sain. | int |
timeout | Délai d’expiration de la sonde au format ISO 8601. | string |
AssetReferenceBase
Nom | Description | Valeur |
---|---|---|
referenceType | Définir le type d’objet | DataPath Id OutputPath (obligatoire) |
DataPathAssetReference
Nom | Description | Valeur |
---|---|---|
referenceType | [Obligatoire] Spécifie le type de référence de ressource. | 'DataPath' (obligatoire) |
datastoreId | ID de ressource ARM du magasin de données où se trouve la ressource. | string |
path | Chemin d’accès du fichier/répertoire dans le magasin de données. | string |
IdAssetReference
Nom | Description | Valeur |
---|---|---|
referenceType | [Obligatoire] Spécifie le type de référence de ressource. | 'Id' (obligatoire) |
assetId | [Obligatoire] ID de ressource ARM de la ressource. | string (obligatoire) Contraintes : Modèle = [a-zA-Z0-9_] |
OutputPathAssetReference
Nom | Description | Valeur |
---|---|---|
referenceType | [Obligatoire] Spécifie le type de référence de ressource. | 'OutputPath' (obligatoire) |
jobId | ID de ressource ARM du travail. | string |
path | Chemin du fichier/répertoire dans la sortie du travail. | string |
OnlineDeploymentProperties
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | string |
OnlineRequestSettings
Nom | Description | Valeur |
---|---|---|
maxConcurrentRequestsPerInstance | Nombre de demandes autorisées à mettre en file d’attente à la fois pour ce déploiement. | int |
maxQueueWait | Temps d’attente maximal dans la file d’attente au format ISO 8601. Prend en charge la précision en millisecondes. | string |
requestTimeout | Délai d’expiration de la demande au format ISO 8601. Prend en charge la précision en millisecondes. | string |
OnlineScaleSettings
Nom | Description | Valeur |
---|---|---|
maxInstances | Nombre maximal d’instances pour ce déploiement. | int |
minInstances | Nombre minimal d’instances pour ce déploiement. | int |
scaleType | Définir le type d’objet | Automatique Manuel (obligatoire) |
AutoScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | 'Auto' (obligatoire) |
pollingInterval | Intervalle d’interrogation au format ISO 8691. Prend uniquement en charge la durée avec une précision aussi faible que secondes. | string |
targetUtilizationPercentage | Utilisation du processeur cible pour le générateur de mise à l’échelle automatique. | int |
ManualScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | 'Manual' (obligatoire) |
instanceCount | Nombre fixe d’instances pour ce déploiement. | int |
K8SOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'K8S' (obligatoire) |
containerResourceRequirements | Exigences en matière de ressources pour chaque conteneur instance dans un déploiement en ligne. | ContainerResourceRequirements |
ContainerResourceRequirements
Nom | Description | Valeur |
---|---|---|
cpu | Quantité minimale de cœurs d’UC à utiliser par le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Cpulimit | Quantité maximale de cœurs d’UC autorisés à être utilisés par le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Fpga | Nombre d’appareils PCIE FPGA exposés au conteneur. Doit être multiple de 2. | int |
gpu | Nombre de cœurs GPU dans le conteneur. | int |
memoryInGB | Quantité minimale de mémoire (en Go) à utiliser par le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | Quantité maximale de mémoire (en Go) autorisée à être utilisée par le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'Managed' (obligatoire) |
instanceType | Type de instance de calcul. | string |
readinessProbe | Configuration de la sonde liveness/readiness du conteneur de déploiement. | ProbeSettings |
Définition de ressources de modèle ARM
Le type de ressource workspaces/onlineEndpoints/deployments peut être déployé avec des opérations qui ciblent :
- Groupes de ressources - Voir commandes de déploiement de groupes de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.
Format des ressources
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, ajoutez le code JSON suivant à votre modèle.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2021-03-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {
"clientId": "string",
"principalId": "string"
}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string"
},
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": {
"referenceType": "string"
// For remaining properties, see AssetReferenceBase objects
},
"properties": {
"{customized property}": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"maxInstances": "int",
"minInstances": "int",
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeployment objects
}
}
Objets OnlineDeployment
Définissez la propriété endpointComputeType pour spécifier le type d’objet.
Pour K8S, utilisez :
"endpointComputeType": "K8S",
"containerResourceRequirements": {
"cpu": "int",
"cpuLimit": "int",
"fpga": "int",
"gpu": "int",
"memoryInGB": "int",
"memoryInGBLimit": "int"
}
Pour Géré, utilisez :
"endpointComputeType": "Managed",
"instanceType": "string",
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
}
Objets AssetReferenceBase
Définissez la propriété referenceType pour spécifier le type d’objet.
Pour DataPath, utilisez :
"referenceType": "DataPath",
"datastoreId": "string",
"path": "string"
Pour ID, utilisez :
"referenceType": "Id",
"assetId": "string"
Pour OutputPath, utilisez :
"referenceType": "OutputPath",
"jobId": "string",
"path": "string"
Objets OnlineScaleSettings
Définissez la propriété scaleType pour spécifier le type d’objet.
Pour Auto, utilisez :
"scaleType": "Auto",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Pour Manuelle, utilisez :
"scaleType": "Manual",
"instanceCount": "int"
Valeurs de propriétés
workspaces/onlineEndpoints/deployments
Nom | Description | Valeur |
---|---|---|
type | Type de ressource | « Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments » |
apiVersion | Version de l’API de ressource | « 2021-03-01-preview » |
name | Nom de la ressource Découvrez comment définir des noms et des types pour des ressources enfants dans des modèles ARM JSON. |
chaîne (obligatoire) |
location | Emplacement géographique où réside la ressource | chaîne (obligatoire) |
tags | Balises de ressource. | Dictionnaire de noms et de valeurs d’étiquettes. Voir Balises dans les modèles |
kind | Métadonnées utilisées par le portail/les outils/etc pour afficher différentes expériences d’expérience utilisateur pour des ressources du même type. | string |
identité | Identité de service associée à une ressource. | ResourceIdentity |
properties | [Obligatoire] Attributs supplémentaires de l’entité. | OnlineDeployment (obligatoire) |
ResourceIdentity
Nom | Description | Valeur |
---|---|---|
type | Définit des valeurs pour le type d’un ResourceIdentity. | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' |
userAssignedIdentities | Dictionnaire des identités affectées par l’utilisateur, la clé est l’ID de ressource ARM de l’UAI. | ResourceIdentityUserAssignedIdentities |
ResourceIdentityUserAssignedIdentities
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Nom | Description | Valeur |
---|---|---|
clientId | Aka ID d’application, identificateur unique généré par Azure AD lié à une application et à un principal de service lors de son approvisionnement initial. | string |
principalId | ID d’objet de l’objet principal de service pour votre identité managée qui est utilisé pour accorder un accès en fonction du rôle à une ressource Azure. | string |
OnlineDeployment
Nom | Description | Valeur |
---|---|---|
appInsightsEnabled | Si la valeur est true, active la journalisation Application Insights. | bool |
codeConfiguration | Configuration du code pour le déploiement du point de terminaison. | CodeConfiguration |
description | Description du déploiement du point de terminaison. | string |
environmentId | ID de ressource ARM de la spécification d’environnement pour le déploiement du point de terminaison. | string |
environmentVariables | Configuration des variables d’environnement pour le déploiement. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configuration de la sonde liveness/readiness du conteneur de déploiement. | ProbeSettings |
model | Référence à la ressource de modèle pour le déploiement du point de terminaison. | AssetReferenceBase |
properties | Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. | OnlineDeploymentProperties |
requestSettings | Configuration des demandes de scoring de déploiement en ligne. | OnlineRequestSettings |
scaleSettings | Configuration de mise à l’échelle du déploiement en ligne. | OnlineScaleSettings |
endpointComputeType | Définir le type d’objet | K8S Managé (obligatoire) |
CodeConfiguration
Nom | Description | Valeur |
---|---|---|
codeId | ID de ressource ARM de la ressource de code. | string |
scoringScript | [Obligatoire] Script à exécuter au démarrage. par exemple « score.py » | chaîne (obligatoire) Contraintes : Longueur minimale = 1 Modèle = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | string |
ProbeSettings
Nom | Description | Valeur |
---|---|---|
failureThreshold | Nombre d’échecs à autoriser avant de retourner un status défectueux. | int |
initialDelay | Délai avant la première sonde au format ISO 8601. | string |
period | Durée entre les sondes au format ISO 8601. | string |
successThreshold | Nombre de sondes réussies avant de retourner un status sain. | int |
timeout | Délai d’expiration de la sonde au format ISO 8601. | string |
AssetReferenceBase
Nom | Description | Valeur |
---|---|---|
referenceType | Définir le type d’objet | DataPath Id OutputPath (obligatoire) |
DataPathAssetReference
Nom | Description | Valeur |
---|---|---|
referenceType | [Obligatoire] Spécifie le type de référence de ressource. | 'DataPath' (obligatoire) |
datastoreId | ID de ressource ARM du magasin de données où se trouve la ressource. | string |
path | Chemin du fichier/répertoire dans le magasin de données. | string |
IdAssetReference
Nom | Description | Valeur |
---|---|---|
referenceType | [Obligatoire] Spécifie le type de référence de ressource. | 'Id' (obligatoire) |
assetId | [Obligatoire] ID de ressource ARM de la ressource. | string (obligatoire) Contraintes : Modèle = [a-zA-Z0-9_] |
OutputPathAssetReference
Nom | Description | Valeur |
---|---|---|
referenceType | [Obligatoire] Spécifie le type de référence de ressource. | 'OutputPath' (obligatoire) |
jobId | ID de ressource ARM du travail. | string |
path | Chemin du fichier/répertoire dans la sortie du travail. | string |
OnlineDeploymentProperties
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | string |
OnlineRequestSettings
Nom | Description | Valeur |
---|---|---|
maxConcurrentRequestsPerInstance | Nombre de demandes autorisées à mettre en file d’attente à la fois pour ce déploiement. | int |
maxQueueWait | Temps d’attente maximal dans la file d’attente au format ISO 8601. Prend en charge la précision en millisecondes. | string |
requestTimeout | Délai d’expiration de la demande au format ISO 8601. Prend en charge la précision en millisecondes. | string |
OnlineScaleSettings
Nom | Description | Valeur |
---|---|---|
maxInstances | Nombre maximal d’instances pour ce déploiement. | int |
minInstances | Nombre minimal d’instances pour ce déploiement. | int |
scaleType | Définir le type d’objet | Automatique Manuel (obligatoire) |
AutoScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | 'Auto' (obligatoire) |
pollingInterval | Intervalle d’interrogation au format ISO 8691. Prend uniquement en charge la durée avec une précision aussi faible que secondes. | string |
targetUtilizationPercentage | Utilisation du processeur cible pour le générateur de mise à l’échelle automatique. | int |
ManualScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | 'Manual' (obligatoire) |
instanceCount | Nombre fixe d’instances pour ce déploiement. | int |
K8SOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'K8S' (obligatoire) |
containerResourceRequirements | Exigences en matière de ressources pour chaque conteneur instance dans un déploiement en ligne. | ContainerResourceRequirements |
ContainerResourceRequirements
Nom | Description | Valeur |
---|---|---|
cpu | Quantité minimale de cœurs d’UC à utiliser par le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Cpulimit | Quantité maximale de cœurs d’UC autorisés à être utilisés par le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Fpga | Nombre d’appareils PCIE FPGA exposés au conteneur. Doit être multiple de 2. | int |
gpu | Nombre de cœurs GPU dans le conteneur. | int |
memoryInGB | Quantité minimale de mémoire (en Go) à utiliser par le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | Quantité maximale de mémoire (en Go) autorisée à être utilisée par le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'Managed' (obligatoire) |
instanceType | Type de instance de calcul. | string |
readinessProbe | Configuration de la sonde de disponibilité/préparation du conteneur de déploiement. | ProbeSettings |
Définition de ressource Terraform (fournisseur AzAPI)
Le type de ressource workspaces/onlineEndpoints/deployments peut être déployé avec des opérations qui ciblent :
- Groupes de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version d’API, consultez journal des modifications.
Format des ressources
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, ajoutez le Terraform suivant à votre modèle.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
}
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = {
referenceType = "string"
// For remaining properties, see AssetReferenceBase objects
}
properties = {
{customized property} = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
maxInstances = int
minInstances = int
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeployment objects
}
kind = "string"
})
}
Objets OnlineDeployment
Définissez la propriété endpointComputeType pour spécifier le type d’objet.
Pour K8S, utilisez :
endpointComputeType = "K8S"
containerResourceRequirements = {
cpu = int
cpuLimit = int
fpga = int
gpu = int
memoryInGB = int
memoryInGBLimit = int
}
Pour Géré, utilisez :
endpointComputeType = "Managed"
instanceType = "string"
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
Objets AssetReferenceBase
Définissez la propriété referenceType pour spécifier le type d’objet.
Pour DataPath, utilisez :
referenceType = "DataPath"
datastoreId = "string"
path = "string"
Pour ID, utilisez :
referenceType = "Id"
assetId = "string"
Pour OutputPath, utilisez :
referenceType = "OutputPath"
jobId = "string"
path = "string"
Objets OnlineScaleSettings
Définissez la propriété scaleType pour spécifier le type d’objet.
Pour Auto, utilisez :
scaleType = "Auto"
pollingInterval = "string"
targetUtilizationPercentage = int
Pour Manuel, utilisez :
scaleType = "Manual"
instanceCount = int
Valeurs de propriétés
workspaces/onlineEndpoints/deployments
Nom | Description | Valeur |
---|---|---|
type | Type de ressource | « Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2021-03-01-preview » |
name | Nom de la ressource | string (obligatoire) |
location | Emplacement géographique où réside la ressource | string (obligatoire) |
parent_id | ID de la ressource qui est le parent de cette ressource. | ID de ressource de type : onlineEndpoints |
tags | Balises de ressource. | Dictionnaire de noms et de valeurs d’étiquettes. |
kind | Métadonnées utilisées par le portail/les outils/etc pour afficher différentes expériences d’expérience utilisateur pour des ressources du même type. | string |
identité | Identité de service associée à une ressource. | ResourceIdentity |
properties | [Obligatoire] Attributs supplémentaires de l’entité. | OnlineDeployment (obligatoire) |
ResourceIdentity
Nom | Description | Valeur |
---|---|---|
type | Définit les valeurs d’un type ResourceIdentity. | « SystemAssigned » « SystemAssigned,UserAssigned » « UserAssigned » |
identity_ids | Dictionnaire des identités affectées par l’utilisateur, la clé est l’ID de ressource ARM de l’UAI. | Tableau d’ID d’identité utilisateur. |
ResourceIdentityUserAssignedIdentities
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | UserAssignedIdentityMeta |
UserAssignedIdentityMeta
Nom | Description | Valeur |
---|---|---|
clientId | Aka ID d’application, identificateur unique généré par Azure AD lié à une application et à un principal de service lors de son approvisionnement initial. | string |
principalId | ID d’objet de l’objet principal de service pour votre identité managée qui est utilisé pour accorder un accès en fonction du rôle à une ressource Azure. | string |
OnlineDeployment
Nom | Description | Valeur |
---|---|---|
appInsightsEnabled | Si la valeur est true, active la journalisation Application Insights. | bool |
codeConfiguration | Configuration du code pour le déploiement du point de terminaison. | CodeConfiguration |
description | Description du déploiement du point de terminaison. | string |
environmentId | ID de ressource ARM de la spécification d’environnement pour le déploiement du point de terminaison. | string |
environmentVariables | Configuration des variables d’environnement pour le déploiement. | OnlineDeploymentEnvironmentVariables |
livenessProbe | Configuration de la sonde liveness/readiness du conteneur de déploiement. | ProbeSettings |
model | Référence à la ressource de modèle pour le déploiement du point de terminaison. | AssetReferenceBase |
properties | Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. | OnlineDeploymentProperties |
requestSettings | Configuration des demandes de scoring de déploiement en ligne. | OnlineRequestSettings |
scaleSettings | Configuration de mise à l’échelle du déploiement en ligne. | OnlineScaleSettings |
endpointComputeType | Définir le type d’objet | K8S Managé (obligatoire) |
CodeConfiguration
Nom | Description | Valeur |
---|---|---|
codeId | ID de ressource ARM de la ressource de code. | string |
scoringScript | [Obligatoire] Script à exécuter au démarrage. par exemple « score.py » | chaîne (obligatoire) Contraintes : Longueur minimale = 1 Modèle = [a-zA-Z0-9_] |
OnlineDeploymentEnvironmentVariables
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | string |
ProbeSettings
Nom | Description | Valeur |
---|---|---|
failureThreshold | Nombre d’échecs à autoriser avant de retourner un status défectueux. | int |
initialDelay | Délai avant la première sonde au format ISO 8601. | string |
period | Durée entre les sondes au format ISO 8601. | string |
successThreshold | Nombre de sondes réussies avant de retourner un status sain. | int |
timeout | Délai d’expiration de la sonde au format ISO 8601. | string |
AssetReferenceBase
Nom | Description | Valeur |
---|---|---|
referenceType | Définir le type d’objet | DataPath Id OutputPath (obligatoire) |
DataPathAssetReference
Nom | Description | Valeur |
---|---|---|
referenceType | [Obligatoire] Spécifie le type de référence de ressource. | « DataPath » (obligatoire) |
datastoreId | ID de ressource ARM du magasin de données où se trouve la ressource. | string |
path | Chemin d’accès du fichier/répertoire dans le magasin de données. | string |
IdAssetReference
Nom | Description | Valeur |
---|---|---|
referenceType | [Obligatoire] Spécifie le type de référence de ressource. | « ID » (obligatoire) |
assetId | [Obligatoire] ID de ressource ARM de la ressource. | chaîne (obligatoire) Contraintes : Modèle = [a-zA-Z0-9_] |
OutputPathAssetReference
Nom | Description | Valeur |
---|---|---|
referenceType | [Obligatoire] Spécifie le type de référence de ressource. | « OutputPath » (obligatoire) |
jobId | ID de ressource ARM du travail. | string |
path | Chemin du fichier/répertoire dans la sortie du travail. | string |
OnlineDeploymentProperties
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | string |
OnlineRequestSettings
Nom | Description | Valeur |
---|---|---|
maxConcurrentRequestsPerInstance | Nombre de demandes autorisées à mettre en file d’attente à la fois pour ce déploiement. | int |
maxQueueWait | Temps d’attente maximal de la file d’attente au format ISO 8601. Prend en charge la précision en millisecondes. | string |
requestTimeout | Délai d’expiration de la demande au format ISO 8601. Prend en charge la précision en millisecondes. | string |
OnlineScaleSettings
Nom | Description | Valeur |
---|---|---|
maxInstances | Nombre maximal d’instances pour ce déploiement. | int |
minInstances | Nombre minimal d’instances pour ce déploiement. | int |
scaleType | Définir le type d’objet | Automatique Manuel (obligatoire) |
AutoScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle de déploiement | « Auto » (obligatoire) |
pollingInterval | Intervalle d’interrogation au format ISO 8691. Prend uniquement en charge la durée avec une précision aussi faible que secondes. | string |
targetUtilizationPercentage | Utilisation du processeur cible pour le générateur de mise à l’échelle automatique. | int |
ManualScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | « Manuel » (obligatoire) |
instanceCount | Nombre fixe d’instances pour ce déploiement. | int |
K8SOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | « K8S » (obligatoire) |
containerResourceRequirements | Exigences en matière de ressources pour chaque conteneur instance dans un déploiement en ligne. | ContainerResourceRequirements |
ContainerResourceRequirements
Nom | Description | Valeur |
---|---|---|
cpu | Quantité minimale de cœurs d’UC à utiliser par le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Cpulimit | Quantité maximale de cœurs d’UC autorisés à être utilisés par le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
Fpga | Nombre d’appareils PCIE FPGA exposés au conteneur. Doit être multiple de 2. | int |
gpu | Nombre de cœurs GPU dans le conteneur. | int |
memoryInGB | Quantité minimale de mémoire (en Go) à utiliser par le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
memoryInGBLimit | Quantité maximale de mémoire (en Go) autorisée à être utilisée par le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
int |
ManagedOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | « Géré » (obligatoire) |
instanceType | Type de instance de calcul. | string |
readinessProbe | Configuration de la sonde de disponibilité/préparation du conteneur de déploiement. | ProbeSettings |
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour