Espaces de travail Microsoft.MachineLearningServices/onlineEndpoints/deployments 2022-02-01-preview
Définition de ressource Bicep
Le type de ressource workspaces/onlineEndpoints/deployments peut être déployé avec des opérations qui ciblent :
- Groupes de ressources - Voir commandes de déploiement de groupe de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version d’API, consultez journal des modifications.
Format des ressources
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, ajoutez le Bicep suivant à votre modèle.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-02-01-preview' = {
name: 'string'
location: 'string'
tags: {
tagName1: 'tagValue1'
tagName2: 'tagValue2'
}
sku: {
capacity: int
family: 'string'
name: 'string'
size: 'string'
tier: 'string'
}
kind: 'string'
parent: resourceSymbolicName
identity: {
type: 'string'
userAssignedIdentities: {
{customized property}: {}
}
}
properties: {
appInsightsEnabled: bool
codeConfiguration: {
codeId: 'string'
scoringScript: 'string'
}
description: 'string'
egressPublicNetworkAccess: 'string'
environmentId: 'string'
environmentVariables: {
{customized property}: 'string'
{customized property}: 'string'
}
instanceType: 'string'
livenessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
model: 'string'
modelMountPath: 'string'
privateNetworkConnection: bool
properties: {
{customized property}: 'string'
{customized property}: 'string'
}
readinessProbe: {
failureThreshold: int
initialDelay: 'string'
period: 'string'
successThreshold: int
timeout: 'string'
}
requestSettings: {
maxConcurrentRequestsPerInstance: int
maxQueueWait: 'string'
requestTimeout: 'string'
}
scaleSettings: {
scaleType: 'string'
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType: 'string'
// For remaining properties, see OnlineDeploymentDetails objects
}
}
Objets OnlineDeploymentDetails
Définissez la propriété endpointComputeType pour spécifier le type d’objet.
Pour Kubernetes, utilisez :
endpointComputeType: 'Kubernetes'
containerResourceRequirements: {
containerResourceLimits: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
containerResourceRequests: {
cpu: 'string'
gpu: 'string'
memory: 'string'
}
}
Pour Géré, utilisez :
endpointComputeType: 'Managed'
Objets OnlineScaleSettings
Définissez la propriété scaleType pour spécifier le type d’objet.
Pour Par défaut, utilisez :
scaleType: 'Default'
Pour TargetUtilization, utilisez :
scaleType: 'TargetUtilization'
maxInstances: int
minInstances: int
pollingInterval: 'string'
targetUtilizationPercentage: int
Valeurs de propriétés
workspaces/onlineEndpoints/deployments
Nom | Description | Valeur |
---|---|---|
name | Nom de la ressource Découvrez comment définir des noms et des types pour des ressources enfants dans Bicep. |
string (obligatoire) |
location | Emplacement géographique où réside la ressource | string (obligatoire) |
tags | Balises de ressource. | Dictionnaire de noms et de valeurs d’étiquettes. Voir Balises dans les modèles |
sku | Détails de la référence SKU requis pour le contrat ARM pour la mise à l’échelle automatique. | Sku |
kind | Métadonnées utilisées par le portail/les outils/etc pour afficher différentes expériences d’expérience utilisateur pour des ressources du même type. | string |
parent | Dans Bicep, vous pouvez spécifier la ressource parente pour une ressource enfant. Vous devez uniquement ajouter cette propriété lorsque la ressource enfant est déclarée en dehors de la ressource parente. Pour plus d’informations, consultez Ressource enfant en dehors de la ressource parente. |
Nom symbolique de la ressource de type : onlineEndpoints |
identité | Identité de service managée (identités affectées par le système et/ou par l’utilisateur) | ManagedServiceIdentity |
properties | [Obligatoire] Attributs supplémentaires de l’entité. | OnlineDeploymentDetails (obligatoire) |
ManagedServiceIdentity
Nom | Description | Valeur |
---|---|---|
type | Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obligatoire) |
userAssignedIdentities | Ensemble d’identités affectées par l’utilisateur associées à la ressource. Les clés de dictionnaire userAssignedIdentities sont des ID de ressource ARM au format : '/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Les valeurs du dictionnaire peuvent être des objets vides ({}) dans les requêtes. | UserAssignedIdentities |
UserAssignedIdentities
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | userAssignedIdentity |
userAssignedIdentity
Cet objet ne contient aucune propriété à définir pendant le déploiement. Toutes les propriétés sont ReadOnly.
OnlineDeploymentDetails
Nom | Description | Valeur |
---|---|---|
appInsightsEnabled | Si la valeur est true, active la journalisation Application Insights. | bool |
codeConfiguration | Configuration du code pour le déploiement du point de terminaison. | CodeConfiguration |
description | Description du déploiement du point de terminaison. | string |
egressPublicNetworkAccess | Si activé, autorisez l’accès au réseau public de sortie. Si cette option est désactivée, cela crée une sortie sécurisée. Par défaut : Activé. | 'Désactivé' 'Enabled' |
environmentId | ID de ressource ARM de la spécification de l’environnement pour le déploiement du point de terminaison. | string |
environmentVariables | Configuration des variables d’environnement pour le déploiement. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type de instance de calcul. | string |
livenessProbe | La probe liveness supervise régulièrement l’intégrité du conteneur. | ProbeSettings |
model | Chemin d’uri du modèle. | string |
modelMountPath | Chemin d’accès pour monter le modèle dans un conteneur personnalisé. | string |
privateNetworkConnection | Si la valeur est true, activez la connexion réseau privée. DÉPRÉCIÉ pour les futures versions d’API. Utilisez EgressPublicNetworkAccess. |
bool |
properties | Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | La probe readiness valide si le conteneur est prêt à traiter le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la probe liveness. | ProbeSettings |
requestSettings | Paramètres de demande pour le déploiement. | OnlineRequestSettings |
scaleSettings | Paramètres de mise à l’échelle pour le déploiement. S’il est null ou non fourni, La valeur par défaut est TargetUtilizationScaleSettings pour KubernetesOnlineDeployment et à DefaultScaleSettings pour ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Définir le type d’objet | Kubernetes Géré (obligatoire) |
CodeConfiguration
Nom | Description | Valeur |
---|---|---|
codeId | ID de ressource ARM de la ressource de code. | string |
scoringScript | [Obligatoire] Script à exécuter au démarrage. par exemple « score.py » | string (obligatoire) Contraintes : Longueur minimale = 1 Modèle = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | string | |
{propriété personnalisée} | string |
ProbeSettings
Nom | Description | Valeur |
---|---|---|
failureThreshold | Nombre d’échecs à autoriser avant de retourner un status non sain. | int |
initialDelay | Délai avant la première sonde au format ISO 8601. | string |
period | Durée entre les sondes au format ISO 8601. | string |
successThreshold | Nombre de sondes réussies avant de retourner un status sain. | int |
timeout | Délai d’expiration de la sonde au format ISO 8601. | string |
EndpointDeploymentPropertiesBaseProperties
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | string | |
{propriété personnalisée} | string |
OnlineRequestSettings
Nom | Description | Valeur |
---|---|---|
maxConcurrentRequestsPerInstance | Nombre maximal de requêtes simultanées par nœud autorisées par déploiement. La valeur par défaut est de 1. | int |
maxQueueWait | Durée maximale pendant laquelle une demande reste dans la file d’attente au format ISO 8601. Par défaut, 500 ms. |
string |
requestTimeout | Délai d’expiration du score au format ISO 8601. Par défaut, 5 000 ms. |
string |
OnlineScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | Définir le type d’objet | Par défaut TargetUtilization (obligatoire) |
DefaultScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle de déploiement | 'Default' (obligatoire) |
TargetUtilizationScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle de déploiement | 'TargetUtilization' (obligatoire) |
maxInstances | Nombre maximal d’instances possibles pour la mise à l’échelle du déploiement. Le quota sera réservé à max_instances. | int |
minInstances | Nombre minimal d’instances devant toujours être présentes. | int |
pollingInterval | Intervalle d’interrogation au format ISO 8691. Prend uniquement en charge la durée avec une précision aussi faible que secondes. | string |
targetUtilizationPercentage | Utilisation du processeur cible pour le générateur de mise à l’échelle automatique. | int |
KubernetesOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'Kubernetes' (obligatoire) |
containerResourceRequirements | Exigences en ressources pour le conteneur (processeur et mémoire). | ContainerResourceRequirements |
ContainerResourceRequirements
Nom | Description | Valeur |
---|---|---|
containerResourceLimits | Informations sur la limite des ressources de conteneur : | ContainerResourceSettings |
containerResourceRequests | Informations sur la demande de ressource de conteneur : | ContainerResourceSettings |
ContainerResourceSettings
Nom | Description | Valeur |
---|---|---|
cpu | Nombre de demandes/limite de processeurs virtuels pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
gpu | Nombre de cartes GPU Nvidia demande/limite pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
mémoire | Demande/limite de taille de mémoire pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'Managed' (obligatoire) |
Sku
Nom | Description | Valeur |
---|---|---|
capacité | Si la référence SKU prend en charge le scale-out/in, l’entier de capacité doit être inclus. Si le scale-out/in n’est pas possible pour la ressource, cela peut être omis. | int |
famille | Si le service a différentes générations de matériel, pour la même référence SKU, cela peut être capturé ici. | string |
name | Nom de la référence SKU. Ex - P3. Il s’agit généralement d’un code lettre+nombre | chaîne (obligatoire) |
taille | Taille de la référence SKU. Lorsque le champ de nom est la combinaison du niveau et d’une autre valeur, il s’agit du code autonome. | string |
Niveau | Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas obligatoire sur un PUT. | 'De base' 'Gratuit' 'Premium' 'Standard' |
Définition de ressources de modèle ARM
Le type de ressource workspaces/onlineEndpoints/deployments peut être déployé avec des opérations qui ciblent :
- Groupes de ressources - Voir commandes de déploiement de groupes de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.
Format des ressources
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, ajoutez le code JSON suivant à votre modèle.
{
"type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
"apiVersion": "2022-02-01-preview",
"name": "string",
"location": "string",
"tags": {
"tagName1": "tagValue1",
"tagName2": "tagValue2"
},
"sku": {
"capacity": "int",
"family": "string",
"name": "string",
"size": "string",
"tier": "string"
},
"kind": "string",
"identity": {
"type": "string",
"userAssignedIdentities": {
"{customized property}": {}
}
},
"properties": {
"appInsightsEnabled": "bool",
"codeConfiguration": {
"codeId": "string",
"scoringScript": "string"
},
"description": "string",
"egressPublicNetworkAccess": "string",
"environmentId": "string",
"environmentVariables": {
"{customized property}": "string",
"{customized property}": "string"
},
"instanceType": "string",
"livenessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"model": "string",
"modelMountPath": "string",
"privateNetworkConnection": "bool",
"properties": {
"{customized property}": "string",
"{customized property}": "string"
},
"readinessProbe": {
"failureThreshold": "int",
"initialDelay": "string",
"period": "string",
"successThreshold": "int",
"timeout": "string"
},
"requestSettings": {
"maxConcurrentRequestsPerInstance": "int",
"maxQueueWait": "string",
"requestTimeout": "string"
},
"scaleSettings": {
"scaleType": "string"
// For remaining properties, see OnlineScaleSettings objects
},
"endpointComputeType": "string"
// For remaining properties, see OnlineDeploymentDetails objects
}
}
Objets OnlineDeploymentDetails
Définissez la propriété endpointComputeType pour spécifier le type d’objet.
Pour Kubernetes, utilisez :
"endpointComputeType": "Kubernetes",
"containerResourceRequirements": {
"containerResourceLimits": {
"cpu": "string",
"gpu": "string",
"memory": "string"
},
"containerResourceRequests": {
"cpu": "string",
"gpu": "string",
"memory": "string"
}
}
Pour Géré, utilisez :
"endpointComputeType": "Managed"
Objets OnlineScaleSettings
Définissez la propriété scaleType pour spécifier le type d’objet.
Pour Par défaut, utilisez :
"scaleType": "Default"
Pour TargetUtilization, utilisez :
"scaleType": "TargetUtilization",
"maxInstances": "int",
"minInstances": "int",
"pollingInterval": "string",
"targetUtilizationPercentage": "int"
Valeurs de propriétés
workspaces/onlineEndpoints/deployments
Nom | Description | Valeur |
---|---|---|
type | Type de ressource | « Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments » |
apiVersion | Version de l’API de ressource | « 2022-02-01-preview » |
name | Nom de la ressource Découvrez comment définir des noms et des types pour des ressources enfants dans des modèles ARM JSON. |
chaîne (obligatoire) |
location | Emplacement géographique où réside la ressource | chaîne (obligatoire) |
tags | Balises de ressource. | Dictionnaire de noms et de valeurs d’étiquettes. Voir Balises dans les modèles |
sku | Détails de la référence Sku requis pour le contrat ARM pour la mise à l’échelle automatique. | Sku |
kind | Métadonnées utilisées par le portail/les outils/etc pour afficher différentes expériences d’expérience utilisateur pour des ressources du même type. | string |
identité | Identité de service managée (identités attribuées par le système et/ou attribuées par l’utilisateur) | ManagedServiceIdentity |
properties | [Obligatoire] Attributs supplémentaires de l’entité. | OnlineDeploymentDetails (obligatoire) |
ManagedServiceIdentity
Nom | Description | Valeur |
---|---|---|
type | Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés). | 'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obligatoire) |
userAssignedIdentities | Ensemble d’identités affectées par l’utilisateur associées à la ressource. Les clés de dictionnaire userAssignedIdentities seront des ID de ressource ARM au format « /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Les valeurs du dictionnaire peuvent être des objets vides ({}) dans les requêtes. | UserAssignedIdentities |
UserAssignedIdentities
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | userAssignedIdentity |
userAssignedIdentity
Cet objet ne contient aucune propriété à définir pendant le déploiement. Toutes les propriétés sont ReadOnly.
OnlineDeploymentDetails
Nom | Description | Valeur |
---|---|---|
appInsightsEnabled | Si la valeur est true, active la journalisation Application Insights. | bool |
codeConfiguration | Configuration du code pour le déploiement du point de terminaison. | CodeConfiguration |
description | Description du déploiement du point de terminaison. | string |
egressPublicNetworkAccess | Si activé, autorisez l’accès au réseau public de sortie. Si cette option est désactivée, cela crée une sortie sécurisée. Par défaut : activé. | 'Désactivé' 'Enabled' |
environmentId | ID de ressource ARM de la spécification d’environnement pour le déploiement du point de terminaison. | string |
environmentVariables | Configuration des variables d’environnement pour le déploiement. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type de instance de calcul. | string |
livenessProbe | La probe liveness supervise régulièrement l’intégrité du conteneur. | ProbeSettings |
model | Chemin d’uri du modèle. | string |
modelMountPath | Chemin d’accès pour monter le modèle dans un conteneur personnalisé. | string |
privateNetworkConnection | Si la valeur est true, activez la connexion réseau privée. DÉCONSEILLÉ pour les futures versions d’API. Utilisez EgressPublicNetworkAccess. |
bool |
properties | Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | La probe readiness valide si le conteneur est prêt à traiter le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la probe liveness. | ProbeSettings |
requestSettings | Paramètres de demande pour le déploiement. | OnlineRequestSettings |
scaleSettings | Paramètres de mise à l’échelle pour le déploiement. S’il est null ou non fourni, il est défini par défaut sur TargetUtilizationScaleSettings pour KubernetesOnlineDeployment et à DefaultScaleSettings pour ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Définir le type d’objet | Kubernetes Managé (obligatoire) |
CodeConfiguration
Nom | Description | Valeur |
---|---|---|
codeId | ID de ressource ARM de la ressource de code. | string |
scoringScript | [Obligatoire] Script à exécuter au démarrage. par exemple « score.py » | chaîne (obligatoire) Contraintes : Longueur minimale = 1 Modèle = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | string | |
{propriété personnalisée} | string |
ProbeSettings
Nom | Description | Valeur |
---|---|---|
failureThreshold | Nombre d’échecs à autoriser avant de retourner un status défectueux. | int |
initialDelay | Délai avant la première sonde au format ISO 8601. | string |
period | Durée entre les sondes au format ISO 8601. | string |
successThreshold | Nombre de sondes réussies avant de retourner un status sain. | int |
timeout | Délai d’expiration de la sonde au format ISO 8601. | string |
EndpointDeploymentPropertiesBaseProperties
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | string | |
{propriété personnalisée} | string |
OnlineRequestSettings
Nom | Description | Valeur |
---|---|---|
maxConcurrentRequestsPerInstance | Nombre maximal de requêtes simultanées par nœud autorisées par déploiement. La valeur par défaut est de 1. | int |
maxQueueWait | Durée maximale pendant laquelle une demande reste dans la file d’attente au format ISO 8601. La valeur par défaut est 500 ms. |
string |
requestTimeout | Délai d’expiration du scoring au format ISO 8601. La valeur par défaut est 5 000 ms. |
string |
OnlineScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | Définir le type d’objet | Par défaut TargetUtilization (obligatoire) |
DefaultScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | 'Default' (obligatoire) |
TargetUtilizationScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | 'TargetUtilization' (obligatoire) |
maxInstances | Nombre maximal d’instances possibles pour la mise à l’échelle du déploiement. Le quota sera réservé à max_instances. | int |
minInstances | Nombre minimal d’instances devant toujours être présentes. | int |
pollingInterval | Intervalle d’interrogation au format ISO 8691. Prend uniquement en charge la durée avec une précision aussi faible que secondes. | string |
targetUtilizationPercentage | Utilisation du processeur cible pour le générateur de mise à l’échelle automatique. | int |
KubernetesOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'Kubernetes' (obligatoire) |
containerResourceRequirements | Exigences en ressources pour le conteneur (processeur et mémoire). | ContainerResourceRequirements |
ContainerResourceRequirements
Nom | Description | Valeur |
---|---|---|
containerResourceLimits | Informations sur la limite de ressources de conteneur : | ContainerResourceSettings |
containerResourceRequests | Informations sur la demande de ressource de conteneur : | ContainerResourceSettings |
ContainerResourceSettings
Nom | Description | Valeur |
---|---|---|
cpu | Nombre de demandes/limites de processeurs virtuels pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
gpu | Nombre de demandes/limites de cartes GPU Nvidia pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
mémoire | Demande/limite de taille de mémoire pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | 'Managed' (obligatoire) |
Sku
Nom | Description | Valeur |
---|---|---|
capacité | Si la référence SKU prend en charge le scale-out/in, l’entier de capacité doit être inclus. Si le scale-out/in n’est pas possible pour la ressource, cela peut être omis. | int |
famille | Si le service a différentes générations de matériel, pour la même référence SKU, cela peut être capturé ici. | string |
name | Nom de la référence SKU. Ex - P3. Il s’agit généralement d’un code lettre+nombre | chaîne (obligatoire) |
taille | Taille de la référence SKU. Lorsque le champ de nom est la combinaison du niveau et d’une autre valeur, il s’agit du code autonome. | string |
Niveau | Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas obligatoire sur un PUT. | 'De base' 'Gratuit' 'Premium' 'Standard' |
Définition de ressource Terraform (fournisseur AzAPI)
Le type de ressource workspaces/onlineEndpoints/deployments peut être déployé avec des opérations qui ciblent :
- Groupes de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.
Format des ressources
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, ajoutez le Terraform suivant à votre modèle.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-02-01-preview"
name = "string"
location = "string"
parent_id = "string"
tags = {
tagName1 = "tagValue1"
tagName2 = "tagValue2"
}
identity {
type = "string"
identity_ids = []
}
body = jsonencode({
properties = {
appInsightsEnabled = bool
codeConfiguration = {
codeId = "string"
scoringScript = "string"
}
description = "string"
egressPublicNetworkAccess = "string"
environmentId = "string"
environmentVariables = {
{customized property} = "string"
{customized property} = "string"
}
instanceType = "string"
livenessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
model = "string"
modelMountPath = "string"
privateNetworkConnection = bool
properties = {
{customized property} = "string"
{customized property} = "string"
}
readinessProbe = {
failureThreshold = int
initialDelay = "string"
period = "string"
successThreshold = int
timeout = "string"
}
requestSettings = {
maxConcurrentRequestsPerInstance = int
maxQueueWait = "string"
requestTimeout = "string"
}
scaleSettings = {
scaleType = "string"
// For remaining properties, see OnlineScaleSettings objects
}
endpointComputeType = "string"
// For remaining properties, see OnlineDeploymentDetails objects
}
sku = {
capacity = int
family = "string"
name = "string"
size = "string"
tier = "string"
}
kind = "string"
})
}
Objets OnlineDeploymentDetails
Définissez la propriété endpointComputeType pour spécifier le type d’objet.
Pour Kubernetes, utilisez :
endpointComputeType = "Kubernetes"
containerResourceRequirements = {
containerResourceLimits = {
cpu = "string"
gpu = "string"
memory = "string"
}
containerResourceRequests = {
cpu = "string"
gpu = "string"
memory = "string"
}
}
Pour Géré, utilisez :
endpointComputeType = "Managed"
Objets OnlineScaleSettings
Définissez la propriété scaleType pour spécifier le type d’objet.
Pour Par défaut, utilisez :
scaleType = "Default"
Pour TargetUtilization, utilisez :
scaleType = "TargetUtilization"
maxInstances = int
minInstances = int
pollingInterval = "string"
targetUtilizationPercentage = int
Valeurs de propriétés
workspaces/onlineEndpoints/deployments
Nom | Description | Valeur |
---|---|---|
type | Type de ressource | « Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2022-02-01-preview » |
name | Nom de la ressource | chaîne (obligatoire) |
location | Emplacement géographique où réside la ressource | chaîne (obligatoire) |
parent_id | ID de la ressource qui est le parent de cette ressource. | ID pour la ressource de type : onlineEndpoints |
tags | Balises de ressource. | Dictionnaire de noms et de valeurs d’étiquettes. |
sku | Détails de la référence Sku requis pour le contrat ARM pour la mise à l’échelle automatique. | Sku |
kind | Métadonnées utilisées par le portail/les outils/etc pour afficher différentes expériences d’expérience utilisateur pour des ressources du même type. | string |
identité | Identité de service managée (identités attribuées par le système et/ou attribuées par l’utilisateur) | ManagedServiceIdentity |
properties | [Obligatoire] Attributs supplémentaires de l’entité. | OnlineDeploymentDetails (obligatoire) |
ManagedServiceIdentity
Nom | Description | Valeur |
---|---|---|
type | Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés). | « SystemAssigned » « SystemAssigned,UserAssigned » « UserAssigned » (obligatoire) |
identity_ids | Ensemble d’identités affectées par l’utilisateur associées à la ressource. Les clés de dictionnaire userAssignedIdentities seront des ID de ressource ARM au format « /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Les valeurs du dictionnaire peuvent être des objets vides ({}) dans les requêtes. | Tableau d’ID d’identité utilisateur. |
UserAssignedIdentities
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | userAssignedIdentity |
userAssignedIdentity
Cet objet ne contient aucune propriété à définir pendant le déploiement. Toutes les propriétés sont ReadOnly.
OnlineDeploymentDetails
Nom | Description | Valeur |
---|---|---|
appInsightsEnabled | Si la valeur est true, active la journalisation Application Insights. | bool |
codeConfiguration | Configuration du code pour le déploiement du point de terminaison. | CodeConfiguration |
description | Description du déploiement du point de terminaison. | string |
egressPublicNetworkAccess | Si activé, autorisez l’accès au réseau public de sortie. Si cette option est désactivée, cela crée une sortie sécurisée. Par défaut : activé. | « Désactivé » « Activé » |
environmentId | ID de ressource ARM de la spécification d’environnement pour le déploiement du point de terminaison. | string |
environmentVariables | Configuration des variables d’environnement pour le déploiement. | EndpointDeploymentPropertiesBaseEnvironmentVariables |
instanceType | Type de instance de calcul. | string |
livenessProbe | La probe liveness supervise régulièrement l’intégrité du conteneur. | ProbeSettings |
model | Chemin d’uri du modèle. | string |
modelMountPath | Chemin d’accès pour monter le modèle dans un conteneur personnalisé. | string |
privateNetworkConnection | Si la valeur est true, activez la connexion réseau privée. DÉCONSEILLÉ pour les futures versions d’API. Utilisez EgressPublicNetworkAccess. |
bool |
properties | Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées. | EndpointDeploymentPropertiesBaseProperties |
readinessProbe | La probe readiness valide si le conteneur est prêt à traiter le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la probe liveness. | ProbeSettings |
requestSettings | Paramètres de demande pour le déploiement. | OnlineRequestSettings |
scaleSettings | Paramètres de mise à l’échelle pour le déploiement. S’il est null ou non fourni, il est défini par défaut sur TargetUtilizationScaleSettings pour KubernetesOnlineDeployment et à DefaultScaleSettings pour ManagedOnlineDeployment. |
OnlineScaleSettings |
endpointComputeType | Définir le type d’objet | Kubernetes Managé (obligatoire) |
CodeConfiguration
Nom | Description | Valeur |
---|---|---|
codeId | ID de ressource ARM de la ressource de code. | string |
scoringScript | [Obligatoire] Script à exécuter au démarrage. par exemple « score.py » | chaîne (obligatoire) Contraintes : Longueur minimale = 1 Modèle = [a-zA-Z0-9_] |
EndpointDeploymentPropertiesBaseEnvironmentVariables
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | string | |
{propriété personnalisée} | string |
ProbeSettings
Nom | Description | Valeur |
---|---|---|
failureThreshold | Nombre d’échecs à autoriser avant de retourner un status défectueux. | int |
initialDelay | Délai avant la première sonde au format ISO 8601. | string |
period | Durée entre les sondes au format ISO 8601. | string |
successThreshold | Nombre de sondes réussies avant de retourner un status sain. | int |
timeout | Délai d’expiration de la sonde au format ISO 8601. | string |
EndpointDeploymentPropertiesBaseProperties
Nom | Description | Valeur |
---|---|---|
{propriété personnalisée} | string | |
{propriété personnalisée} | string |
OnlineRequestSettings
Nom | Description | Valeur |
---|---|---|
maxConcurrentRequestsPerInstance | Nombre maximal de requêtes simultanées par nœud autorisées par déploiement. La valeur par défaut est de 1. | int |
maxQueueWait | Durée maximale pendant laquelle une demande reste dans la file d’attente au format ISO 8601. La valeur par défaut est 500 ms. |
string |
requestTimeout | Délai d’expiration du scoring au format ISO 8601. La valeur par défaut est 5 000 ms. |
string |
OnlineScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | Définir le type d’objet | Par défaut TargetUtilization (obligatoire) |
DefaultScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | « Default » (obligatoire) |
TargetUtilizationScaleSettings
Nom | Description | Valeur |
---|---|---|
scaleType | [Obligatoire] Type d’algorithme de mise à l’échelle du déploiement | « TargetUtilization » (obligatoire) |
maxInstances | Nombre maximal d’instances possibles pour la mise à l’échelle du déploiement. Le quota sera réservé à max_instances. | int |
minInstances | Nombre minimal d’instances devant toujours être présentes. | int |
pollingInterval | Intervalle d’interrogation au format ISO 8691. Prend uniquement en charge la durée avec une précision aussi faible que secondes. | string |
targetUtilizationPercentage | Utilisation du processeur cible pour le générateur de mise à l’échelle automatique. | int |
KubernetesOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | « Kubernetes » (obligatoire) |
containerResourceRequirements | Exigences en ressources pour le conteneur (processeur et mémoire). | ContainerResourceRequirements |
ContainerResourceRequirements
Nom | Description | Valeur |
---|---|---|
containerResourceLimits | Informations sur la limite de ressources de conteneur : | ContainerResourceSettings |
containerResourceRequests | Informations sur la demande de ressource de conteneur : | ContainerResourceSettings |
ContainerResourceSettings
Nom | Description | Valeur |
---|---|---|
cpu | Nombre de demandes/limites de processeurs virtuels pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
gpu | Nombre de demandes/limites de cartes GPU Nvidia pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
mémoire | Demande/limite de taille de mémoire pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/ |
string |
ManagedOnlineDeployment
Nom | Description | Valeur |
---|---|---|
endpointComputeType | [Obligatoire] Type de calcul du point de terminaison. | « Géré » (obligatoire) |
Sku
Nom | Description | Valeur |
---|---|---|
capacité | Si la référence SKU prend en charge le scale-out/in, l’entier de capacité doit être inclus. Si un scale-out/scale-in n’est pas possible pour la ressource, cela peut être omis. | int |
famille | Si le service a différentes générations de matériel, pour la même référence SKU, cela peut être capturé ici. | string |
name | Nom de la référence SKU. Ex - P3. Il s’agit généralement d’un code lettre+nombre | string (obligatoire) |
taille | Taille de la référence SKU. Lorsque le champ name est la combinaison du niveau et d’une autre valeur, il s’agit du code autonome. | string |
Niveau | Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas requis sur un PUT. | "Basic" « Gratuit » « Premium » « Standard » |
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour