Espaces de travail Microsoft.MachineLearningServices/onlineEndpoints/deployments 2023-06-01-preview

Article
01/13/2024

Définition de ressource Bicep

Le type de ressource workspaces/onlineEndpoints/deployments peut être déployé avec des opérations qui ciblent :

Groupes de ressources - Voir commandes de déploiement de groupes de ressources

Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.

Format des ressources

Pour créer une ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, ajoutez le Bicep suivant à votre modèle.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview' = {
  name: 'string'
  location: 'string'
  tags: {
    tagName1: 'tagValue1'
    tagName2: 'tagValue2'
  }
  sku: {
    capacity: int
    family: 'string'
    name: 'string'
    size: 'string'
    tier: 'string'
  }
  kind: 'string'
  parent: resourceSymbolicName
  identity: {
    type: 'string'
    userAssignedIdentities: {
      {customized property}: {}
    }
  }
  properties: {
    appInsightsEnabled: bool
    codeConfiguration: {
      codeId: 'string'
      scoringScript: 'string'
    }
    dataCollector: {
      collections: {
        {customized property}: {
          clientId: 'string'
          dataCollectionMode: 'string'
          dataId: 'string'
          samplingRate: int
        }
      }
      requestLogging: {
        captureHeaders: [
          'string'
        ]
      }
      rollingRate: 'string'
    }
    description: 'string'
    egressPublicNetworkAccess: 'string'
    environmentId: 'string'
    environmentVariables: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    instanceType: 'string'
    livenessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    model: 'string'
    modelMountPath: 'string'
    properties: {
      {customized property}: 'string'
      {customized property}: 'string'
    }
    readinessProbe: {
      failureThreshold: int
      initialDelay: 'string'
      period: 'string'
      successThreshold: int
      timeout: 'string'
    }
    requestSettings: {
      maxConcurrentRequestsPerInstance: int
      maxQueueWait: 'string'
      requestTimeout: 'string'
    }
    scaleSettings: {
      scaleType: 'string'
      // For remaining properties, see OnlineScaleSettings objects
    }
    endpointComputeType: 'string'
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Objets OnlineDeploymentProperties

Définissez la propriété endpointComputeType pour spécifier le type d’objet.

Pour Kubernetes, utilisez :

  endpointComputeType: 'Kubernetes'
  containerResourceRequirements: {
    containerResourceLimits: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
    containerResourceRequests: {
      cpu: 'string'
      gpu: 'string'
      memory: 'string'
    }
  }

Pour Géré, utilisez :

  endpointComputeType: 'Managed'

Objets OnlineScaleSettings

Définissez la propriété scaleType pour spécifier le type d’objet.

Pour Par défaut, utilisez :

  scaleType: 'Default'

Pour TargetUtilization, utilisez :

  scaleType: 'TargetUtilization'
  maxInstances: int
  minInstances: int
  pollingInterval: 'string'
  targetUtilizationPercentage: int

Valeurs de propriétés

workspaces/onlineEndpoints/deployments

Nom	Description	Valeur
name	Nom de la ressource Découvrez comment définir des noms et des types pour des ressources enfants dans Bicep.	chaîne (obligatoire)
location	Emplacement géographique où réside la ressource	chaîne (obligatoire)
tags	Balises de ressource.	Dictionnaire de noms et de valeurs d’étiquettes. Voir Balises dans les modèles
sku	Détails de la référence Sku requis pour le contrat ARM pour la mise à l’échelle automatique.	Sku
kind	Métadonnées utilisées par le portail/les outils/etc pour afficher différentes expériences d’expérience utilisateur pour des ressources du même type.	string
parent	Dans Bicep, vous pouvez spécifier la ressource parente pour une ressource enfant. Vous devez uniquement ajouter cette propriété lorsque la ressource enfant est déclarée en dehors de la ressource parente. Pour plus d’informations, consultez Ressource enfant en dehors de la ressource parente.	Nom symbolique de la ressource de type : onlineEndpoints
identité	Identité de service managée (identités attribuées par le système et/ou attribuées par l’utilisateur)	ManagedServiceIdentity
properties	[Obligatoire] Attributs supplémentaires de l’entité.	OnlineDeploymentProperties (obligatoire)

ManagedServiceIdentity

Nom	Description	Valeur
type	Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés).	'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obligatoire)
userAssignedIdentities	Ensemble d’identités affectées par l’utilisateur associées à la ressource. Les clés de dictionnaire userAssignedIdentities seront des ID de ressource ARM au format « /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Les valeurs du dictionnaire peuvent être des objets vides ({}) dans les requêtes.	UserAssignedIdentities

UserAssignedIdentities

Nom	Description	Valeur
{propriété personnalisée}		userAssignedIdentity

userAssignedIdentity

Cet objet ne contient aucune propriété à définir pendant le déploiement. Toutes les propriétés sont ReadOnly.

OnlineDeploymentProperties

Nom	Description	Valeur
appInsightsEnabled	Si la valeur est true, active la journalisation Application Insights.	bool
codeConfiguration	Configuration du code pour le déploiement du point de terminaison.	CodeConfiguration
dataCollector	La configuration mdc, nous désactivons mdc quand elle est null.	DataCollector
description	Description du déploiement du point de terminaison.	string
egressPublicNetworkAccess	Si activé, autorisez l’accès au réseau public de sortie. Si cette option est désactivée, cela crée une sortie sécurisée. Par défaut : Activé.	'Désactivé' 'Enabled'
environmentId	ID de ressource ARM de la spécification de l’environnement pour le déploiement du point de terminaison.	string
environmentVariables	Configuration des variables d’environnement pour le déploiement.	EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType	Type de instance de calcul.	string
livenessProbe	La probe liveness supervise régulièrement l’intégrité du conteneur.	ProbeSettings
model	Chemin d’uri du modèle.	string
modelMountPath	Chemin d’accès pour monter le modèle dans un conteneur personnalisé.	string
properties	Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées.	EndpointDeploymentPropertiesBaseProperties
readinessProbe	La probe readiness valide si le conteneur est prêt à traiter le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la probe liveness.	ProbeSettings
requestSettings	Paramètres de demande pour le déploiement.	OnlineRequestSettings
scaleSettings	Paramètres de mise à l’échelle pour le déploiement. S’il est null ou non fourni, La valeur par défaut est TargetUtilizationScaleSettings pour KubernetesOnlineDeployment et à DefaultScaleSettings pour ManagedOnlineDeployment.	OnlineScaleSettings
endpointComputeType	Définir le type d’objet	Kubernetes Géré (obligatoire)

CodeConfiguration

Nom	Description	Valeur
codeId	ID de ressource ARM de la ressource de code.	string
scoringScript	[Obligatoire] Script à exécuter au démarrage. par exemple « score.py »	string (obligatoire) Contraintes : Longueur minimale = 1 Modèle = `[a-zA-Z0-9_]`

DataCollector

Nom	Description	Valeur
collections	[Obligatoire] Configuration du regroupement. Chaque collection a sa propre configuration pour collecter des données de modèle et le nom de la collection peut être une chaîne arbitraire. Le collecteur de données de modèle peut être utilisé pour la journalisation de la charge utile ou la journalisation personnalisée, ou pour les deux. La demande et la réponse de collecte sont réservées à la journalisation de la charge utile, tandis que d’autres sont destinées à la journalisation personnalisée.	DataCollectorCollections (obligatoire)
requestLogging	La configuration de la journalisation des demandes pour mdc inclut des paramètres de journalisation avancés pour tous les regroupements. Ceci est facultatif.	RequestLogging
rollingRate	Lorsque des données de modèle sont collectées dans le stockage d’objets blob, nous devons les déployer sur un autre chemin d’accès pour éviter toute journalisation dans un seul fichier blob. Si le taux de roulement est l’heure, toutes les données sont collectées dans le chemin d’accès de l’objet blob /aaaa/MM/jj/HH/. Si c’est le jour, toutes les données sont collectées dans le chemin d’objet blob /aaaa/MM/jj/. L’autre avantage du chemin propagé est que l’interface utilisateur de surveillance du modèle est en mesure de sélectionner très rapidement un intervalle de temps de données.	'Day' 'Hour' 'Minute' 'Month' 'Year'

DataCollectorCollections

Nom	Description	Valeur
{propriété personnalisée}		Collection

Collection

Nom	Description	Valeur
clientId	ID client msi utilisé pour collecter la journalisation dans le stockage d’objets blob. S’il est null, le serveur principal sélectionne une identité de point de terminaison inscrite pour l’authentification.	string
dataCollectionMode	Activer ou désactiver la collecte de données.	'Désactivé' 'Enabled'
dataId	ID de ressource arm de la ressource de la ressource. Côté client, la ressource de données pointe vers le stockage d’objets blob, et le serveur principal collecte les données vers le stockage d’objets blob.	string
samplingRate	Taux d’échantillonnage pour la collecte. Le taux d’échantillonnage 1.0 signifie que nous collectons 100 % des données par défaut.	int

RequestLogging

Nom	Description	Valeur
captureHeaders	Pour la journalisation de la charge utile, nous collectons uniquement la charge utile par défaut. Si les clients souhaitent également collecter les en-têtes spécifiés, ils peuvent les définir dans captureHeaders afin que le serveur principal collecte ces en-têtes avec la charge utile.	string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nom	Description	Valeur
{propriété personnalisée}		string
{propriété personnalisée}		string

ProbeSettings

Nom	Description	Valeur
failureThreshold	Nombre d’échecs à autoriser avant de retourner un status non sain.	int
initialDelay	Délai avant la première sonde au format ISO 8601.	string
period	Durée entre les sondes au format ISO 8601.	string
successThreshold	Nombre de sondes réussies avant de retourner un status sain.	int
timeout	Délai d’expiration de la sonde au format ISO 8601.	string

EndpointDeploymentPropertiesBaseProperties

Nom	Description	Valeur
{propriété personnalisée}		string
{propriété personnalisée}		string

OnlineRequestSettings

Nom	Description	Valeur
maxConcurrentRequestsPerInstance	Nombre maximal de requêtes simultanées par nœud autorisées par déploiement. La valeur par défaut est de 1.	int
maxQueueWait	Durée maximale pendant laquelle une demande reste dans la file d’attente au format ISO 8601. La valeur par défaut est 500 ms.	string
requestTimeout	Délai d’expiration du scoring au format ISO 8601. La valeur par défaut est 5 000 ms.	string

OnlineScaleSettings

Nom	Description	Valeur
scaleType	Définir le type d’objet	Par défaut TargetUtilization (obligatoire)

DefaultScaleSettings

Nom	Description	Valeur
scaleType	[Obligatoire] Type d’algorithme de mise à l’échelle du déploiement	'Default' (obligatoire)

TargetUtilizationScaleSettings

Nom	Description	Valeur
scaleType	[Obligatoire] Type d’algorithme de mise à l’échelle du déploiement	'TargetUtilization' (obligatoire)
maxInstances	Nombre maximal d’instances possibles pour la mise à l’échelle du déploiement. Le quota sera réservé à max_instances.	int
minInstances	Nombre minimal d’instances devant toujours être présentes.	int
pollingInterval	Intervalle d’interrogation au format ISO 8691. Prend uniquement en charge la durée avec une précision aussi faible que secondes.	string
targetUtilizationPercentage	Utilisation du processeur cible pour le générateur de mise à l’échelle automatique.	int

KubernetesOnlineDeployment

Nom	Description	Valeur
endpointComputeType	[Obligatoire] Type de calcul du point de terminaison.	'Kubernetes' (obligatoire)
containerResourceRequirements	Exigences en ressources pour le conteneur (processeur et mémoire).	ContainerResourceRequirements

ContainerResourceRequirements

Nom	Description	Valeur
containerResourceLimits	Informations sur la limite de ressources de conteneur :	ContainerResourceSettings
containerResourceRequests	Informations sur la demande de ressource de conteneur :	ContainerResourceSettings

ContainerResourceSettings

Nom	Description	Valeur
cpu	Nombre de demandes/limites de processeurs virtuels pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string
gpu	Nombre de demandes/limites de cartes GPU Nvidia pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string
mémoire	Demande/limite de taille de mémoire pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string

ManagedOnlineDeployment

Nom	Description	Valeur
endpointComputeType	[Obligatoire] Type de calcul du point de terminaison.	'Managed' (obligatoire)

Sku

Nom	Description	Valeur
capacité	Si la référence SKU prend en charge le scale-out/in, l’entier de capacité doit être inclus. Si un scale-out/scale-in n’est pas possible pour la ressource, cela peut être omis.	int
famille	Si le service a différentes générations de matériel, pour la même référence SKU, cela peut être capturé ici.	string
name	Nom de la référence SKU. Ex - P3. Il s’agit généralement d’un code lettre+nombre	string (obligatoire)
taille	Taille de la référence SKU. Lorsque le champ name est la combinaison du niveau et d’une autre valeur, il s’agit du code autonome.	string
Niveau	Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas requis sur un PUT.	'De base' 'Gratuit' 'Premium' 'Standard'

Définition de ressources de modèle ARM

Le type de ressource workspaces/onlineEndpoints/deployments peut être déployé avec des opérations qui ciblent :

Groupes de ressources - Voir commandes de déploiement de groupe de ressources

Pour obtenir la liste des propriétés modifiées dans chaque version d’API, consultez journal des modifications.

Format des ressources

Pour créer une ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, ajoutez le code JSON suivant à votre modèle.

{
  "type": "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments",
  "apiVersion": "2023-06-01-preview",
  "name": "string",
  "location": "string",
  "tags": {
    "tagName1": "tagValue1",
    "tagName2": "tagValue2"
  },
  "sku": {
    "capacity": "int",
    "family": "string",
    "name": "string",
    "size": "string",
    "tier": "string"
  },
  "kind": "string",
  "identity": {
    "type": "string",
    "userAssignedIdentities": {
      "{customized property}": {}
    }
  },
  "properties": {
    "appInsightsEnabled": "bool",
    "codeConfiguration": {
      "codeId": "string",
      "scoringScript": "string"
    },
    "dataCollector": {
      "collections": {
        "{customized property}": {
          "clientId": "string",
          "dataCollectionMode": "string",
          "dataId": "string",
          "samplingRate": "int"
        }
      },
      "requestLogging": {
        "captureHeaders": [ "string" ]
      },
      "rollingRate": "string"
    },
    "description": "string",
    "egressPublicNetworkAccess": "string",
    "environmentId": "string",
    "environmentVariables": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "instanceType": "string",
    "livenessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "model": "string",
    "modelMountPath": "string",
    "properties": {
      "{customized property}": "string",
      "{customized property}": "string"
    },
    "readinessProbe": {
      "failureThreshold": "int",
      "initialDelay": "string",
      "period": "string",
      "successThreshold": "int",
      "timeout": "string"
    },
    "requestSettings": {
      "maxConcurrentRequestsPerInstance": "int",
      "maxQueueWait": "string",
      "requestTimeout": "string"
    },
    "scaleSettings": {
      "scaleType": "string"
      // For remaining properties, see OnlineScaleSettings objects
    },
    "endpointComputeType": "string"
    // For remaining properties, see OnlineDeploymentProperties objects
  }
}

Objets OnlineDeploymentProperties

Définissez la propriété endpointComputeType pour spécifier le type d’objet.

Pour Kubernetes, utilisez :

  "endpointComputeType": "Kubernetes",
  "containerResourceRequirements": {
    "containerResourceLimits": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    },
    "containerResourceRequests": {
      "cpu": "string",
      "gpu": "string",
      "memory": "string"
    }
  }

Pour Géré, utilisez :

  "endpointComputeType": "Managed"

Objets OnlineScaleSettings

Définissez la propriété scaleType pour spécifier le type d’objet.

Pour Par défaut, utilisez :

  "scaleType": "Default"

Pour TargetUtilization, utilisez :

  "scaleType": "TargetUtilization",
  "maxInstances": "int",
  "minInstances": "int",
  "pollingInterval": "string",
  "targetUtilizationPercentage": "int"

Valeurs de propriétés

workspaces/onlineEndpoints/deployments

Nom	Description	Valeur
type	Type de ressource	« Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments »
apiVersion	Version de l’API de ressource	« 2023-06-01-preview »
name	Nom de la ressource Découvrez comment définir des noms et des types pour des ressources enfants dans des modèles ARM JSON.	chaîne (obligatoire)
location	Emplacement géographique où réside la ressource	chaîne (obligatoire)
tags	Balises de ressource.	Dictionnaire de noms et de valeurs d’étiquettes. Voir Balises dans les modèles
sku	Détails de la référence Sku requis pour le contrat ARM pour la mise à l’échelle automatique.	Sku
kind	Métadonnées utilisées par le portail/les outils/etc pour afficher différentes expériences d’expérience utilisateur pour des ressources du même type.	string
identité	Identité de service managée (identités attribuées par le système et/ou attribuées par l’utilisateur)	ManagedServiceIdentity
properties	[Obligatoire] Attributs supplémentaires de l’entité.	OnlineDeploymentProperties (obligatoire)

ManagedServiceIdentity

Nom	Description	Valeur
type	Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés).	'None' 'SystemAssigned' 'SystemAssigned,UserAssigned' 'UserAssigned' (obligatoire)
userAssignedIdentities	Ensemble d’identités affectées par l’utilisateur associées à la ressource. Les clés de dictionnaire userAssignedIdentities seront des ID de ressource ARM au format « /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Les valeurs du dictionnaire peuvent être des objets vides ({}) dans les requêtes.	UserAssignedIdentities

UserAssignedIdentities

Nom	Description	Valeur
{propriété personnalisée}		userAssignedIdentity

userAssignedIdentity

Cet objet ne contient aucune propriété à définir pendant le déploiement. Toutes les propriétés sont ReadOnly.

OnlineDeploymentProperties

Nom	Description	Valeur
appInsightsEnabled	Si la valeur est true, active la journalisation Application Insights.	bool
codeConfiguration	Configuration du code pour le déploiement du point de terminaison.	CodeConfiguration
dataCollector	La configuration mdc, nous désactivons mdc quand elle est null.	DataCollector
description	Description du déploiement du point de terminaison.	string
egressPublicNetworkAccess	Si activé, autorisez l’accès au réseau public de sortie. Si cette option est désactivée, cela crée une sortie sécurisée. Par défaut : activé.	'Désactivé' 'Enabled'
environmentId	ID de ressource ARM de la spécification d’environnement pour le déploiement du point de terminaison.	string
environmentVariables	Configuration des variables d’environnement pour le déploiement.	EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType	Type de instance de calcul.	string
livenessProbe	La probe liveness supervise régulièrement l’intégrité du conteneur.	ProbeSettings
model	Chemin d’uri du modèle.	string
modelMountPath	Chemin d’accès pour monter le modèle dans un conteneur personnalisé.	string
properties	Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées.	EndpointDeploymentPropertiesBaseProperties
readinessProbe	La probe readiness valide si le conteneur est prêt à traiter le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la probe liveness.	ProbeSettings
requestSettings	Paramètres de demande pour le déploiement.	OnlineRequestSettings
scaleSettings	Paramètres de mise à l’échelle pour le déploiement. S’il est null ou non fourni, La valeur par défaut est TargetUtilizationScaleSettings pour KubernetesOnlineDeployment et à DefaultScaleSettings pour ManagedOnlineDeployment.	OnlineScaleSettings
endpointComputeType	Définir le type d’objet	Kubernetes Géré (obligatoire)

CodeConfiguration

Nom	Description	Valeur
codeId	ID de ressource ARM de la ressource de code.	string
scoringScript	[Obligatoire] Script à exécuter au démarrage. par exemple « score.py »	string (obligatoire) Contraintes : Longueur minimale = 1 Modèle = `[a-zA-Z0-9_]`

DataCollector

Nom	Description	Valeur
collections	[Obligatoire] Configuration du regroupement. Chaque collection a sa propre configuration pour collecter des données de modèle et le nom de la collection peut être une chaîne arbitraire. Le collecteur de données de modèle peut être utilisé pour la journalisation de la charge utile ou la journalisation personnalisée, ou pour les deux. La demande et la réponse de collecte sont réservées à la journalisation de la charge utile, tandis que d’autres sont destinées à la journalisation personnalisée.	DataCollectorCollections (obligatoire)
requestLogging	La configuration de la journalisation des demandes pour mdc inclut des paramètres de journalisation avancés pour tous les regroupements. Ceci est facultatif.	RequestLogging
rollingRate	Lorsque des données de modèle sont collectées dans le stockage d’objets blob, nous devons les déployer sur un autre chemin d’accès pour éviter toute journalisation dans un seul fichier blob. Si le taux de roulement est l’heure, toutes les données sont collectées dans le chemin d’accès de l’objet blob /aaaa/MM/jj/HH/. Si c’est le jour, toutes les données sont collectées dans le chemin d’objet blob /aaaa/MM/jj/. L’autre avantage du chemin propagé est que l’interface utilisateur de surveillance du modèle est en mesure de sélectionner très rapidement un intervalle de temps de données.	'Day' 'Hour' 'Minute' 'Month' 'Year'

DataCollectorCollections

Nom	Description	Valeur
{propriété personnalisée}		Collection

Collection

Nom	Description	Valeur
clientId	ID client msi utilisé pour collecter la journalisation dans le stockage d’objets blob. S’il est null, le serveur principal sélectionne une identité de point de terminaison inscrite pour l’authentification.	string
dataCollectionMode	Activer ou désactiver la collecte de données.	'Désactivé' 'Enabled'
dataId	ID de ressource arm de la ressource de la ressource. Côté client, la ressource de données pointe vers le stockage d’objets blob, et le serveur principal collecte les données vers le stockage d’objets blob.	string
samplingRate	Taux d’échantillonnage pour la collecte. Le taux d’échantillonnage 1.0 signifie que nous collectons 100 % des données par défaut.	int

RequestLogging

Nom	Description	Valeur
captureHeaders	Pour la journalisation de la charge utile, nous collectons uniquement la charge utile par défaut. Si les clients souhaitent également collecter les en-têtes spécifiés, ils peuvent les définir dans captureHeaders afin que le serveur principal collecte ces en-têtes avec la charge utile.	string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nom	Description	Valeur
{propriété personnalisée}		string
{propriété personnalisée}		string

ProbeSettings

Nom	Description	Valeur
failureThreshold	Nombre d’échecs à autoriser avant de retourner un status non sain.	int
initialDelay	Délai avant la première sonde au format ISO 8601.	string
period	Durée entre les sondes au format ISO 8601.	string
successThreshold	Nombre de sondes réussies avant de retourner un status sain.	int
timeout	Délai d’expiration de la sonde au format ISO 8601.	string

EndpointDeploymentPropertiesBaseProperties

Nom	Description	Valeur
{propriété personnalisée}		string
{propriété personnalisée}		string

OnlineRequestSettings

Nom	Description	Valeur
maxConcurrentRequestsPerInstance	Nombre maximal de requêtes simultanées par nœud autorisées par déploiement. La valeur par défaut est de 1.	int
maxQueueWait	Durée maximale pendant laquelle une demande reste dans la file d’attente au format ISO 8601. La valeur par défaut est 500 ms.	string
requestTimeout	Délai d’expiration du scoring au format ISO 8601. La valeur par défaut est 5 000 ms.	string

OnlineScaleSettings

Nom	Description	Valeur
scaleType	Définir le type d’objet	Par défaut TargetUtilization (obligatoire)

DefaultScaleSettings

Nom	Description	Valeur
scaleType	[Obligatoire] Type d’algorithme de mise à l’échelle du déploiement	'Default' (obligatoire)

TargetUtilizationScaleSettings

Nom	Description	Valeur
scaleType	[Obligatoire] Type d’algorithme de mise à l’échelle du déploiement	'TargetUtilization' (obligatoire)
maxInstances	Nombre maximal d’instances possibles pour la mise à l’échelle du déploiement. Le quota sera réservé à max_instances.	int
minInstances	Nombre minimal d’instances devant toujours être présentes.	int
pollingInterval	Intervalle d’interrogation au format ISO 8691. Prend uniquement en charge la durée avec une précision aussi faible que secondes.	string
targetUtilizationPercentage	Utilisation du processeur cible pour le générateur de mise à l’échelle automatique.	int

KubernetesOnlineDeployment

Nom	Description	Valeur
endpointComputeType	[Obligatoire] Type de calcul du point de terminaison.	'Kubernetes' (obligatoire)
containerResourceRequirements	Exigences en ressources pour le conteneur (processeur et mémoire).	ContainerResourceRequirements

ContainerResourceRequirements

Nom	Description	Valeur
containerResourceLimits	Informations sur la limite de ressources de conteneur :	ContainerResourceSettings
containerResourceRequests	Informations sur la demande de ressource de conteneur :	ContainerResourceSettings

ContainerResourceSettings

Nom	Description	Valeur
cpu	Nombre de demandes/limites de processeurs virtuels pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string
gpu	Nombre de demandes/limites de cartes GPU Nvidia pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string
mémoire	Demande/limite de taille de mémoire pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string

ManagedOnlineDeployment

Nom	Description	Valeur
endpointComputeType	[Obligatoire] Type de calcul du point de terminaison.	'Managed' (obligatoire)

Sku

Nom	Description	Valeur
capacité	Si la référence SKU prend en charge le scale-out/in, l’entier de capacité doit être inclus. Si le scale-out/in n’est pas possible pour la ressource, cela peut être omis.	int
famille	Si le service a différentes générations de matériel, pour la même référence SKU, cela peut être capturé ici.	string
name	Nom de la référence SKU. Ex - P3. Il s’agit généralement d’un code lettre+nombre	chaîne (obligatoire)
taille	Taille de la référence SKU. Lorsque le champ de nom est la combinaison du niveau et d’une autre valeur, il s’agit du code autonome.	string
Niveau	Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas obligatoire sur un PUT.	'De base' 'Gratuit' 'Premium' 'Standard'

Définition de ressource Terraform (fournisseur AzAPI)

Le type de ressource workspaces/onlineEndpoints/deployments peut être déployé avec des opérations qui ciblent :

Groupes de ressources

Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.

Format des ressources

Pour créer une ressource Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments, ajoutez le Terraform suivant à votre modèle.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview"
  name = "string"
  location = "string"
  parent_id = "string"
  tags = {
    tagName1 = "tagValue1"
    tagName2 = "tagValue2"
  }
  identity {
    type = "string"
    identity_ids = []
  }
  body = jsonencode({
    properties = {
      appInsightsEnabled = bool
      codeConfiguration = {
        codeId = "string"
        scoringScript = "string"
      }
      dataCollector = {
        collections = {
          {customized property} = {
            clientId = "string"
            dataCollectionMode = "string"
            dataId = "string"
            samplingRate = int
          }
        }
        requestLogging = {
          captureHeaders = [
            "string"
          ]
        }
        rollingRate = "string"
      }
      description = "string"
      egressPublicNetworkAccess = "string"
      environmentId = "string"
      environmentVariables = {
        {customized property} = "string"
        {customized property} = "string"
      }
      instanceType = "string"
      livenessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      model = "string"
      modelMountPath = "string"
      properties = {
        {customized property} = "string"
        {customized property} = "string"
      }
      readinessProbe = {
        failureThreshold = int
        initialDelay = "string"
        period = "string"
        successThreshold = int
        timeout = "string"
      }
      requestSettings = {
        maxConcurrentRequestsPerInstance = int
        maxQueueWait = "string"
        requestTimeout = "string"
      }
      scaleSettings = {
        scaleType = "string"
        // For remaining properties, see OnlineScaleSettings objects
      }
      endpointComputeType = "string"
      // For remaining properties, see OnlineDeploymentProperties objects
    }
    sku = {
      capacity = int
      family = "string"
      name = "string"
      size = "string"
      tier = "string"
    }
    kind = "string"
  })
}

Objets OnlineDeploymentProperties

Définissez la propriété endpointComputeType pour spécifier le type d’objet.

Pour Kubernetes, utilisez :

  endpointComputeType = "Kubernetes"
  containerResourceRequirements = {
    containerResourceLimits = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
    containerResourceRequests = {
      cpu = "string"
      gpu = "string"
      memory = "string"
    }
  }

Pour Géré, utilisez :

  endpointComputeType = "Managed"

Objets OnlineScaleSettings

Définissez la propriété scaleType pour spécifier le type d’objet.

Pour Par défaut, utilisez :

  scaleType = "Default"

Pour TargetUtilization, utilisez :

  scaleType = "TargetUtilization"
  maxInstances = int
  minInstances = int
  pollingInterval = "string"
  targetUtilizationPercentage = int

Valeurs de propriétés

workspaces/onlineEndpoints/deployments

Nom	Description	Valeur
type	Type de ressource	« Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments@2023-06-01-preview »
name	Nom de la ressource	chaîne (obligatoire)
location	Emplacement géographique où réside la ressource	chaîne (obligatoire)
parent_id	ID de la ressource qui est le parent de cette ressource.	ID pour la ressource de type : onlineEndpoints
tags	Balises de ressource.	Dictionnaire de noms et de valeurs d’étiquettes.
sku	Détails de la référence Sku requis pour le contrat ARM pour la mise à l’échelle automatique.	Sku
kind	Métadonnées utilisées par le portail/les outils/etc pour afficher différentes expériences d’expérience utilisateur pour des ressources du même type.	string
identité	Identité de service managée (identités attribuées par le système et/ou attribuées par l’utilisateur)	ManagedServiceIdentity
properties	[Obligatoire] Attributs supplémentaires de l’entité.	OnlineDeploymentProperties (obligatoire)

ManagedServiceIdentity

Nom	Description	Valeur
type	Type d’identité de service managé (où les types SystemAssigned et UserAssigned sont autorisés).	« SystemAssigned » « SystemAssigned,UserAssigned » « UserAssigned » (obligatoire)
identity_ids	Ensemble d’identités affectées par l’utilisateur associées à la ressource. Les clés de dictionnaire userAssignedIdentities seront des ID de ressource ARM au format « /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{identityName}. Les valeurs du dictionnaire peuvent être des objets vides ({}) dans les requêtes.	Tableau d’ID d’identité utilisateur.

UserAssignedIdentities

Nom	Description	Valeur
{propriété personnalisée}		userAssignedIdentity

userAssignedIdentity

Cet objet ne contient aucune propriété à définir pendant le déploiement. Toutes les propriétés sont ReadOnly.

OnlineDeploymentProperties

Nom	Description	Valeur
appInsightsEnabled	Si la valeur est true, active la journalisation Application Insights.	bool
codeConfiguration	Configuration du code pour le déploiement du point de terminaison.	CodeConfiguration
dataCollector	La configuration mdc, nous désactivons mdc quand elle est null.	DataCollector
description	Description du déploiement du point de terminaison.	string
egressPublicNetworkAccess	Si activé, autorisez l’accès au réseau public de sortie. Si cette option est désactivée, cela crée une sortie sécurisée. Par défaut : activé.	« Désactivé » « Activé »
environmentId	ID de ressource ARM de la spécification d’environnement pour le déploiement du point de terminaison.	string
environmentVariables	Configuration des variables d’environnement pour le déploiement.	EndpointDeploymentPropertiesBaseEnvironmentVariables
instanceType	Type de instance de calcul.	string
livenessProbe	La probe liveness supervise régulièrement l’intégrité du conteneur.	ProbeSettings
model	Chemin d’uri du modèle.	string
modelMountPath	Chemin d’accès pour monter le modèle dans un conteneur personnalisé.	string
properties	Dictionnaire de propriétés. Les propriétés peuvent être ajoutées, mais pas supprimées ou modifiées.	EndpointDeploymentPropertiesBaseProperties
readinessProbe	La probe readiness valide si le conteneur est prêt à traiter le trafic. Les propriétés et les valeurs par défaut sont identiques à celles de la probe liveness.	ProbeSettings
requestSettings	Paramètres de demande pour le déploiement.	OnlineRequestSettings
scaleSettings	Paramètres de mise à l’échelle pour le déploiement. S’il est null ou non fourni, il est défini par défaut sur TargetUtilizationScaleSettings pour KubernetesOnlineDeployment et à DefaultScaleSettings pour ManagedOnlineDeployment.	OnlineScaleSettings
endpointComputeType	Définir le type d’objet	Kubernetes Managé (obligatoire)

CodeConfiguration

Nom	Description	Valeur
codeId	ID de ressource ARM de la ressource de code.	string
scoringScript	[Obligatoire] Script à exécuter au démarrage. par exemple « score.py »	chaîne (obligatoire) Contraintes : Longueur minimale = 1 Modèle = `[a-zA-Z0-9_]`

DataCollector

Nom	Description	Valeur
collections	[Obligatoire] Configuration de la collection. Chaque collection a sa propre configuration pour collecter des données de modèle et le nom de la collection peut être une chaîne arbitraire. Le collecteur de données de modèle peut être utilisé pour la journalisation de charge utile ou la journalisation personnalisée, ou pour les deux. La demande de collecte et la réponse sont réservées à la journalisation de la charge utile, tandis que d’autres sont destinées à la journalisation personnalisée.	DataCollectorCollections (obligatoire)
requestLogging	Configuration de journalisation des requêtes pour mdc, elle inclut des paramètres de journalisation avancés pour toutes les collections. Ceci est facultatif.	RequestLogging
rollingRate	Lorsque des données de modèle sont collectées dans le stockage d’objets blob, nous devons les déployer sur un chemin d’accès différent pour éviter toute journalisation dans un seul fichier blob. Si le taux de roulement est l’heure, toutes les données sont collectées dans le chemin d’accès de l’objet blob /aaaa/MM/jj/HH/. Si c’est le jour, toutes les données sont collectées dans le chemin d’objet blob /aaaa/MM/jj/. L’autre avantage du chemin propagé est que l’interface utilisateur de surveillance du modèle est en mesure de sélectionner très rapidement un intervalle de temps de données.	« Jour » « Hour » « Minute » « Mois » « Année »

DataCollectorCollections

Nom	Description	Valeur
{propriété personnalisée}		Collection

Collection

Nom	Description	Valeur
clientId	ID client msi utilisé pour collecter la journalisation dans le stockage d’objets blob. S’il est null, le serveur principal sélectionne une identité de point de terminaison inscrite pour l’authentification.	string
dataCollectionMode	Activer ou désactiver la collecte de données.	« Désactivé » « Activé »
dataId	ID de ressource arm de la ressource de la ressource. Côté client, la ressource de données pointe vers le stockage d’objets blob, et le serveur principal collecte les données vers le stockage d’objets blob.	string
samplingRate	Taux d’échantillonnage pour la collecte. Le taux d’échantillonnage 1.0 signifie que nous collectons 100 % des données par défaut.	int

RequestLogging

Nom	Description	Valeur
captureHeaders	Pour la journalisation de la charge utile, nous collectons uniquement la charge utile par défaut. Si les clients souhaitent également collecter les en-têtes spécifiés, ils peuvent les définir dans captureHeaders afin que le serveur principal collecte ces en-têtes avec la charge utile.	string[]

EndpointDeploymentPropertiesBaseEnvironmentVariables

Nom	Description	Valeur
{propriété personnalisée}		string
{propriété personnalisée}		string

ProbeSettings

Nom	Description	Valeur
failureThreshold	Nombre d’échecs à autoriser avant de retourner un status non sain.	int
initialDelay	Délai avant la première sonde au format ISO 8601.	string
period	Durée entre les sondes au format ISO 8601.	string
successThreshold	Nombre de sondes réussies avant de retourner un status sain.	int
timeout	Délai d’expiration de la sonde au format ISO 8601.	string

EndpointDeploymentPropertiesBaseProperties

Nom	Description	Valeur
{propriété personnalisée}		string
{propriété personnalisée}		string

OnlineRequestSettings

Nom	Description	Valeur
maxConcurrentRequestsPerInstance	Nombre maximal de requêtes simultanées par nœud autorisées par déploiement. La valeur par défaut est de 1.	int
maxQueueWait	Durée maximale pendant laquelle une demande reste dans la file d’attente au format ISO 8601. La valeur par défaut est 500 ms.	string
requestTimeout	Délai d’expiration du scoring au format ISO 8601. La valeur par défaut est 5 000 ms.	string

OnlineScaleSettings

Nom	Description	Valeur
scaleType	Définir le type d’objet	Par défaut TargetUtilization (obligatoire)

DefaultScaleSettings

Nom	Description	Valeur
scaleType	[Obligatoire] Type d’algorithme de mise à l’échelle de déploiement	« Default » (obligatoire)

TargetUtilizationScaleSettings

Nom	Description	Valeur
scaleType	[Obligatoire] Type d’algorithme de mise à l’échelle de déploiement	« TargetUtilization » (obligatoire)
maxInstances	Nombre maximal d’instances possibles pour la mise à l’échelle du déploiement. Le quota sera réservé à max_instances.	int
minInstances	Nombre minimal d’instances devant toujours être présentes.	int
pollingInterval	Intervalle d’interrogation au format ISO 8691. Prend uniquement en charge la durée avec une précision aussi faible que secondes.	string
targetUtilizationPercentage	Utilisation du processeur cible pour le générateur de mise à l’échelle automatique.	int

KubernetesOnlineDeployment

Nom	Description	Valeur
endpointComputeType	[Obligatoire] Type de calcul du point de terminaison.	« Kubernetes » (obligatoire)
containerResourceRequirements	Exigences en ressources pour le conteneur (processeur et mémoire).	ContainerResourceRequirements

ContainerResourceRequirements

Nom	Description	Valeur
containerResourceLimits	Informations sur la limite des ressources de conteneur :	ContainerResourceSettings
containerResourceRequests	Informations sur la demande de ressource de conteneur :	ContainerResourceSettings

ContainerResourceSettings

Nom	Description	Valeur
cpu	Nombre de demandes/limite de processeurs virtuels pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string
gpu	Nombre de cartes GPU Nvidia demande/limite pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string
mémoire	Demande/limite de taille de mémoire pour le conteneur. Informations supplémentaires : https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/	string

ManagedOnlineDeployment

Nom	Description	Valeur
endpointComputeType	[Obligatoire] Type de calcul du point de terminaison.	« Managé » (obligatoire)

Sku

Nom	Description	Valeur
capacité	Si la référence SKU prend en charge le scale-out/in, l’entier de capacité doit être inclus. Si le scale-out/in n’est pas possible pour la ressource, cela peut être omis.	int
famille	Si le service a différentes générations de matériel, pour la même référence SKU, cela peut être capturé ici.	string
name	Nom de la référence SKU. Ex - P3. Il s’agit généralement d’un code lettre+nombre	chaîne (obligatoire)
taille	Taille de la référence SKU. Lorsque le champ de nom est la combinaison du niveau et d’une autre valeur, il s’agit du code autonome.	string
Niveau	Ce champ doit être implémenté par le fournisseur de ressources si le service a plusieurs niveaux, mais n’est pas obligatoire sur un PUT.	"Basic" « Gratuit » « Premium » « Standard »