Registres Machine Learning pour opérations d’apprentissage automatique (MLOps)

Dans cet article, vous allez apprendre à mettre à l’échelle MLOps dans les environnements de développement, de test et de production. Vos environnements peuvent varier en nombre en fonction de la complexité de votre environnement informatique et sont influencés par des facteurs tels que :

  • Stratégies de sécurité et de conformité : Les environnements de production doivent-ils être isolés des environnements de développement en termes de contrôles d’accès, d’architecture réseau, d’exposition des données, etc. ?
  • Abonnements : vos environnements de développement se trouvent-ils dans un abonnement et des environnements de production dans un autre abonnement ? Souvent, des abonnements distincts sont utilisés pour prendre en compte la facturation, le budget et les objectifs de gestion des coûts.
  • Régions : devez-vous déployer dans différentes régions Azure pour prendre en charge les exigences de latence et de redondance ?

Dans ces scénarios, vous pouvez utiliser différents espaces de travail Azure Machine Learning pour le développement, le test et la production. Cette configuration présente les défis suivants pour la formation et le déploiement des modèles :

  • Vous devez entraîner un modèle dans un espace de travail de développement, mais le déployer sur un point de terminaison dans un espace de travail de production, éventuellement dans un autre abonnement ou région Azure. Dans ce cas, vous devez être en mesure de suivre la tâche de formation. Par exemple, pour analyser les métriques, les journaux, le code, l’environnement et les données utilisés pour former le modèle si vous rencontrez des problèmes de précision ou de performances avec le déploiement de production.
  • Vous devez développer un pipeline de formation avec des données de test ou des données anonymes dans l’espace de travail de développement, mais re-former le modèle avec des données de production dans l’espace de travail de production. Dans ce cas, vous devrez peut-être comparer les métriques de formation sur des exemples et des données de production pour vous assurer que les optimisations de formation fonctionnent correctement avec les données réelles.

MLOps entre plusieurs espaces de travail avec des registres

Les registres, comme un référentiel Git, dissocient les ressources ML des espaces de travail et les hébergent dans un emplacement central, les rendant disponibles pour tous les espaces de travail de votre organisation.

Si vous souhaitez promouvoir des modèles entre les environnements (développement, test, prod), commencez par développer itérativement un modèle dans le développement. Lorsque vous disposez d’un bon modèle candidat, vous pouvez le publier dans un registre. Vous pouvez ensuite déployer le modèle à partir du registre sur des points de terminaison dans différents espaces de travail.

Conseil

Si vous avez déjà des modèles inscrits dans un espace de travail, vous pouvez les promouvoir dans un registre. Vous pouvez également inscrire un modèle directement dans un registre à partir de la sortie d’une tâche de formation.

Si vous souhaitez développer un pipeline dans un espace de travail, puis l’exécuter dans d’autres, commencez par inscrire les composants et les environnements qui forment les blocs de construction du pipeline. Lorsque vous soumettez la tâche du pipeline, l’espace de travail dans lequel il s’exécute est sélectionné par les données de calcul et de formation, qui sont uniques à chaque espace de travail.

Le diagramme suivant illustre la promotion des pipelines entre les espaces de travail exploratoires et de développement, puis la promotion de modèle entre le développement, le test et la production.

Diagramme de l’utilisation du pipeline et du modèle entre les environnements.

Étapes suivantes