Guide de MLflow

MLflow est une plateforme open source qui permet de gérer le cycle de vie du machine learning de bout en bout. Ses principaux composants sont les suivants :

  • Suivi : vous permet d’effectuer le suivi des expériences pour enregistrer et comparer les paramètres et les résultats.
  • Modèles : vous permettent de gérer et déployer des modèles de diverses bibliothèques ML sur de nombreuses plateformes d’inférence et d’utilisation de modèles.
  • Projets : vous permettent de créer un package de code ML dans un format réutilisable et reproductible en vue de le partager avec d’autres scientifiques des données ou de le passer en production.
  • Registre de modèles : Permet de centraliser un magasin de modèles pour la gestion des transitions d’étapes du cycle de vie complet des modèles : de l’environnement intermédiaire à la production, avec des fonctionnalités de contrôle de version et d’annotation.
  • Model Serving : Vous permet d’héberger les modèles MLflow en tant que points de terminaison REST.

Azure Databricks fournit une version complètement managée et hébergée de MLflow, qui intègre des fonctionnalités de sécurité d’entreprise, une haute disponibilité et d’autres fonctionnalités d’espace de travail Azure Databricks telles que la gestion des expérimentations et des exécutions ainsi que la capture des révisions de notebook. MLflow sur Azure Databricks offre une expérience intégrée pour le suivi et la sécurisation des exécutions d’entraînement des modèles Machine Learning et des projets de machine learning exécutés.

Les utilisateurs doivent commencer par le guide de démarrage rapide, qui illustre les API de suivi MLflow élémentaires. Les autres articles présentent chacun des composants de MLflow avec des exemples de notebooks et expliquent de quelle façon ces composants sont hébergés dans Azure Databricks.

MLflow prend en charge les API Java, Python, R et REST.

Les données MLflow sont chiffrées par Azure Databricks à l’aide d’une clé gérée par la plateforme. Le chiffrement utilisant Activer les clés gérées par le client pour les services managés n’est pas pris en charge.