Modèle Machine Learning dans Microsoft Fabric

Un modèle Machine Learning est un fichier entraîné pour reconnaître certains types de modèles. Vous entraînez un modèle sur un ensemble de données et vous lui fournissez un algorithme qui utilise pour raisonner et apprendre à partir de ce jeu de données. Après avoir entraîné le modèle, vous pouvez l’utiliser pour raisonner des données qu’il n’avait jamais vues auparavant et effectuer des prédictions sur ces données.

Important

Microsoft Fabric est actuellement en préversion. Certaines informations portent sur un produit en préversion susceptible d’être substantiellement modifié avant sa publication. Microsoft ne donne aucune garantie, expresse ou implicite, concernant les informations fournies ici.

Dans MLflow, un modèle Machine Learning peut inclure plusieurs versions de modèle. Ici, chaque version peut représenter une itération de modèle. Dans cet article, vous allez apprendre à interagir avec des modèles Machine Learning pour suivre et comparer les versions des modèles.

Créer un modèle

Dans MLflow, les modèles Machine Learning incluent un format d’empaquetage standard. Ce format permet d’utiliser ces modèles dans divers outils en aval, y compris l’inférence par lots sur Apache Spark. Le format définit une convention pour enregistrer un modèle dans différentes « saveurs » que différents outils en aval peuvent comprendre.

L’expérience utilisateur peut créer directement un modèle Machine Learning à partir de l’expérience utilisateur. L’API MLflow peut également créer directement un modèle Machine Learning.

Pour créer un modèle Machine Learning à partir de l’expérience utilisateur, vous pouvez :

  1. Créez un espace de travail de science des données ou sélectionnez un espace de travail de science des données existant.

  2. Dans la liste déroulante + Nouveau , sélectionnez Modèle. Cela crée un modèle vide dans votre espace de travail de science des données.

    Capture d’écran montrant le menu déroulant Nouveau.

  3. Après la création du modèle, vous pouvez commencer à ajouter des versions de modèle pour suivre les métriques et paramètres d’exécution. Inscrire ou enregistrer des exécutions d’expérience dans un modèle existant.

Vous pouvez également créer une expérience machine learning directement à partir de votre expérience de création avec l’API mlflow.register_model() . Si un modèle inscrit portant le nom donné n’existe pas, l’API le crée automatiquement.

import mlflow

model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")

print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))

Gérer les versions au sein d’un modèle

Un modèle Machine Learning contient une collection de versions de modèle pour un suivi et une comparaison simplifiés. Dans un modèle, un scientifique des données peut naviguer entre différentes versions de modèle pour explorer les paramètres et les métriques sous-jacents. Les scientifiques des données peuvent également effectuer des comparaisons entre les versions de modèles pour déterminer si les modèles plus récents peuvent ou non produire de meilleurs résultats.

Suivre les modèles

Une version de modèle Machine Learning représente un modèle individuel qui a été inscrit pour le suivi.

Capture d’écran montrant l’écran des détails d’un modèle.

Chaque version de modèle comprend les informations suivantes :

  • Heure de création : date et heure de création du modèle.
  • Nom de l’exécution : identificateur de l’exécution de l’expérience utilisé pour créer cette version de modèle spécifique.
  • Hyperparamètres : les hyperparamètres sont enregistrés sous forme de paires clé-valeur. Les clés et les valeurs sont des chaînes.
  • Métriques : exécutez les métriques enregistrées en tant que paires clé-valeur. La valeur est numérique.
  • Schéma/signature de modèle : description des entrées et sorties du modèle.
  • Fichiers enregistrés : fichiers enregistrés dans n’importe quel format. Par exemple, vous pouvez enregistrer des images, un environnement, des modèles et des fichiers de données.

Comparer et filtrer des modèles

Pour comparer et évaluer la qualité des versions de modèle Machine Learning, vous pouvez comparer les paramètres, les métriques et les métadonnées entre les versions sélectionnées.

Comparer visuellement des modèles

Vous pouvez comparer visuellement des exécutions au sein d’un modèle existant. Cela permet de naviguer facilement entre plusieurs versions et de les trier entre elles.

Capture d’écran montrant une liste d’exécutions à des fins de comparaison.

Pour comparer les exécutions, vous pouvez :

  1. Sélectionnez un modèle Machine Learning existant qui contient plusieurs versions.
  2. Sélectionnez l’onglet Affichage , puis accédez à l’affichage liste Modèle . Vous pouvez également sélectionner l’option Afficher la liste des modèles directement à partir de l’affichage des détails.
  3. Vous pouvez personnaliser les colonnes de la table. Développez le volet Personnaliser les colonnes . À partir de là, vous pouvez sélectionner les propriétés, les métriques et les hyperparamètres que vous souhaitez voir.
  4. Enfin, vous pouvez sélectionner plusieurs versions pour comparer leurs résultats dans le volet de comparaison des métriques. À partir de ce volet, vous pouvez personnaliser les graphiques avec des modifications apportées au titre du graphique, au type de visualisation, à l’axe X, à l’axe Y, etc.

Comparer des modèles à l’aide de l’API MLflow

Les scientifiques des données peuvent également utiliser MLflow pour rechercher parmi plusieurs modèles enregistrés dans l’espace de travail. Consultez la documentation MLflow pour explorer d’autres API MLflow pour l’interaction avec le modèle.

from pprint import pprint

client = MlflowClient()
for rm in client.list_registered_models():
    pprint(dict(rm), indent=4)

Appliquer le modèle

Une fois que vous avez entraîné un modèle sur un jeu de données, vous pouvez appliquer ce modèle à des données qu’il n’a jamais vues pour générer des prédictions. Nous appelons ce modèle utiliser la technique de scoring ou d’inférence. Pour plus d’informations sur le scoring de modèle Microsoft Fabric, consultez la section suivante.

Étapes suivantes