Utiliser des exemples d’IA de bout en bout dans Microsoft Fabric

L’expérience software as a service (SaaS) de science des données Synapse dans Microsoft Fabric peut aider les professionnels de l’apprentissage automatique à créer, déployer et opérationnaliser facilement et sans friction leurs modèles Machine Learning dans une plateforme d’analyse unique, tout en collaborant avec d’autres rôles clés. Cet article décrit les fonctionnalités de l’expérience de science des données Synapse et la façon dont les modèles Machine Learning peuvent résoudre les problèmes métier courants.

Installer des bibliothèques Python

Certains échantillons d’IA de bout en bout nécessitent d’autres bibliothèques pour le développement de modèles Machine Learning ou pour l’analyse de données ad hoc. Vous pouvez choisir l’une de ces options pour installer rapidement ces bibliothèques pour votre session Apache Spark.

Utiliser les fonctionnalités d’installation en ligne

Utilisez les capacités d’installation en ligne Python, par exemple %pip ou %conda, dans votre notebook pour installer de nouvelles bibliothèques. Cette option installe les bibliothèques uniquement dans le notebook actuel et non dans l’espace de travail. Utilisez ce code pour installer une bibliothèque. Remplacez <library name> par le nom de votre bibliothèque : imblearn ou wordcloud.

# Use pip to install libraries
%pip install <library name>

# Use conda to install libraries
%conda install <library name>

Définir les bibliothèques par défaut pour l’espace de travail

Afin que vos bibliothèques soient disponibles pour une utilisation dans tous les notebooks de l’espace de travail, vous pouvez utiliser un environnement Fabric. Vous pouvez créer un environnement et y installer la bibliothèque. Ensuite, l’administrateur de votre espace de travail peut attacher l’environnement à l’espace de travail en tant qu’environnement par défaut. Pour plus d’informations sur la définition d’un environnement en tant qu’environnement par défaut de l’espace de travail, consultez L’administrateur définit les bibliothèques par défaut de l’espace de travail.

Important

La gestion des bibliothèques au niveau de l’espace de travail n’est plus prise en charge. Vous pouvez suivre la rubrique « Migrer les bibliothèques et les propriétés Spark d’un espace de travail vers un environnement par défaut » pour migrer les bibliothèques existantes d’un espace de travail vers un environnement et attacher cet espace en tant qu’espace de travail par défaut.

Suivre les tutoriels pour créer des modèles Machine Learning

Ces tutoriels fournissent des exemples de bout en bout pour les scénarios courants.

Attrition clients

Créez un modèle pour prédire l’attrition des clients d’une banque. L’attrition fait référence au taux auquel les clients arrêtent de faire des affaires avec la banque.

Suivez le tutoriel Prédiction de l’attrition clients.

Recommandations

Une librairie en ligne cherche à augmenter ses ventes en fournissant des recommandations personnalisées. À l’aide des données d’évaluation du carnet de clients, vous pouvez développer et déployer un modèle de recommandation pour faire des prédictions.

Suivez le didacticiel Entraîner un modèle de recommandation de vente au détail.

Détection des fraudes

À mesure que les transactions non autorisées augmentent, la détection d’escroqueries aux cartes de crédit en temps réel permet aux institutions financières de fournir aux clients un temps de traitement plus rapide en matière de résolution. Un modèle de détection des fraudes inclut le prétraitement, l’entraînement, le stockage de modèles et l’inférence. La section de formation examine plusieurs modèles et méthodes qui répondent à des problèmes tels que des exemples déséquilibrés et des compromis entre les faux positifs et les faux négatifs.

Suivez le didacticiel Détection des fraudes.

Prévisions

À l’aide de données historiques sur les ventes de biens immobiliers à New York et de Facebook Prophet, construisez un modèle de séries chronologiques avec des informations sur les tendances et la saisonnalité afin de prédire les ventes dans les cycles à venir.

Suivez le tutoriel Prévisions des séries chronologiques.

Classification de texte

Appliquez la classification de texte avec word2vec et un modèle de régression linéaire dans Spark pour prédire si un livre de la British Library est de fiction ou non, en fonction des métadonnées du livre.

Suivez le tutoriel Classification de texte.

Modèle Uplift

Estimez l’impact causal de certains traitements médicaux sur le comportement d’un individu à l’aide d’un modèle Uplift. Quatre domaines essentiels sont abordés dans ces modules :

  • Module de traitement des données : permet d’extraire des fonctionnalités, des traitements et des étiquettes.
  • Module d’entraînement : prédire la différence dans le comportement d’un individu lorsqu’il est traité et lorsqu’il n’est pas traité, avec un modèle Machine Learning classique, par exemple LightGBM.
  • Module de prédiction : permet d’appeler le modèle Uplift pour effectuer des prédictions sur des données de test.
  • Module d’évaluation : permet d’évaluer l’effet du modèle Uplift sur des données de test.

Suivez le tutoriel Impact causal des traitements médicaux.

Maintenance prédictive

Entraînez plusieurs modèles sur les données historiques, telles que la température et la vitesse de rotation pour prédire les défaillances mécaniques. Ensuite, déterminez quel modèle convient le mieux pour prédire les défaillances futures.

Suivez le tutoriel Maintenance prédictive.

Prévisions de ventes

Prédisez les ventes futures pour des catégories de produits dans un supermarché. Entraînez un modèle sur les données historiques pour ce faire.

Suivez le tutoriel Prévisions de ventes.