Partager via


Ingénierie de caractéristiques de l’apprentissage de transfert

Cet article propose un exemple de caractérisation pour l’apprentissage de transfert à l’aide de fonctions définies par l’utilisateur Pandas.

Caractérisation pour l’apprentissage de transfert dans des modèles DL

Azure Databricks prend en charge la caractérisation avec les modèles de deep learning. Il est possible d’utiliser des modèles de Deep Learning préentraînés pour calculer des caractéristiques à utiliser dans d’autres modèles en aval. Azure Databricks prend en charge la caractérisation à grande échelle en répartissant le calcul sur un cluster. Vous pouvez effectuer une caractérisation en utilisant les bibliothèques de Deep Learning incluses dans Databricks Runtime ML, notamment TensorFlow et PyTorch.

Azure Databricks prend également en charge le transfer learning, une technique étroitement liée à la caractérisation. Le transfer learning vous permet de réutiliser les connaissances d’un domaine de problèmes dans un domaine qui y est lié. La caractérisation est elle-même une méthode simple et puissante pour le transfer learning : les fonctionnalités de calcul utilisant un modèle de deep learning préentraîné transfèrent les connaissances sur les bonnes caractéristiques depuis le domaine d’origine.

Étapes de calcul de caractéristiques pour l’apprentissage de transfert

Cet article montre comment calculer des caractéristiques pour l’apprentissage de transfert en utilisant un modèle TensorFlow pré-entraîné, à l’aide du workflow suivant :

  1. Commencez avec un modèle Deep Learning pré-entraîné, dans ce cas un modèle de classification d’images de tensorflow.keras.applications.
  2. Tronquez la ou les dernières couches du modèle. Le modèle modifié produit un tenseur de caractéristiques comme sortie, plutôt qu’une prédiction.
  3. Appliquez ce modèle à un nouveau jeu de données d’image à partir d’un autre domaine de problème, en calculant les caractéristiques pour les images.
  4. Utilisez ces caractéristiques pour entraîner un nouveau modèle. Le notebook suivant omet cette étape finale. Pour obtenir des exemples d’entraînement d’un modèle simple tel que la régression logistique, consultez Exemples d’entraînement de modèle.

Exemple : Utiliser des fonctions définies par l’utilisateur Pandas pour la caractérisation

Le notebook suivant utilise des fonctions définies par l’utilisateur pandas pour effectuer l’étape de caractérisation. Les fonctions définies par l’utilisateur pandas, et leurs nouvelles variantes que sont les fonctions définies par l’utilisateur pandas Itérateur scalaire, offrent des API flexibles, prennent en charge toute bibliothèque de Deep Learning et offrent des performances élevées.

Caractérisation et apprentissage de transfert avec TensorFlow

Obtenir le notebook