Transferencia de aprendizaje
En la vida, a menudo resulta más fácil aprender una aptitud nueva si ya tiene experiencia en una aptitud similar transmisible. Por ejemplo, probablemente sea más fácil enseñar a alguien cómo conducir un autobús si ya sabe conducir un automóvil. El conductor puede usar los conocimientos que ya tiene sobre cómo conducir un automóvil y aplicarlos para aprender a conducir un autobús.
Se puede aplicar el mismo principio para entrenar modelos de aprendizaje profundo mediante una técnica denominada aprendizaje por transferencia.
Funcionamiento del aprendizaje por transferencia
Por lo general, una red neuronal convolucional (CNN) para la clasificación de imágenes consta de varias capas que extraen características y, a continuación, usan una capa totalmente conectada final para clasificar las imágenes en función de estas características.
Conceptualmente, esta red neuronal consta de dos conjuntos de capas distintos:
- Un conjunto de capas del modelo base que realizan la extracción de características.
- Una capa totalmente conectada que toma las características extraídas y las usa para la predicción de clases.
Las capas de extracción de características aplican agrupaciones y filtros convolucionales para enfatizar los bordes, las esquinas y otros patrones de las imágenes que se pueden usar para diferenciarlas y, en teoría, deberían funcionar para cualquier conjunto de imágenes con las mismas dimensiones que la capa de entrada de la red. La capa de predicción asigna las características a un conjunto de resultados que representan probabilidades para cada etiqueta de clase que quiera usar para clasificar las imágenes.
Al dividir la red en estos tipos de capas, es posible tomar las capas de extracción de características de un modelo ya entrenado y adjuntar una o más capas que usen las características extraídas para predecir las etiquetas de clase correctas para sus imágenes. Este enfoque le permite mantener las ponderaciones entrenadas previamente para las capas de extracción de características, lo que significa que solo necesita entrenar las capas de predicción que agrega.
Hay muchas arquitecturas establecidas para redes neuronales convolucionales para la clasificación de imágenes que puede utilizar como modelo base para el aprendizaje por transferencia, de modo que pueda basarse en el trabajo de otros y desarrollar fácilmente un modelo eficaz de clasificación de imágenes.