Introducción

Completado

En el aprendizaje automático, los modelos se entrenan para predecir resultados desconocidos mediante patrones de aprendizaje de datos de entrenamiento etiquetados. La forma en que un modelo aprende se ve influenciada no solo por los propios datos, sino también por hiperparámetros, la configuración que controla el proceso de entrenamiento. Estos no se aprenden de los datos, pero se establecen manualmente antes de que comience el entrenamiento, por ejemplo:

  • En la regresión logística, la tasa de regularización ayuda a evitar el sobreajuste penalizando modelos demasiado complejos.
  • En las redes neuronales, la velocidad de aprendizaje determina la rapidez con la que el modelo actualiza sus pesos, lo que afecta tanto a la velocidad como a la precisión.

Nota:

En la terminología del aprendizaje automático, los valores aprendidos de los datos se denominan parámetros. Para distinguirlos de los valores que configuran el proceso de entrenamiento, usamos el término hiperparámetros.

Elegir los hiperparámetros adecuados es fundamental. Las opciones deficientes pueden dar lugar a modelos que tienen un rendimiento inferior o no se generalizan en los nuevos datos. Por otro lado, los hiperparámetros bien ajustados pueden mejorar significativamente la precisión, la solidez y la eficacia de un modelo.

Aquí es donde entra en acción el ajuste de hiperparámetros: un proceso de probar sistemáticamente diferentes combinaciones de valores de hiperparámetros para encontrar la configuración de mejor rendimiento para sus datos y tareas específicos.

En Azure Databricks, puede usar la biblioteca Optuna para automatizar este proceso. Optuna explora de forma inteligente el espacio de hiperparámetros, el entrenamiento y la evaluación de modelos repetidamente hasta que identifica la configuración más eficaz. Esto le ayuda a crear modelos que no solo funcionan bien, sino que también generalizan mejor a los datos no vistos.

En Azure Databricks, puede usar bibliotecas como Optuna o Ray Tune para la optimización de hiperparámetros. Aunque ambas son herramientas eficaces, en este módulo nos centramos en Optuna. Optuna explora de forma inteligente el espacio de hiperparámetros, el entrenamiento y la evaluación de modelos repetidamente hasta que identifica la configuración más eficaz. Esto le ayuda a crear modelos que no solo funcionan bien, sino que también generalizan mejor a los datos no vistos.