Leer en inglés

Compartir a través de


¿Qué es Automated Machine Learning (AutoML)?

El aprendizaje automático automatizado (AutoML) automatiza el proceso de aplicación del aprendizaje automático a los datos. Dado un conjunto de datos, puede ejecutar AutoML para iterar por diferentes transformaciones de datos, algoritmos de aprendizaje automático e hiperparámetros para seleccionar el mejor modelo.

Nota

En este artículo se hace referencia a la API de ML.NET AutoML, que se encuentra actualmente en versión preliminar. El material está sujeto a cambios.

¿Cómo funciona AutoML?

En general, el flujo de trabajo para entrenar modelos de aprendizaje automático es el siguiente:

  • Definición de un problema
  • Recopilación de datos
  • Preprocesar datos
  • Entrenamiento de un modelo
  • Evaluación del modelo

Flujo de trabajo tradicional de entrenamiento de ML y AutoML

El preprocesamiento, el entrenamiento y la evaluación son un proceso experimental e iterativo que requiere varios ensayos hasta que se obtienen resultados satisfactorios. Dado que estas tareas tienden a ser repetitivas, AutoML puede ayudar a automatizar estos pasos. Además de la automatización, las técnicas de optimización se usan durante el proceso de entrenamiento y evaluación para buscar y seleccionar algoritmos e hiperparámetros.

¿Cuándo debo usar AutoML?

Tanto si está empezando a trabajar con el aprendizaje automático como si es un usuario experimentado, AutoML proporciona soluciones para automatizar el proceso de desarrollo de modelos.

  • principiantes: si no está familiarizado con el aprendizaje automático, AutoML simplifica el proceso de desarrollo del modelo proporcionando un conjunto de valores predeterminados que reduce el número de decisiones que debe tomar al entrenar el modelo. Al hacerlo, puede centrarse en los datos y en el problema que intenta resolver y dejar que AutoML haga el resto.
  • usuarios experimentados: si tiene alguna experiencia con el aprendizaje automático, puede personalizar, configurar y ampliar los valores predeterminados proporcionados por AutoML en función de sus necesidades, a la vez que aprovecha sus funcionalidades de automatización.

AutoML en ML.NET

  • Featurizer: API de conveniencia para automatizar el preprocesamiento de datos.
  • Prueba - Una sola ejecución de optimización de hiperparámetros.
  • experimento: colección de pruebas de AutoML. ML.NET proporciona una API genérica de creación de experimentos que establece opciones predeterminadas de los componentes individuales de canalización rastreable, espacio de búsqueda y optimizador.
  • espacio de búsqueda: intervalo de opciones disponibles entre las que elegir hiperparámetros.
  • Optimizador: algoritmos usados para optimizar hiperparámetros. ML.NET admite los siguientes sintonizadores:
    • Optimizador frugal de costes: implementa una optimización frugal de los hiperparámetros relacionados con los costes, que tiene en cuenta el coste de entrenamiento
    • Eci Cost Frugal Tuner: implementación de Cost Frugal Tuner para espacios de búsqueda jerárquicos. El sintonizador predeterminado usado por AutoML.
    • SMAC: optimizador que usa bosques aleatorios para realizar optimizaciones bayesianas.
    • Búsqueda de cuadrícula: optimizador que funciona mejor con espacios de búsqueda pequeños.
    • búsqueda aleatoria
  • Estimador rastreable: estimador de ML.NET que contiene un espacio de búsqueda.
  • Canalización rastreable: canalización de ML.NET que contiene uno o varios estimadores rastreables.
  • Ejecutor de Pruebas: componente AutoML que utiliza canalizaciones ajustables y configuraciones de prueba para obtener resultados de pruebas a partir del entrenamiento y evaluación del modelo.

Se recomienda que los principiantes empiecen por los valores predeterminados proporcionados por la API de experimento de alto nivel. Aquellos usuarios más experimentados que busquen opciones de personalización, pueden usar los componentes de estimador rastreable, canalización rastreable, espacio de búsqueda, ejecutor de pruebas y optimizador.

Para obtener más información sobre cómo empezar a trabajar con la API de AutoML, consulte la guía de Uso de la API de ML.NET Automated Machine Learning (AutoML).

Tareas compatibles

AutoML proporciona valores predeterminados preconfigurados para las siguientes tareas:

  • Clasificación binaria
  • Clasificación multiclase
  • Regresión

Para otras tareas, puede crear su propio ejecutor de prueba para habilitar esos escenarios. Para obtener más información, consulte la guía de cómo utilizar la API de ML.NET de aprendizaje automático automatizado (AutoML).

Pasos siguientes