Machine Learning: entrenamiento

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

En este artículo se describen los módulos proporcionados en Machine Learning Studio (clásico) para entrenar un modelo de aprendizaje automático. El entrenamiento es el proceso de analizar los datos de entrada mediante los parámetros de un modelo predefinido. A partir de este análisis, el modelo aprende los patrones y los guarda en forma de modelo entrenado.

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

En este artículo también se describe el proceso general de Machine Learning Studio (clásico) para la creación, el entrenamiento, la evaluación y la puntuación del modelo.

Creación y uso de modelos de aprendizaje automático

El flujo de trabajo típico para el aprendizaje automático incluye estas fases:

  • Elegir un algoritmo adecuado y establecer las opciones iniciales.
  • Entrenamiento del modelo en datos compatibles.
  • Crear predicciones mediante nuevos datos, en función de los patrones del modelo.
  • Evaluar el modelo para determinar si las predicciones son precisas, cuánto error hay y si hay sobreajuste.

Machine Learning Studio (clásico) admite un marco flexible y personalizable para el aprendizaje automático. Cada tarea de este proceso se realiza mediante un tipo específico de módulo, que se puede modificar, agregar o quitar, sin dividir el resto del experimento.

Los módulos de esta categoría admiten el entrenamiento para diferentes tipos de modelos. Durante el entrenamiento, el algoritmo de aprendizaje automático analiza los datos. Este algoritmo analiza la distribución y el tipo de los datos, compila estadísticas y crea patrones que se pueden usar más adelante para la predicción.

Más información sobre el entrenamiento de modelos

Cuando Machine Learning un modelo, se omiten las filas con valores que faltan. Por lo tanto, si desea corregir los valores manualmente, usar la imputación o especificar un método diferente para controlar los valores que faltan, use el módulo Limpiar datos que faltan antes de entrenar en el conjunto de datos.

Se recomienda usar el módulo Editar metadatos para corregir cualquier otro problema con los datos. Es posible que tenga que marcar la columna de etiqueta, cambiar los tipos de datos o corregir los nombres de columna.

Para otras tareas comunes de limpieza de datos, como la normalización, el muestreo, la distribución en binning y el escalado, consulte la categoría Transformación de datos.

Elección del instructor adecuado

El método que se usa para entrenar un modelo depende del tipo de modelo que se va a crear y del tipo de datos que requiere el modelo. Por ejemplo, Machine Learning proporciona módulos específicamente para entrenar modelos de detección de anomalías, modelos de recomendación, etc.

Compruebe la lista de módulos de entrenamiento para determinar cuál es correcto para su escenario.

Si no está seguro de los mejores parámetros para usar al entrenar un modelo, use uno de los módulos proporcionados para el barrido y la validación de parámetros:

  • Optimizar los hiperparámetros del modelo puede realizar un barrido de parámetros en casi todos los modelos de clasificación y regresión. Entrena varios modelos y, a continuación, devuelve el mejor modelo.

  • El módulo Barrido de clústeres admite el ajuste de modelos durante el proceso de entrenamiento y está pensado para su uso solo con modelos de agrupación en clústeres. Puede especificar un intervalo de centroides y entrenar en datos mientras detecta automáticamente los mejores parámetros.

  • El módulo Validar modelo de forma cruzada también es útil para la optimización del modelo, pero no devuelve un modelo entrenado. En su lugar, proporciona métricas que puede usar para determinar el mejor modelo.

Reciclaje de modelos

Si necesita volver a entrenar un modelo de producción, puede volver a ejecutar el experimento en cualquier momento.

También puede automatizar el proceso de reentrenamiento mediante servicios web. Para obtener un tutorial, vea Volver a entrenar y actualizar Machine Learning modelos con Azure Data Factory.

Uso de modelos previamente entrenados

Machine Learning incluye algunos modelos previamente entrenados, como el módulo Clasificación de imágenes en cascada previamente entrenadas. Puede usar estos modelos para puntuar sin datos adicionales.

Además, algunos módulos (como la detección de anomalías de serie temporal) no generan un modelo entrenado en el formato iLearner. Pero toman datos de entrenamiento y crean un modelo internamente, que luego se puede usar para realizar predicciones. Para usarlos, solo tiene que configurar los parámetros y proporcionar datos.

Guardar una instantánea de un modelo entrenado

Si desea guardar o exportar el modelo, haga clic con el botón derecho en el módulo de entrenamiento y seleccione Guardar como modelo entrenado. El modelo se exporta al formato iLearner y se guarda en el área de trabajo, en Modelos entrenados. Los modelos entrenados se pueden volver a usar en otros experimentos o conectarse a otros módulos para la puntuación.

También puede usar el módulo Cargar modelo entrenado en un experimento para recuperar un modelo almacenado.

Lista de módulos

La categoría Train incluye estos módulos:

  • Agrupación en clústeres de barrido: realiza un barrido de parámetros en un modelo de agrupación en clústeres para determinar la configuración óptima de parámetros y entrena el mejor modelo.
  • Entrenar modelo de detección de anomalías: entrena un modelo de detector de anomalías y etiqueta los datos de un conjunto de entrenamiento.
  • Entrenar modelo de agrupación en clústeres: entrena un modelo de agrupación en clústeres y asigna datos del conjunto de entrenamiento a los clústeres.
  • Entrenar recomendador de Matchbox: entrena un recomendador bayesiano mediante el algoritmo Matchbox.
  • Entrenar modelo: entrena un modelo de clasificación o regresión desde un conjunto de entrenamiento.
  • Optimizar hiperparámetros del modelo: realiza un barrido de parámetros en un modelo de regresión o clasificación para determinar la configuración óptima de parámetros y entrena el mejor modelo.

Algunos módulos no están en esta categoría, porque requieren un formato especial o se personalizan para una tarea específica:

Consulte también