Train Model (Entrenar modelo)

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

Entrena un modelo de clasificación o de regresión de una manera supervisada

Categoría: Machine Learning/ Entrenar

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Información general sobre el módulo

En este artículo se describe cómo usar el módulo Entrenar modelo en Machine Learning Studio (clásico) para entrenar un modelo de clasificación o regresión. El entrenamiento tiene lugar después de definir un modelo y establecer sus parámetros y requiere datos etiquetados. También puede usar Entrenar modelo para volver a entrenar un modelo existente con datos nuevos.

Funcionamiento del proceso de entrenamiento

En Machine Learning, la creación y el uso de un modelo de aprendizaje automático suele ser un proceso de tres pasos.

  1. Un modelo se configura eligiendo un determinado tipo de algoritmo y definiendo sus parámetros o hiperparámetros. Elija cualquiera de los siguientes tipos de modelo:

    • Modelos de clasificación, basados en redes neuronales, árboles de decisión, bosques de decisión y otros algoritmos.
    • Modelos de regresión, que pueden incluir regresión lineal estándar, o que usan otros algoritmos, incluidas las redes neuronales y la regresión baysiana.
  2. Proporcione un conjunto de datos que esté etiquetado y tenga datos compatibles con el algoritmo. Conecte los datos y el modelo a Entrenar modelo.

    Lo que genera el entrenamiento es un formato binario específico, iLearner, que encapsula los patrones estadísticos aprendidos a partir de los datos. No se puede modificar ni leer directamente este formato; sin embargo, otros módulos de Studio (clásico) pueden usar este modelo entrenado.

    También puede ver las propiedades del modelo. Para obtener más información, vea la sección Resultados .

  3. Una vez completado el entrenamiento, utilice el modelo entrenado con uno de los módulos de puntuación, para realizar predicciones sobre nuevos datos.

Nota:

Otras tareas de aprendizaje automático especializadas requieren distintos métodos de entrenamiento y Studio (clásico) proporciona módulos de entrenamiento independientes para ellos. Por ejemplo, la detección de imágenes, la agrupación en clústeres y la detección de anomalías usan métodos de entrenamiento personalizados. Entrenar modelo está pensado para su uso solo con modelos de regresión y clasificación.

Entrenamiento supervisado y no supervisado

Es posible que haya oído los términos aprendizaje supervisado o no supervisado. Entrenar un modelo de clasificación o regresión con Train Model es un ejemplo clásico de aprendizaje automático supervisado. Esto significa que debe proporcionar un conjunto de datos que contenga datos históricos de los que aprender patrones. Los datos deben contener tanto el resultado (etiqueta) que está intentando predecir como los factores relacionados (variables). El modelo de aprendizaje automático necesita los resultados para determinar las características que mejor predicen los resultados.

Durante el proceso de entrenamiento, los datos se ordenan por resultados y el algoritmo extrae patrones estadísticos para compilar el modelo.

El aprendizaje no supervisado indica que el resultado es desconocido o que decide no usar etiquetas conocidas. Por ejemplo, los algoritmos de agrupación en clústeres suelen emplear métodos de aprendizaje no supervisados, pero pueden usar etiquetas si están disponibles. Otro ejemplo es el modelado de temas mediante LDA. No se puede usar Entrenar modelo con estos algoritmos.

Sugerencia

¿Es la primera vez que trabaja con aprendizaje automático? Este tutorial le guía por el proceso de obtención de datos, la configuración de un algoritmo, el entrenamiento y el uso de un modelo: Creación del primer experimento de aprendizaje automático

Cómo usar Entrenar modelo

  1. En Machine Learning Studio (clásico), configure un modelo de clasificación o modelos de regresión.

    También puede entrenar un modelo personalizado creado mediante Crear modelo de R.

  2. Agregue el módulo Entrenar modelo al experimento. Puede encontrar este módulo en la categoría Machine Learning. Expanda Entrenar y, a continuación, arrastre el módulo Entrenar modelo al experimento.

  3. En la entrada izquierda, adjunte el modo no entrenado. Adjunte el conjunto de datos de entrenamiento a la entrada de la derecha de Entrenar modelo.

    El conjunto de datos de entrenamiento debe contener una columna de etiqueta. Se omiten todas las filas sin etiquetas.

  4. Para Columna de etiqueta, haga clic en Launch column selector (Iniciar selector de columna) y elija una sola columna que contenga los resultados que el modelo puede usar para el entrenamiento.

    • Para problemas de clasificación, la columna de etiqueta debe contener valores categoriales o valores discretos. Algunos ejemplos podrían ser una calificación de sí o no, un código o nombre de clasificación de enfermedades o un grupo de ingresos. Si elige una columna no categorial, el módulo devolverá un error durante el entrenamiento.

    • Para problemas de regresión, la columna de etiqueta debe contener datos numéricos que representen la variable de respuesta. Lo ideal es que los datos numéricos representen una escala continua.

    Podrían ser ejemplos una puntuación de riesgo de crédito, el tiempo proyectado para el error de una unidad de disco duro o el número previsto de llamadas a un centro de llamadas en un día u hora determinadas. Si no elige una columna numérica, puede obtener un error.

    • Si no especifica la columna de etiqueta que se va a usar, Machine Learning intentará deducir cuál es la columna de etiqueta adecuada, mediante los metadatos del conjunto de datos. Si elige la columna errónea, utilice el selector de columnas para corregirlo.

    Sugerencia

    Si tiene problemas para usar el selector de columnas, consulte el artículo Select Columns in Dataset (Seleccionar columnas en conjunto de datos) para obtener sugerencias. En él, se describen algunos escenarios y sugerencias comunes para usar las opciones WITH RULES (CON REGLAS) y BY NAME (POR NOMBRE).

  5. Ejecute el experimento. Si tiene una gran cantidad de datos, puede tardar.

Results

Cuando el modelo está entrenado:

  • Para ver los parámetros del modelo y los pesos de característica, haga clic con el botón derecho en la salida y seleccione Visualizar.

  • Para usar el modelo en otros experimentos, haga clic con el botón derecho en el modelo y seleccione Guardar modelo. Escriba un nombre para el modelo.

    De este modo se guarda el modelo como una instantánea que las ejecuciones repetidas del experimento no actualizan.

  • Para usar el modelo para predecir nuevos valores, conéctelo al módulo Puntuar modelo, junto con nuevos datos de entrada.

Si necesita entrenar un tipo de modelo no compatible con Train Model, hay varias opciones:

Ejemplos

Para obtener ejemplos de cómo se usa el módulo Entrenar modelo en experimentos de aprendizaje automático, consulte estos experimentos en el Azure AI Gallery:

Entradas esperadas

Nombre Tipo Descripción
Modelo no entrenado Interfaz ILearner Aprendiz no entrenado
Dataset Tabla de datos Datos de aprendizaje.

Parámetros del módulo

Nombre Intervalo Tipo Valor predeterminado Descripción
Columna de etiqueta cualquiera ColumnSelection Seleccionar la columna que contiene la columna de etiqueta o resultado

Salidas

Nombre Tipo Descripción
Modelo entrenado Interfaz ILearner Aprendiz entrenado

Excepciones

Para obtener una lista de todos los errores del módulo, vea Códigos de error del módulo.

Excepción Descripción
Error 0032 Se produce una excepción si el argumento no es un número.
Error 0033 Se produce una excepción si el argumento es infinito.
Error 0083 Se produce una excepción si el conjunto de datos que se usó para el entrenamiento no se puede usar para un tipo concreto de aprendiz.
Error 0035 Se produce una excepción si no se proporcionaron características para un usuario o elemento determinado.
Error 0003 Se produce una excepción si una o varias de las entradas son NULL o están vacías.
Error 0020 Se produce una excepción si en algunos de los conjuntos de datos que se pasan al módulo el número de columnas es demasiado pequeño.
Error 0021 Se produce una excepción si el número de filas en algunos de los conjuntos de datos que se pasan al módulo es demasiado pequeño.
Error 0013 Se produce una excepción si se pasa un aprendiz de módulo con un tipo no válido.

Consulte también

Evaluación de módulo
Lista de módulos A-Z