Train Model (Entrenar modelo)

Artículo
05/06/2019

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
Más información sobre Azure Machine Learning.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

Entrena un modelo de clasificación o de regresión de una manera supervisada

Categoría: Machine Learning/ Entrenar

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Información general sobre el módulo

En este artículo se describe cómo usar el módulo Entrenar modelo en Machine Learning Studio (clásico) para entrenar un modelo de clasificación o regresión. El entrenamiento tiene lugar después de definir un modelo y establecer sus parámetros y requiere datos etiquetados. También puede usar Entrenar modelo para volver a entrenar un modelo existente con datos nuevos.

Funcionamiento del proceso de entrenamiento

En Machine Learning, la creación y el uso de un modelo de aprendizaje automático suele ser un proceso de tres pasos.

Un modelo se configura eligiendo un determinado tipo de algoritmo y definiendo sus parámetros o hiperparámetros. Elija cualquiera de los siguientes tipos de modelo:
- Modelos de clasificación, basados en redes neuronales, árboles de decisión, bosques de decisión y otros algoritmos.
- Modelos de regresión, que pueden incluir regresión lineal estándar, o que usan otros algoritmos, incluidas las redes neuronales y la regresión baysiana.
Proporcione un conjunto de datos que esté etiquetado y tenga datos compatibles con el algoritmo. Conecte los datos y el modelo a Entrenar modelo.

Lo que genera el entrenamiento es un formato binario específico, iLearner, que encapsula los patrones estadísticos aprendidos a partir de los datos. No se puede modificar ni leer directamente este formato; sin embargo, otros módulos de Studio (clásico) pueden usar este modelo entrenado.

También puede ver las propiedades del modelo. Para obtener más información, vea la sección Resultados .
Una vez completado el entrenamiento, utilice el modelo entrenado con uno de los módulos de puntuación, para realizar predicciones sobre nuevos datos.

Nota:

Otras tareas de aprendizaje automático especializadas requieren distintos métodos de entrenamiento y Studio (clásico) proporciona módulos de entrenamiento independientes para ellos. Por ejemplo, la detección de imágenes, la agrupación en clústeres y la detección de anomalías usan métodos de entrenamiento personalizados. Entrenar modelo está pensado para su uso solo con modelos de regresión y clasificación.

Entrenamiento supervisado y no supervisado

Es posible que haya oído los términos aprendizaje supervisado o no supervisado. Entrenar un modelo de clasificación o regresión con Train Model es un ejemplo clásico de aprendizaje automático supervisado. Esto significa que debe proporcionar un conjunto de datos que contenga datos históricos de los que aprender patrones. Los datos deben contener tanto el resultado (etiqueta) que está intentando predecir como los factores relacionados (variables). El modelo de aprendizaje automático necesita los resultados para determinar las características que mejor predicen los resultados.

Durante el proceso de entrenamiento, los datos se ordenan por resultados y el algoritmo extrae patrones estadísticos para compilar el modelo.

El aprendizaje no supervisado indica que el resultado es desconocido o que decide no usar etiquetas conocidas. Por ejemplo, los algoritmos de agrupación en clústeres suelen emplear métodos de aprendizaje no supervisados, pero pueden usar etiquetas si están disponibles. Otro ejemplo es el modelado de temas mediante LDA. No se puede usar Entrenar modelo con estos algoritmos.

Sugerencia

¿Es la primera vez que trabaja con aprendizaje automático? Este tutorial le guía por el proceso de obtención de datos, la configuración de un algoritmo, el entrenamiento y el uso de un modelo: Creación del primer experimento de aprendizaje automático

Cómo usar Entrenar modelo

En Machine Learning Studio (clásico), configure un modelo de clasificación o modelos de regresión.

También puede entrenar un modelo personalizado creado mediante Crear modelo de R.
Agregue el módulo Entrenar modelo al experimento. Puede encontrar este módulo en la categoría Machine Learning. Expanda Entrenar y, a continuación, arrastre el módulo Entrenar modelo al experimento.
En la entrada izquierda, adjunte el modo no entrenado. Adjunte el conjunto de datos de entrenamiento a la entrada de la derecha de Entrenar modelo.

El conjunto de datos de entrenamiento debe contener una columna de etiqueta. Se omiten todas las filas sin etiquetas.
Para Columna de etiqueta, haga clic en Launch column selector (Iniciar selector de columna) y elija una sola columna que contenga los resultados que el modelo puede usar para el entrenamiento.
- Para problemas de clasificación, la columna de etiqueta debe contener valores categoriales o valores discretos. Algunos ejemplos podrían ser una calificación de sí o no, un código o nombre de clasificación de enfermedades o un grupo de ingresos. Si elige una columna no categorial, el módulo devolverá un error durante el entrenamiento.
- Para problemas de regresión, la columna de etiqueta debe contener datos numéricos que representen la variable de respuesta. Lo ideal es que los datos numéricos representen una escala continua.
Podrían ser ejemplos una puntuación de riesgo de crédito, el tiempo proyectado para el error de una unidad de disco duro o el número previsto de llamadas a un centro de llamadas en un día u hora determinadas. Si no elige una columna numérica, puede obtener un error.
- Si no especifica la columna de etiqueta que se va a usar, Machine Learning intentará deducir cuál es la columna de etiqueta adecuada, mediante los metadatos del conjunto de datos. Si elige la columna errónea, utilice el selector de columnas para corregirlo.
Sugerencia

Si tiene problemas para usar el selector de columnas, consulte el artículo Select Columns in Dataset (Seleccionar columnas en conjunto de datos) para obtener sugerencias. En él, se describen algunos escenarios y sugerencias comunes para usar las opciones WITH RULES (CON REGLAS) y BY NAME (POR NOMBRE).
Ejecute el experimento. Si tiene una gran cantidad de datos, puede tardar.

Results

Cuando el modelo está entrenado:

Para ver los parámetros del modelo y los pesos de característica, haga clic con el botón derecho en la salida y seleccione Visualizar.
Para usar el modelo en otros experimentos, haga clic con el botón derecho en el modelo y seleccione Guardar modelo. Escriba un nombre para el modelo.

De este modo se guarda el modelo como una instantánea que las ejecuciones repetidas del experimento no actualizan.
Para usar el modelo para predecir nuevos valores, conéctelo al módulo Puntuar modelo, junto con nuevos datos de entrada.

Si necesita entrenar un tipo de modelo no compatible con Train Model, hay varias opciones:

Cree un método de puntuación personalizado mediante script de R o use uno de los muchos paquetes de puntuación de R disponibles.
- Crear modelo R
- Ejecución script de R
Escriba su propio script de Python para entrenar y puntuar un modelo, o bien use una biblioteca de Python existente:
- Ejecución de script de Python
Modelos de detección de anomalías
- Entrenar modelo de detección de anomalías admite los módulos de detección de anomalías en Studio (clásico).
Modelos de recomendación
- Si el modelo usa la recomendación matchbox proporcionada en Machine Learning, use el módulo Train Matchbox Recommender (Entrenar recomendador de Matchbox).
- Si usa un algoritmo diferente para el análisis o la recomendación de la cesta de la compra, use sus métodos de entrenamiento, en script de R o script de Python.
Modelos de agrupación en clústeres
- Use Train Clustering Model (Entrenar modelo de agrupación en clústeres) para el algoritmo K-means incluido.
- Para otros modelos de agrupación en clústeres, use módulos de script de R o de script de Python para configurar y entrenar los modelos.

Ejemplos

Para obtener ejemplos de cómo se usa el módulo Entrenar modelo en experimentos de aprendizaje automático, consulte estos experimentos en el Azure AI Gallery:

Previsión de minoristas: muestra cómo compilar, entrenar y comparar varios modelos.
Predicción de retraso de vuelos: muestra cómo entrenar varios modelos de clasificación relacionados.

Entradas esperadas

Nombre	Tipo	Descripción
Modelo no entrenado	Interfaz ILearner	Aprendiz no entrenado
Dataset	Tabla de datos	Datos de aprendizaje.

Parámetros del módulo

Nombre	Intervalo	Tipo	Valor predeterminado	Descripción
Columna de etiqueta	cualquiera	ColumnSelection		Seleccionar la columna que contiene la columna de etiqueta o resultado

Salidas

Nombre	Tipo	Descripción
Modelo entrenado	Interfaz ILearner	Aprendiz entrenado

Excepciones

Para obtener una lista de todos los errores del módulo, vea Códigos de error del módulo.

Excepción	Descripción
Error 0032	Se produce una excepción si el argumento no es un número.
Error 0033	Se produce una excepción si el argumento es infinito.
Error 0083	Se produce una excepción si el conjunto de datos que se usó para el entrenamiento no se puede usar para un tipo concreto de aprendiz.
Error 0035	Se produce una excepción si no se proporcionaron características para un usuario o elemento determinado.
Error 0003	Se produce una excepción si una o varias de las entradas son NULL o están vacías.
Error 0020	Se produce una excepción si en algunos de los conjuntos de datos que se pasan al módulo el número de columnas es demasiado pequeño.
Error 0021	Se produce una excepción si el número de filas en algunos de los conjuntos de datos que se pasan al módulo es demasiado pequeño.
Error 0013	Se produce una excepción si se pasa un aprendiz de módulo con un tipo no válido.

Consulte también

Evaluación de módulo
Lista de módulos A-Z

Compartir a través de

Train Model (Entrenar modelo)

Información general sobre el módulo

Funcionamiento del proceso de entrenamiento

Entrenamiento supervisado y no supervisado

Cómo usar Entrenar modelo

Results

Ejemplos

Entradas esperadas

Parámetros del módulo

Salidas

Excepciones

Consulte también

Recursos adicionales

Compartir a través de

Train Model (Entrenar modelo)

Información general sobre el módulo

Funcionamiento del proceso de entrenamiento

Entrenamiento supervisado y no supervisado

Cómo usar Entrenar modelo

Results

Tareas relacionadas

Ejemplos

Entradas esperadas

Parámetros del módulo

Salidas

Excepciones

Consulte también

Recursos adicionales