Train Model (Entrenar modelo)
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
Entrena un modelo de clasificación o de regresión de una manera supervisada
Categoría: Machine Learning/ Entrenar
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
Información general sobre el módulo
En este artículo se describe cómo usar el módulo Entrenar modelo en Machine Learning Studio (clásico) para entrenar un modelo de clasificación o regresión. El entrenamiento tiene lugar después de definir un modelo y establecer sus parámetros y requiere datos etiquetados. También puede usar Entrenar modelo para volver a entrenar un modelo existente con datos nuevos.
Funcionamiento del proceso de entrenamiento
En Machine Learning, la creación y el uso de un modelo de aprendizaje automático suele ser un proceso de tres pasos.
Un modelo se configura eligiendo un determinado tipo de algoritmo y definiendo sus parámetros o hiperparámetros. Elija cualquiera de los siguientes tipos de modelo:
- Modelos de clasificación, basados en redes neuronales, árboles de decisión, bosques de decisión y otros algoritmos.
- Modelos de regresión, que pueden incluir regresión lineal estándar, o que usan otros algoritmos, incluidas las redes neuronales y la regresión baysiana.
Proporcione un conjunto de datos que esté etiquetado y tenga datos compatibles con el algoritmo. Conecte los datos y el modelo a Entrenar modelo.
Lo que genera el entrenamiento es un formato binario específico, iLearner, que encapsula los patrones estadísticos aprendidos a partir de los datos. No se puede modificar ni leer directamente este formato; sin embargo, otros módulos de Studio (clásico) pueden usar este modelo entrenado.
También puede ver las propiedades del modelo. Para obtener más información, vea la sección Resultados .
Una vez completado el entrenamiento, utilice el modelo entrenado con uno de los módulos de puntuación, para realizar predicciones sobre nuevos datos.
Nota:
Otras tareas de aprendizaje automático especializadas requieren distintos métodos de entrenamiento y Studio (clásico) proporciona módulos de entrenamiento independientes para ellos. Por ejemplo, la detección de imágenes, la agrupación en clústeres y la detección de anomalías usan métodos de entrenamiento personalizados. Entrenar modelo está pensado para su uso solo con modelos de regresión y clasificación.
Entrenamiento supervisado y no supervisado
Es posible que haya oído los términos aprendizaje supervisado o no supervisado. Entrenar un modelo de clasificación o regresión con Train Model es un ejemplo clásico de aprendizaje automático supervisado. Esto significa que debe proporcionar un conjunto de datos que contenga datos históricos de los que aprender patrones. Los datos deben contener tanto el resultado (etiqueta) que está intentando predecir como los factores relacionados (variables). El modelo de aprendizaje automático necesita los resultados para determinar las características que mejor predicen los resultados.
Durante el proceso de entrenamiento, los datos se ordenan por resultados y el algoritmo extrae patrones estadísticos para compilar el modelo.
El aprendizaje no supervisado indica que el resultado es desconocido o que decide no usar etiquetas conocidas. Por ejemplo, los algoritmos de agrupación en clústeres suelen emplear métodos de aprendizaje no supervisados, pero pueden usar etiquetas si están disponibles. Otro ejemplo es el modelado de temas mediante LDA. No se puede usar Entrenar modelo con estos algoritmos.
Sugerencia
¿Es la primera vez que trabaja con aprendizaje automático? Este tutorial le guía por el proceso de obtención de datos, la configuración de un algoritmo, el entrenamiento y el uso de un modelo: Creación del primer experimento de aprendizaje automático
Cómo usar Entrenar modelo
En Machine Learning Studio (clásico), configure un modelo de clasificación o modelos de regresión.
También puede entrenar un modelo personalizado creado mediante Crear modelo de R.
Agregue el módulo Entrenar modelo al experimento. Puede encontrar este módulo en la categoría Machine Learning. Expanda Entrenar y, a continuación, arrastre el módulo Entrenar modelo al experimento.
En la entrada izquierda, adjunte el modo no entrenado. Adjunte el conjunto de datos de entrenamiento a la entrada de la derecha de Entrenar modelo.
El conjunto de datos de entrenamiento debe contener una columna de etiqueta. Se omiten todas las filas sin etiquetas.
Para Columna de etiqueta, haga clic en Launch column selector (Iniciar selector de columna) y elija una sola columna que contenga los resultados que el modelo puede usar para el entrenamiento.
Para problemas de clasificación, la columna de etiqueta debe contener valores categoriales o valores discretos. Algunos ejemplos podrían ser una calificación de sí o no, un código o nombre de clasificación de enfermedades o un grupo de ingresos. Si elige una columna no categorial, el módulo devolverá un error durante el entrenamiento.
Para problemas de regresión, la columna de etiqueta debe contener datos numéricos que representen la variable de respuesta. Lo ideal es que los datos numéricos representen una escala continua.
Podrían ser ejemplos una puntuación de riesgo de crédito, el tiempo proyectado para el error de una unidad de disco duro o el número previsto de llamadas a un centro de llamadas en un día u hora determinadas. Si no elige una columna numérica, puede obtener un error.
- Si no especifica la columna de etiqueta que se va a usar, Machine Learning intentará deducir cuál es la columna de etiqueta adecuada, mediante los metadatos del conjunto de datos. Si elige la columna errónea, utilice el selector de columnas para corregirlo.
Sugerencia
Si tiene problemas para usar el selector de columnas, consulte el artículo Select Columns in Dataset (Seleccionar columnas en conjunto de datos) para obtener sugerencias. En él, se describen algunos escenarios y sugerencias comunes para usar las opciones WITH RULES (CON REGLAS) y BY NAME (POR NOMBRE).
Ejecute el experimento. Si tiene una gran cantidad de datos, puede tardar.
Results
Cuando el modelo está entrenado:
Para ver los parámetros del modelo y los pesos de característica, haga clic con el botón derecho en la salida y seleccione Visualizar.
Para usar el modelo en otros experimentos, haga clic con el botón derecho en el modelo y seleccione Guardar modelo. Escriba un nombre para el modelo.
De este modo se guarda el modelo como una instantánea que las ejecuciones repetidas del experimento no actualizan.
Para usar el modelo para predecir nuevos valores, conéctelo al módulo Puntuar modelo, junto con nuevos datos de entrada.
Tareas relacionadas
Si necesita entrenar un tipo de modelo no compatible con Train Model, hay varias opciones:
Cree un método de puntuación personalizado mediante script de R o use uno de los muchos paquetes de puntuación de R disponibles.
Escriba su propio script de Python para entrenar y puntuar un modelo, o bien use una biblioteca de Python existente:
Modelos de detección de anomalías
- Entrenar modelo de detección de anomalías admite los módulos de detección de anomalías en Studio (clásico).
Modelos de recomendación
Si el modelo usa la recomendación matchbox proporcionada en Machine Learning, use el módulo Train Matchbox Recommender (Entrenar recomendador de Matchbox).
Si usa un algoritmo diferente para el análisis o la recomendación de la cesta de la compra, use sus métodos de entrenamiento, en script de R o script de Python.
Modelos de agrupación en clústeres
Use Train Clustering Model (Entrenar modelo de agrupación en clústeres) para el algoritmo K-means incluido.
Para otros modelos de agrupación en clústeres, use módulos de script de R o de script de Python para configurar y entrenar los modelos.
Ejemplos
Para obtener ejemplos de cómo se usa el módulo Entrenar modelo en experimentos de aprendizaje automático, consulte estos experimentos en el Azure AI Gallery:
- Previsión de minoristas: muestra cómo compilar, entrenar y comparar varios modelos.
- Predicción de retraso de vuelos: muestra cómo entrenar varios modelos de clasificación relacionados.
Entradas esperadas
Nombre | Tipo | Descripción |
---|---|---|
Modelo no entrenado | Interfaz ILearner | Aprendiz no entrenado |
Dataset | Tabla de datos | Datos de aprendizaje. |
Parámetros del módulo
Nombre | Intervalo | Tipo | Valor predeterminado | Descripción |
---|---|---|---|---|
Columna de etiqueta | cualquiera | ColumnSelection | Seleccionar la columna que contiene la columna de etiqueta o resultado |
Salidas
Nombre | Tipo | Descripción |
---|---|---|
Modelo entrenado | Interfaz ILearner | Aprendiz entrenado |
Excepciones
Para obtener una lista de todos los errores del módulo, vea Códigos de error del módulo.
Excepción | Descripción |
---|---|
Error 0032 | Se produce una excepción si el argumento no es un número. |
Error 0033 | Se produce una excepción si el argumento es infinito. |
Error 0083 | Se produce una excepción si el conjunto de datos que se usó para el entrenamiento no se puede usar para un tipo concreto de aprendiz. |
Error 0035 | Se produce una excepción si no se proporcionaron características para un usuario o elemento determinado. |
Error 0003 | Se produce una excepción si una o varias de las entradas son NULL o están vacías. |
Error 0020 | Se produce una excepción si en algunos de los conjuntos de datos que se pasan al módulo el número de columnas es demasiado pequeño. |
Error 0021 | Se produce una excepción si el número de filas en algunos de los conjuntos de datos que se pasan al módulo es demasiado pequeño. |
Error 0013 | Se produce una excepción si se pasa un aprendiz de módulo con un tipo no válido. |