ML Studio (clásico) descripciones del módulo
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
En este tema se proporciona información general de todos los módulos incluidos en Machine Learning Studio (clásico), que es un área de trabajo visual interactiva para compilar y probar fácilmente modelos predictivos.
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
¿Qué es un módulo?
En Machine Learning Studio (clásico), un módulo es un bloque de creación para crear experimentos. Cada módulo encapsula un algoritmo de aprendizaje automático, una función o una biblioteca de código específicos que pueden actuar sobre los datos del área de trabajo. Los módulos están diseñados para aceptar conexiones de otros módulos, para compartir y modificar datos.
El código que se ejecuta en cada módulo procede de muchos orígenes. Entre ellas se código abierto bibliotecas y lenguajes, algoritmos desarrollados por Microsoft Research y herramientas para trabajar con Azure y otros servicios en la nube.
Sugerencia
¿Busca algoritmos de aprendizaje automático? Consulte la Machine Learning, que contiene módulos para árboles de decisión, agrupación en clústeres, redes neuronales, entre otros. Las categorías Train y Evaluate incluyen módulos para ayudar a entrenar y probar los modelos.
Al conectar y configurar módulos, puede crear un flujo de trabajo que lea datos de orígenes externos, los prepare para el análisis, aplique algoritmos de aprendizaje automático y genere resultados.
Cuando un experimento está abierto en Machine Learning Studio (clásico), puede ver la lista completa de módulos actuales en el panel de navegación de la izquierda. Arrastre estos bloques de creación al experimento y, a continuación, conéctelos para crear un flujo de trabajo de aprendizaje automático completo, denominado experimento.
A veces, los módulos se actualizan para agregar nueva funcionalidad o para quitar código anterior. Cuando esto sucede, los experimentos que creó que usan el módulo seguirán en ejecución. Pero la próxima vez que abra el experimento, se le pedirá que actualice el módulo o que use otro módulo.
Ejemplos
Para obtener un ejemplo de cómo crear un experimento de aprendizaje automático completo, consulte estos tutoriales:
Desarrollo de una solución predictiva mediante Machine Learning
Creación de un experimento sencillo en Machine Learning Studio (clásico)
Categorías del módulo
Para facilitar la búsqueda de módulos relacionados, las herramientas de aprendizaje automático de Machine Learning Studio (clásico) se agrupan por estas categorías.
Conversiones de formato de datos
Use estos módulos para convertir datos a uno de los formatos que usen otros formatos o herramientas de aprendizaje automático.
-
Use estos módulos para leer datos y modelos de orígenes de datos en la nube, incluidos clústeres de Hadoop, Azure Table Storage y direcciones URL web. También puede usar estos módulos para escribir resultados en el almacenamiento o en una base de datos.
-
Use estos módulos para preparar datos para su análisis. Puede cambiar los tipos de datos, marcar las columnas como características o etiquetas, generar características y escalar o normalizar los datos.
-
Transformar datos numéricos derivados del procesamiento de señales digitales.
-
Use distribuciones de probabilidad conjuntas para crear características que describan de forma compacta grandes conjuntos de datos.
-
Este grupo proporciona una variedad de herramientas para la ciencia de datos. Por ejemplo, puede quitar o reemplazar los valores que faltan, elegir un subconjunto de columnas, agregar una columna o concatenar dos conjuntos de datos.
-
Divida un conjunto de datos por criterios o por tamaño, para crear conjuntos de entrenamiento y prueba, o para aislar determinadas filas.
-
Transformar datos numéricos.
Selección de características
Use estos módulos para identificar las mejores características de los datos, mediante los métodos estadísticos ampliamente investigados.
Machine Learning
Este grupo contiene la mayoría de los algoritmos de aprendizaje automático admitidos por Machine Learning.
También contiene módulos diseñados para admitir los algoritmos mediante modelos de entrenamiento, generación de puntuaciones y evaluación del rendimiento del modelo.
-
Después de entrenar un modelo, use estas herramientas para medir la precisión del modelo.
-
Estos módulos proporcionan los algoritmos de aprendizaje automático, que puede personalizar estableciendo parámetros. Los algoritmos de esta sección se agrupan por tipo:
-
Use estos módulos para pasar nuevos datos a través del algoritmo y generar un conjunto de resultados para la evaluación. También puede usar los resultados de la puntuación como parte de un servicio predictivo.
-
Estos módulos entrenan un modelo de aprendizaje automático inicializado en los datos que proporcione.
Módulos de la biblioteca OpenCV
Estos módulos ofrecen acceso fácil a una conocida biblioteca de código abierto para el procesamiento y la clasificación de imágenes.
Módulos del lenguaje R
Use estos módulos para agregar código R personalizado a su experimento o implemente un modelo de aprendizaje automático basado en un paquete de R.
Módulos de lenguaje Python
Use estos módulos para agregar código Python personalizado a su experimento.
Funciones estadísticas
Use estos módulos para calcular las distribuciones de probabilidad, crear cálculos personalizados y realizar muchas otras tareas relacionadas con variables numéricas.
Text Analytics
Use estos módulos para realizar el hash de características y el reconocimiento de entidades con nombre, o para preprocesar texto mediante herramientas de procesamiento de lenguaje natural.
Serie temporal
Use estos módulos para evaluar las anomalías en las tendencias mediante algoritmos diseñados específicamente para datos de serie temporal.
Tareas relacionadas
Machine Learning Studio (clásico) no intentan duplicar las herramientas de integración de datos admitidas en otras herramientas, como Azure Data Factory. En su lugar, los módulos proporcionan funcionalidad específica del aprendizaje automático:
- Normalización, agrupación y escalado de datos
- Computación de la distribución estadística de datos
- Conversión a otros formatos de aprendizaje automático
- Importación de datos usados para experimentos de aprendizaje automático y exportación de resultados
- Análisis de texto, selección de características y reducción de dimensionalidad
Si necesita instalaciones más sofisticadas para la manipulación y el almacenamiento de datos, consulte lo siguiente:
- Azure Data Factory: Enterprise de procesamiento de datos en la nube listas para su uso.
- Azure SQL Database: almacenamiento escalable, con acceso integrado al aprendizaje automático.
- CosmosDB: almacén de datos NoSQL; importar datos a Machine Learning Studio (clásico).
- Azure Data Lake Analytics: análisis distribuido en big data.
- Stream Analytics: procesamiento de eventos para el Internet de las cosas.
- Azure Text Analytics: varias opciones para el procesamiento de texto y los Cognitive Services relacionados con la voz, la imagen y el reconocimiento facial.
- Azure Databricks: plataforma de análisis basada en Spark.