Share via


Transformación de datos

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

En este artículo se enumeran los módulos que se proporcionan en Machine Learning Studio (clásico) para la transformación de datos. Para el aprendizaje automático, la transformación de datos conlleva algunas tareas muy generales, como unir conjuntos de datos o cambiar nombres de columna. Pero también incluye muchas tareas que son específicas del aprendizaje automático, como la normalización, la binning y la agrupación, y la inferencia de valores que faltan.

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Importante

Por lo general, se espera que los datos que se usan en Machine Learning Studio (clásico) sean "ordenados" antes de importarlos a Machine Learning Studio (clásico). La preparación de los datos puede incluir, por ejemplo, asegurarse de que los datos usan la codificación correcta y comprobar que los datos tienen un esquema coherente.

Los módulos para la transformación de datos se agrupan en las siguientes categorías basadas en tareas:

  • Creación de filtros para el procesamiento de señales digitales: los filtros de señal digital se pueden aplicar a los datos numéricos para admitir tareas de aprendizaje automático, como el reconocimiento de imágenes, el reconocimiento de voz y el análisis de formas de onda.
  • Generación y uso de características basadas en recuento: los módulos de caracterización basados en recuentos le ayudan a desarrollar características compactas para usarlas en el aprendizaje automático.
  • Preparación y manipulación de datos generales: combinar conjuntos de datos, limpiar valores que faltan, agrupar y resumir datos, cambiar los nombres de columna y los tipos de datos, o indicar qué columna es una etiqueta o una característica.
  • Muestreo y división de conjuntos de datos: divida los datos en conjuntos de entrenamiento y pruebas, divida los conjuntos de datos por porcentaje o por una condición de filtro, o realice el muestreo.
  • Escalado y reducción de datos: prepare los datos numéricos para el análisis mediante la aplicación de la normalización o el escalado. Bin data into groups, remove or replace outliers, or perform principal component analysis (PCA) (Colocar datos en grupos, quitar o reemplazar valores atípicos, o realizar análisis de componentes principales (PCA).

Lista de módulos

Las siguientes categorías de módulo se incluyen en la categoría Transformación de datos:

Consulte también