Compartir a través de


Conversiones de formato de datos

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

Nota

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

En este artículo se enumeran los módulos proporcionados en Machine Learning Studio (clásico) para convertir datos entre varios formatos de archivo usados en el aprendizaje automático.

Los formatos admitidos incluyen:

  • Formato del conjunto de datos que se usa en Machine Learning.
  • El formato ARFF que usa Weka. Weka es un conjunto de algoritmos de aprendizaje automático basado en Java de código abierto.
  • Formato SVMLight . El formato SVMLight se desarrolló para el marco SVMlight para el aprendizaje automático. Vowpal Wabbit también lo puede usar.
  • Los formatos de archivo plano separados por tabulaciones (TSV) y separados por comas (CSV) compatibles con la mayoría de las bases de datos relacionales. R y Python también admiten ampliamente estos formatos.

Al convertir datos a estos formatos, puede mover más fácilmente los resultados y los datos entre diferentes marcos de aprendizaje automático o mecanismos de almacenamiento.

Nota:

Estos módulos de conversión de datos solo convierten el conjunto de datos completo a un formato especificado. Si necesita realizar cualquier conversión, truncamiento, conversión de formatos de fecha y hora u otra manipulación de los valores, use los módulos de Transformación de datos o vea la lista de tareas relacionadas.

Escenarios comunes de conversión de datos

Normalmente, los módulos de conversión de datos se usan si necesita mover datos de un experimento Machine Learning a otra plataforma o herramienta de aprendizaje automático. También puede usar los módulos para exportar datos desde Machine Learning en un formato que pueda usar una base de datos u otras herramientas. Por ejemplo:

Tarea Use
Debe guardar un conjunto de datos intermedio para usarlo en Excel o para importarlo a una base de datos. Use el módulo CSV o el módulo TSV para preparar los datos en el formato correcto. A continuación, descargue los datos o guárdelos en Azure Storage.
Quiere reutilizar los datos del experimento en código de R o Python. Use el módulo CSV o el módulo TSV para preparar los datos. A continuación, haga clic con el botón derecho en el conjunto de datos convertido para obtener el código de Python que necesita para acceder al conjunto de datos.
Va a portear el experimento y los datos entre Weka y Machine Learning. Use el módulo ARFF para preparar los datos. A continuación, descargue los resultados.
Debe preparar los datos en el marco SVMlight. Use el módulo Convertir en SVMLight para preparar los datos. A continuación, descargue los datos resultantes.
Cree datos para usarlos con Vowpal Wabbit. Use el formato SVMLight . A continuación, modifique los archivos como se describe en el artículo. Guarde el archivo en Azure Blob Storage para usarlo con un módulo de Vowpal Wabbit en Machine Learning.
Los datos no están en formato tabular. Coerciéndolo a un formato de conjunto de datos mediante el módulo Convertir en conjunto de datos.

Si necesita importar datos en Machine Learning o transformar datos en columnas individuales, use estos módulos antes de realizar la conversión de datos:

Tarea Use
Importe datos de mi equipo a Machine Learning. Upload conjuntos de datos en formato CSV, como se describe en Importación de los datos de entrenamiento en Machine Learning Studio (clásico).
Importar datos desde un origen de datos en la nube, incluido Hadoop o Azure. Use el módulo Importar datos.
Guarde conjuntos de datos de aprendizaje automático en Azure Blob Storage, un clúster de Hadoop u otro almacenamiento basado en la nube. Use el módulo Exportar datos.
Cambie el tipo de datos de las columnas o las columnas de conversión a otro formato o tipo. En Machine Learning, use los módulos Editar metadatos o Aplicar SQL transformación. Si tiene experiencia con R o Python, pruebe los módulos Execute Python Script (Ejecutar script de Python ) o Execute R Script (Ejecutar script R ).
Redondear, agrupar o normalizar datos numéricos. Use los módulos Aplicar operación matemática, Agrupar datos en cubos o Normalizar datos.

Lista de módulos

La categoría Conversiones de formato de datos incluye estos módulos:

  • Convertir a ARFF: convierte la entrada de datos al formato de archivo de relación de atributo que usa el conjunto de herramientas de Weka.
  • Convertir a CSV: convierte un conjunto de datos a un formato de valores separados por comas.
  • Convertir en conjunto de datos: convierte la entrada de datos al formato de conjunto de datos interno que usa Machine Learning.
  • Convertir a SVMLight: convierte la entrada de datos al formato que usa el marco SVMlight.
  • Convertir a TSV: convierte la entrada de datos al formato delimitado por tabulaciones.

Consulte también