Compartir a través de


Convertir a ARFF

Importante

El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.

A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.

La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.

Convierte la entrada de datos al formato de archivo de relación de atributos usado por el conjunto de herramientas Weka.

Categoría: Conversiones de formato de datos

Nota:

Solo se aplica a: Machine Learning Studio (clásico)

Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.

Información general sobre el módulo

En este artículo se describe cómo usar el módulo Convertir en ARFF en Machine Learning Studio (clásico) para convertir conjuntos de datos y dar como resultado el formato de archivo de relación de atributo utilizado por el conjunto de herramientas de Weka. Este formato se conoce como ARFF.

La especificación de datos ARFF para Weka admite varias tareas de aprendizaje automático, como el preprocesamiento de datos, la clasificación y la selección de características. En este formato, los datos se organizan por entitos y sus atributos, y se incluyen en un único archivo de texto. Puede encontrar detalles del formato de archivo Weka en la sección Notas técnicas .

En general, la conversión al formato de archivo Weka solo es necesaria si desea usar Machine Learning y Weka, y pretende mover los datos de entrenamiento entre ellos.

Para más información sobre el conjunto de herramientas de Weka, consulte este artículo de Wikipedia: Weka (aprendizaje automático)

Advertencia

No puede sobrescribir un archivo ARFF existente en Azure Storage.

Cómo usar Convertir en ARFF

  1. Agregue el módulo Convertir en ARFF al experimento. Puede encontrar este módulo en la categoría Conversiones de formato de datos en Machine Learning Studio (clásico).

  2. Conéctelo a cualquier módulo que genere un conjunto de datos.

  3. Ejecute el experimento o haga clic en el módulo Convertir en ARFF y haga clic en Ejecutar seleccionado.

Results

  • Para crear una copia de los datos en una carpeta local, haga doble clic en la salida de Convertir en ARFF y seleccione la opción Descargar.

    Si no especifica una carpeta, se aplica un nombre de archivo predeterminado y el archivo se guarda en la biblioteca de descargas local.

Nota:

Este módulo no admite la exportación a código de Python o R.

Ejemplos

No hay ningún ejemplo específico de este formato en el Azure AI Gallery. Sin embargo, estos experimentos muestran otros tipos de conversión de formato:

  • Compresión de imágenes basada en colores: exporta los conjuntos de datos usados para cada parte del análisis a los archivos para su reproducibilidad y su uso en otras plataformas de análisis.

  • Ejemplo de validación cruzada para clasificación binaria: exporta los resultados de la validación cruzada a archivos para que los resultados de varios modelos se puedan comparar mediante una herramienta como Excel.

Notas técnicas

Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.

Ejemplo de formato ARFF

En esta sección se proporciona un ejemplo de cómo sería un conjunto de datos típico cuando se convierte a ARFF.

Normalmente, un archivo de datos ARFF consta de dos secciones: un encabezado que define el origen de datos y el esquema, y la sección de datos, que contiene las entidades reales y sus atributos.

Encabezado ARFF

El encabezado de un archivo ARFF define la lista de los atributos (en columnas) y sus tipos de datos. El encabezado también puede contener varias líneas de comentario que describen el origen de datos o cualquier otra nota.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Sugerencia

Si el conjunto de datos que va a convertir no tiene nombres de columna, use el módulo Editar metadatos para agregar nombres de columna antes de usar la conversión a ARFF.

Datos ARFF

La sección de datos consta de valores separados por comas y se parece mucho a un archivo CSV sin encabezados de columna.

@DATA 5.1,3.5,1.4,0.2,0

Para más información sobre este formato de archivo, consulte la página Wiki de Weka: ARFF (versión para desarrolladores).

Versión actual de ARFF

Machine Learning Studio (clásico) guarda los archivos ARFF con el formato ARFF 3.0.

Entradas esperadas

Nombre Tipo Descripción
Dataset Tabla de datos Conjunto de datos de entrada

Salidas

Nombre Tipo Descripción
Conjunto de datos de resultados Arff Conjunto de datos de salida

Consulte también

Conversiones de formato de datos
Lista de módulos A-Z