Convertir a ARFF
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
Convierte la entrada de datos al formato de archivo de relación de atributos usado por el conjunto de herramientas Weka.
Categoría: Conversiones de formato de datos
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
Información general sobre el módulo
En este artículo se describe cómo usar el módulo Convertir en ARFF en Machine Learning Studio (clásico) para convertir conjuntos de datos y dar como resultado el formato de archivo de relación de atributo utilizado por el conjunto de herramientas de Weka. Este formato se conoce como ARFF.
La especificación de datos ARFF para Weka admite varias tareas de aprendizaje automático, como el preprocesamiento de datos, la clasificación y la selección de características. En este formato, los datos se organizan por entitos y sus atributos, y se incluyen en un único archivo de texto. Puede encontrar detalles del formato de archivo Weka en la sección Notas técnicas .
En general, la conversión al formato de archivo Weka solo es necesaria si desea usar Machine Learning y Weka, y pretende mover los datos de entrenamiento entre ellos.
Para más información sobre el conjunto de herramientas de Weka, consulte este artículo de Wikipedia: Weka (aprendizaje automático)
Advertencia
No puede sobrescribir un archivo ARFF existente en Azure Storage.
Cómo usar Convertir en ARFF
Agregue el módulo Convertir en ARFF al experimento. Puede encontrar este módulo en la categoría Conversiones de formato de datos en Machine Learning Studio (clásico).
Conéctelo a cualquier módulo que genere un conjunto de datos.
Ejecute el experimento o haga clic en el módulo Convertir en ARFF y haga clic en Ejecutar seleccionado.
Results
Para crear una copia de los datos en una carpeta local, haga doble clic en la salida de Convertir en ARFF y seleccione la opción Descargar.
Si no especifica una carpeta, se aplica un nombre de archivo predeterminado y el archivo se guarda en la biblioteca de descargas local.
Nota:
Este módulo no admite la exportación a código de Python o R.
Ejemplos
No hay ningún ejemplo específico de este formato en el Azure AI Gallery. Sin embargo, estos experimentos muestran otros tipos de conversión de formato:
Compresión de imágenes basada en colores: exporta los conjuntos de datos usados para cada parte del análisis a los archivos para su reproducibilidad y su uso en otras plataformas de análisis.
Ejemplo de validación cruzada para clasificación binaria: exporta los resultados de la validación cruzada a archivos para que los resultados de varios modelos se puedan comparar mediante una herramienta como Excel.
Notas técnicas
Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.
Ejemplo de formato ARFF
En esta sección se proporciona un ejemplo de cómo sería un conjunto de datos típico cuando se convierte a ARFF.
Normalmente, un archivo de datos ARFF consta de dos secciones: un encabezado que define el origen de datos y el esquema, y la sección de datos, que contiene las entidades reales y sus atributos.
Encabezado ARFF
El encabezado de un archivo ARFF define la lista de los atributos (en columnas) y sus tipos de datos. El encabezado también puede contener varias líneas de comentario que describen el origen de datos o cualquier otra nota.
% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}
Sugerencia
Si el conjunto de datos que va a convertir no tiene nombres de columna, use el módulo Editar metadatos para agregar nombres de columna antes de usar la conversión a ARFF.
Datos ARFF
La sección de datos consta de valores separados por comas y se parece mucho a un archivo CSV sin encabezados de columna.
@DATA 5.1,3.5,1.4,0.2,0
Para más información sobre este formato de archivo, consulte la página Wiki de Weka: ARFF (versión para desarrolladores).
Versión actual de ARFF
Machine Learning Studio (clásico) guarda los archivos ARFF con el formato ARFF 3.0.
Entradas esperadas
Nombre | Tipo | Descripción |
---|---|---|
Dataset | Tabla de datos | Conjunto de datos de entrada |
Salidas
Nombre | Tipo | Descripción |
---|---|---|
Conjunto de datos de resultados | Arff | Conjunto de datos de salida |