Partager via


Convert to ARFF

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

Convertit les données d'entrée au format de fichier ARFF (Attribute Relation File Format) utilisé par l'ensemble d'outils Weka.

Catégorie : conversions de format de données

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Vue d’ensemble du module

cet article explique comment utiliser le module Convert to ARFF dans Machine Learning Studio (classic) pour convertir des jeux de données et des résultats en format de fichier de relation d’attribut utilisé par l’ensemble d’outils Weka. Ce format est appelé ARFF.

La spécification de données ARFF pour weka prend en charge plusieurs tâches Machine Learning, notamment le prétraitement des données, la classification et la sélection des fonctionnalités. Dans ce format, les données sont organisées par entités et leurs attributs, et elles sont contenues dans un seul fichier texte. Pour plus d’informations sur le format de fichier weka, consultez la section Notes techniques .

en général, la conversion au format de fichier Weka est requise uniquement si vous souhaitez utiliser à la fois Machine Learning et Weka, et si vous souhaitez déplacer les données d’apprentissage entre elles.

Pour plus d’informations sur l’ensemble d’outils weka, consultez cet article de Wikipédia : weka (machine learning)

Avertissement

Vous ne pouvez pas remplacer un fichier ARFF existant dans Azure Storage.

Comment utiliser Convert to ARFF

  1. Ajoutez le module Convert to ARFF à votre expérience. vous pouvez trouver ce module dans la catégorie conversions de Format de données dans Machine Learning Studio (classic).

  2. Connectez-le à n’importe quel module qui génère un jeu de données.

  3. Exécutez l’expérience ou cliquez sur le module convertir en ARFF , puis cliquez sur exécuter la sélection.

Résultats

  • Pour créer une copie des données dans un dossier local, double-cliquez sur la sortie de Convert to ARFFet sélectionnez l’option de Téléchargement .

    Si vous ne spécifiez pas de dossier, un nom de fichier par défaut est appliqué et le fichier est enregistré dans la bibliothèque de téléchargements locaux.

Notes

Ce module ne prend pas en charge l’exportation vers du code python ou R.

Exemples

Il n’existe aucun exemple spécifique à ce format dans le Azure ai Gallery. Toutefois, ces expériences illustrent d’autres types de conversion de format :

Notes techniques

Cette section contient des détails, des conseils et des réponses aux questions fréquentes concernant l’implémentation.

Exemple de format ARFF

Cette section fournit un exemple de l’aspect d’un jeu de données typique lors de la conversion en ARFF.

En général, un fichier de données ARFF est composé de deux sections : un en-tête qui définit la source de données et le schéma, et la section de données , qui contient les entités réelles et leurs attributs.

En-tête ARFF

L’en-tête d’un fichier ARFF définit la liste des attributs (en colonnes) et leurs types de données. L'en-tête peut également contenir plusieurs lignes de commentaire décrivant la source de données ou d'autres notes.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Conseil

Si le jeu de données que vous convertissez n’a pas de noms de colonnes, utilisez le module modifier les métadonnées pour ajouter des noms de colonnes avant d’utiliser la conversion en ARFF.

Données ARFF

La section de données se compose de valeurs séparées par des virgules et ressemble beaucoup à un fichier CSV sans en-têtes de colonnes.

@DATA 5.1,3.5,1.4,0.2,0

Pour plus d’informations sur ce format de fichier, consultez la page wiki weka : ARFF (version développeur).

Version actuelle de ARFF

Machine Learning Studio (classic) enregistre les fichiers ARFF à l’aide du format ARFF 3,0.

Entrées attendues

Nom Type Description
Dataset Table de données Jeu de données d'entrée

Sorties

Nom Type Description
Jeu de données de résultats Arff Jeu de données de sortie

Voir aussi

Conversion des formats de données
Liste alphabétique des modules