Partager via


Convert to TSV

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

Convertit l'entrée de données dans un format délimité par des tabulations

Catégorie : conversions de format de données

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Vue d’ensemble du module

cet article explique comment utiliser le module Convert to TSV dans Machine Learning Studio (classic) pour convertir un jeu de données du format interne utilisé par tous les modules Machine Learning Studio (classic) en un fichier plat au format séparé par des tabulations.

Les fichiers à valeurs séparées par une tabulation (TSV) sont compatibles avec de nombreux outils externes, notamment :

  • R et Python

  • Excel et PowerPivot

  • Toutes les bases de données relationnelles

Par exemple, si votre expérience a un jeu de données intermédiaire que vous souhaitez enregistrer pour réutiliser dans un autre outil ou si vous souhaitez appeler à partir du code, vous devez le convertir au format TSV, puis cliquer avec le bouton droit sur le DataSet converti pour obtenir le code python nécessaire pour accéder au jeu de données.

Utilisation de Convert to TSV

Utilisez le module convertir en TSV chaque fois que vous devez télécharger un jeu de données au format délimité par des tabulations.

  1. Ajoutez la conversion en TSV à votre expérience. vous pouvez trouver ce module dans la catégorie conversions de Format de données dans Machine Learning Studio (classic).

  2. Connecter le module à un autre dataset ou à un module qui génère un jeu de données tabulaire.

  3. Exécutez l’expérience, ou cliquez avec le bouton droit sur le module Convert to TSV , puis sélectionnez exécuter la sélection.

Résultats

Une fois la conversion terminée, vous pouvez ouvrir le jeu de données, l’appeler à partir du code R ou python, l’utiliser dans un bloc-notes Jupyter ou l’enregistrer dans un fichier local.

Si vous souhaitez télécharger le jeu de données, double-cliquez sur la sortie du module et indiquez si vous souhaitez ouvrir ou enregistrer le DataSet.

  • Si vous sélectionnez ouvrir, le jeu de données est chargé à l’aide de l’outil que votre ordinateur utilise par défaut pour s’ouvrir. Fichiers TSV. En général, il s’agit de Microsoft Excel.

  • Si vous sélectionnez Télécharger le jeu de données, par défaut, le fichier est enregistré avec le nom du module plus un GUID représentant l’ID de l’espace de travail. Toutefois, vous pouvez sélectionner l’option Enregistrer sous pendant le téléchargement et modifier le nom ou l’emplacement du fichier.

Exemples

Bien qu’il n’existe aucun exemple spécifique à ce format, vous pouvez voir des exemples d’utilisation de la conversion de format en explorant ces exemples d’expériences dans le Azure ai Gallery:

  • Exemple de validation croisée pour la classification binaire: exporte les résultats de la validation croisée au format CSV (valeurs séparées par des virgules) afin que les résultats de plusieurs modèles puissent être comparés à l’aide d’un outil tel que Excel.

  • Quantification de la compression d’image basée sur des couleurs: exporte les jeux de données utilisés pour chaque partie de l’analyse dans des fichiers CSV, afin que vous puissiez facilement exécuter un modèle similaire dans n’importe quel outil qui prend en charge le format CSV.

Notes techniques

Cette section contient des détails, des conseils et des réponses aux questions fréquentes concernant l’implémentation.

Exigences relatives au format TSV

Le format à valeurs séparées par une tabulation (TSV) est un format de texte qui est utilisé pour stocker des données dans une structure tabulaire. Il ressemble beaucoup au format CSV, mais le délimiteur est une tabulation plutôt qu'une virgule.

Le format TSV constitue une alternative utile au format CSV si vos données contiennent des virgules. Les virgules sont très courantes dans les données texte et sont utilisées dans les formats européens de nombres.

Un problème avec le format délimité par des tabulations est que ces dernières sont fréquemment reconnues comme des espaces blancs dans les textes non structurés. Cependant, la norme IANA pour le format TSV favorise l'analyse simple et précise des fichiers TSV en interdisant les tabulations dans les champs.

notez la configuration requise suivante pour les fichiers TSV dans Machine Learning Studio (classic) :

  • Le module Convert to TSV prend en charge la sortie d'une ligne d'en-tête unique si le jeu de données contient des noms de colonnes.

  • Le fournisseur TSV prend en charge l'encodage de caractères UTF-8 uniquement.

  • Lors de la lecture ou de l'écriture dans des fichiers TSV, les performances peuvent être plus lentes qu'avec d'autres formats, tels que CSV.

Entrées attendues

Nom Type Description
Dataset Table de données Jeu de données d'entrée

Output

Nom Type Description
Jeu de données de résultats GenericTsv Jeu de données de sortie

Voir aussi

Conversion des formats de données
Liste alphabétique des modules