Partager via


Exporter des données

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

écrit un dataset dans différentes formes de stockage basé sur le cloud dans Azure, telles que les tables, les objets blob et les bases de données de Azure SQL

Catégorie : entrée et sortie de données

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Vue d’ensemble du module

cet article explique comment utiliser le module exporter des données dans Machine Learning Studio (classic) pour enregistrer les résultats, les données intermédiaires et les données de travail à partir de vos expériences dans des destinations de stockage cloud en dehors de Machine Learning Studio (classic).

Ce module prend en charge l’exportation ou de l’enregistrement de vos données dans les services de données cloud suivants :

  • Exporter vers une requête Hive: écrire des données dans une table Hive dans un cluster Hadoop HDInsight.

  • exporter vers Azure SQL Database: enregistrer les données dans Azure SQL Database ou Azure SQL Data Warehouse.

  • Exporter vers une table Azure: enregistrer les données dans le service de stockage de table dans Azure. Le stockage table est idéal pour stocker de grandes quantités de données. Il fournit un format tabulaire évolutif, économique et hautement disponible.

  • exporter vers Stockage Blob Azure: enregistre les données dans le service Blob dans Azure. Cette option est utile pour les images, le texte non structuré ou les données binaires. Les données du service Blob peuvent être partagées publiquement ou enregistrées dans des magasins de données d’application sécurisés.

Notes

Le module exporter les données ne prend pas en charge la connexion au compte de stockage d’objets BLOB Azure si l’option « transfert sécurisé requis » est activée.

  • Télécharger les données : pour télécharger vos données afin de pouvoir les ouvrir dans Excel ou une autre application, utilisez un module comme convertir en CSV ou convertir en TSV pour préparer les données dans un format particulier, puis télécharger les données.

  • Vous pouvez télécharger les résultats de n’importe quel module qui génère un jeu de données en cliquant avec le bouton droit sur la sortie et en sélectionnant Télécharger le jeu de données. Par défaut, les données sont exportées au format CSV.

  • Téléchargez une définition de module ou un graphique d’expérimentation : Une nouvelle bibliothèque PowerShell vous permet de télécharger les métadonnées complètes de votre expérience, ou les détails d’un module particulier. PowerShell pour Machine Learning library est une version expérimentale, mais elle comporte de nombreuses applets de commande utiles :

    • Get-AmlExperiment répertorie toutes les expériences dans un espace de travail.
    • Export-AmlExperimentGraph exporte une définition de l’expérience complète dans un fichier JSON.
    • Download-AmlExperimentNodeOutput vous permet d’extraire les informations fournies sur les ports de sortie de n’importe quel module.

Configuration de l’exportation des données

  1. Ajoutez le module Exporter les données à votre expérience dans Studio (Classic). Ce module figure dans la catégorie Entrée et sortie.

  2. Connecter exporter des données vers le module qui contient les données que vous souhaitez exporter.

  3. Double-cliquez sur Exporter les données pour ouvrir le volet Propriétés.

  4. Pour la destination des données, sélectionnez le type de stockage cloud où vous allez enregistrer vos données. Si vous apportez des modifications à cette option, toutes les autres propriétés sont réinitialisées. Par conséquent, veillez à sélectionner cette option en premier !

  5. Indiquez un nom de compte et une méthode d’authentification requis pour accéder au compte de stockage spécifié.

    Selon le type de stockage et si le compte est sécurisé, vous devrez peut-être fournir le nom du compte, le type de fichier, la clé d’accès ou le nom du conteneur. Pour les sources qui ne requièrent pas d’authentification, il suffit généralement de connaître l’URL.

    Pour obtenir des exemples de chaque type, consultez les rubriques suivantes :

  6. L’option utiliser les résultats mis en cachevous permet de répéter l’expérience sans réécrire les mêmes résultats à chaque fois.

    Si vous désélectionnez cette option, les résultats sont écrits dans le stockage chaque fois que l’expérimentation est exécuté, que les données de sortie aient été modifiées ou non.

    Si vous sélectionnez cette option, Export Data utilise les données mises en cache, le cas échéant. Les nouveaux résultats sont générés uniquement lorsqu’il existe une modification en amont qui affecte les résultats.

  7. Exécutez l’expérience.

Exemples

Pour obtenir des exemples d’utilisation du module exporter des données , consultez la Azure ai Gallery:

Notes techniques

Cette section contient des détails, des conseils et des réponses aux questions fréquentes concernant l’implémentation.

Informations d’implémentation

  • Ce module était précédemment nommé writer. Si vous avez une expérience existante qui utilise le module writer , le module est renommé pour Exporter les données lorsque vous actualisez l’expérience.

  • Les modules ne produisent pas tous une sortie compatible avec les destinations de données d’exportation . Par exemple, les données d’exportation ne peuvent pas enregistrer un DataSet qui a été converti au format SVMLight. Les données d’exportation prennent en charge les formats suivants :

    • jeu de données (format interne Azure ML)
    • DataTable .NET
    • CSV avec ou sans en-tête
    • TSV avec ou sans en-tête

Problèmes connus

  • Lorsque vous sélectionnez la table Azure comme emplacement de sortie de vos données, il peut arriver qu’une erreur se soit produite lors de l’écriture dans la table spécifiée. Dans ce cas, les données peuvent être écrites dans un objet blob à la place.

    Si cette erreur se produit et que vous ne parvenez plus à lire à partir de la table attendue, essayez d’utiliser un utilitaire Azure Storage pour vérifier les objets BLOB dans le conteneur spécifié de votre compte de stockage.

  • Actuellement, vous ne pouvez pas enregistrer un objet BLOB dans une table Hive spécifiée. Si vous devez écrire des résultats intermédiaires, évitez d’utiliser une table Hive dans HDInsight et utilisez le stockage BLOB ou le stockage table à la place.

  • Actuellement, si vous sélectionnez HDFS comme emplacement d’enregistrement des données de sortie, le message d’erreur suivant est retourné : « Microsoft. Analytics. exceptions. ErrorMapping + ModuleException ».

Entrées attendues

Nom Type Description
Dataset Table de données Le jeu de données à écrire.

Paramètres du module

Ce tableau répertorie les paramètres qui s’appliquent à toutes les options Exporter les données . Les autres paramètres sont dynamiques et varient en fonction de la destination de données sélectionnée.

Nom Plage Type Default Description
Veuillez spécifier la destination des données Liste DataSourceOrSink Service BLOB dans Azure Storage indiquez si la destination de données est un fichier dans le service Blob, un fichier dans le service de Table, une base de données de SQL dans Azure ou une Table Hive.
Utiliser les résultats mis en cache TRUE/FALSE Booléen false Sélectionnez cette option pour éviter de réécrire les résultats inutilement. Si quelque chose change en amont dans l’expérience, les données d’exportation s’exécutent toujours et écrivent de nouveaux résultats. Toutefois, si rien n’a changé et que vous avez sélectionné cette option, l' exportation de données ne s’exécute pas afin d’éviter de réécrire les mêmes résultats.

Exceptions

Exception Description
Erreur 0057 Une exception se produit lorsque vous tentez de créer un fichier ou un objet blob qui existe déjà.
Erreur 0001 Une exception se produit si une ou plusieurs colonnes spécifiées du jeu de données sont introuvables.
Erreur 0027 Une exception se produit quand deux objets qui doivent avoir la même taille ne l'ont pas.
Erreur 0079 Une exception se produit si le nom du conteneur dans Azure Storage est spécifié de manière incorrecte.
Erreur 0052 Une exception se produit si la clé d'accès de stockage pour le compte Azure est spécifiée de manière incorrecte.
Erreur 0064 Une exception se produit si le nom du compte ou la clé d'accès de stockage pour le compte Azure est spécifié de manière incorrecte.
Erreur 0071 Une exception se produit si les informations d'identification fournies sont incorrectes.
Erreur 0018 Une exception se produit si le jeu de données d'entrée n'est pas valide.
Erreur 0029 Une exception se produit lorsqu'un URI non valide est passé.
Erreur 0003 Une exception se produit si une ou plusieurs entrées ont la valeur Null ou sont vides.

pour obtenir la liste des erreurs spécifiques aux modules Studio (classiques), consultez Machine Learning codes d’erreur.

pour obtenir la liste des exceptions d’api, consultez Machine Learning les Codes d’erreur de l' api REST.

Voir aussi

Importer des données
Entrée et sortie de données
Transformation des données
Comparaison du stockage de table Azure et de la base de données SQL Azure
Liste alphabétique des modules