Partager via


Exportation vers Stockage Blob Azure

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

cet article explique comment utiliser l’option exporter vers Stockage Blob Azure , dans le module exporter des données dans Machine Learning Studio (classic).

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

cette option est utile lorsque vous souhaitez exporter des données à partir d’une expérience Machine Learning vers Stockage Blob Azure. Par exemple, vous pouvez souhaiter partager des sorties de données Machine Learning avec d’autres applications, ou stocker des données intermédiaires ou nettoyer des jeux de données pour les utiliser dans d’autres expériences.

Vous pouvez accéder aux objets Blob Azure à partir de n’importe où, à l’aide du HTTP ou du HTTPS. étant donné que Stockage Blob Azure est un magasin de données non structuré, vous pouvez exporter des données dans différents formats. Les formats CSV, TSV et ARFF sont actuellement pris en charge.

pour exporter des données vers un objet blob Azure pour une utilisation par d’autres applications, vous utilisez le module exporter les données pour enregistrer les données dans Stockage Blob Azure. utilisez ensuite n’importe quel outil capable de lire des données à partir du stockage Azure (par exemple, Excel, des utilitaires de stockage cloud ou d’autres services cloud) pour charger et utiliser les données.

Notes

Les modules Importer des données et Exporter des données peuvent lire et écrire des données uniquement à partir du stockage Azure créé à l’aide du modèle de déploiement classique. en d’autres termes, le nouveau type de compte Stockage Blob Azure qui offre un niveau d’accès de stockage chaud et froid n’est pas encore pris en charge.

En règle générale, les comptes de stockage Azure que vous avez peut-être créés avant que cette option de service ne soit disponible ne devraient pas être affectés.

toutefois, si vous devez créer un nouveau compte pour une utilisation avec Machine Learning, nous vous recommandons de sélectionner Classic pour le modèle de déploiement, ou d’utiliser resource manager et pour le type de compte, de sélectionner usage général plutôt que stockage d' objets Blob.

comment exporter des données vers Stockage Blob Azure

Le service blob Azure sert à stocker de grandes quantités de données, y compris des données binaires. Il existe deux types de stockage d’objets Blob : les objets blob publics et les objets Blob qui nécessitent des informations d’identification de connexion.

  1. Ajoutez le module Exporter les données à votre expérience. Vous pouvez trouver ce module dans la catégorie entrée et sortie de données dans Studio (Classic).

  2. Connecter exporter des données vers le module qui produit les données que vous souhaitez exporter vers Stockage Blob Azure.

  3. Ouvrez le volet Propriétés de exporter des données. pour la destination des données, sélectionnez Stockage Blob Azure.

  4. Pour type d’authentification, choisissez public (URL SAS) si vous savez que le stockage prend en charge l’accès via une URL SAS.

    Une URL SAS est un type spécial d’URL qui peut être généré à l’aide d’un utilitaire de stockage Azure et qui est disponible uniquement pendant une période limitée. Elle contient toutes les informations nécessaires pour l’authentification et le téléchargement.

    Pour l’URI, saisissez ou collez l’URI complet qui définit le compte et l’objet blob public.

  5. Pour les comptes privés, choisissez Compte, puis indiquez le nom du compte et la clé du compte, afin que l’expérience puisse écrire dans le compte de stockage.

    • Nom du compte: tapez ou collez le nom du compte dans lequel vous souhaitez enregistrer les données. Par exemple, si l’URL complète du compte de stockage est https://myshared.blob.core.windows.net, vous devez saisir myshared.

    • Clé de compte: collez la clé d’accès de stockage associée au compte.

  6. Chemin d’accès au conteneur, répertoire ou objet BLOB: tapez le nom de l’objet BLOB dans lequel les données exportées seront stockées. Par exemple, pour enregistrer les résultats de votre expérience dans un nouvel objet blob nommé results01.csv du conteneur prédictions dans un compte nommé mymldata, l’URL complète de l’objet blob serait https://mymldata.blob.core.windows.net/predictions/results01.csv.

    Par conséquent, dans le champ chemin d’accès au conteneur, répertoire ou objet BLOB, vous devez spécifier le nom du conteneur et du BLOB comme suit : predictions/results01.csv

  7. Si vous spécifiez le nom d’un objet blob qui n’existe pas encore, Azure crée l’objet blob pour vous.

    lors de l’écriture dans un objet blob existant, vous pouvez spécifier que le contenu actuel de l’objet blob doit être remplacé en définissant la propriété, Stockage Blob Azure mode écriture. Par défaut, cette propriété est définie sur Erreur, ce qui signifie qu’une erreur est générée chaque fois qu’un fichier blob portant le même nom est trouvé.

  8. Pour le format du fichier blob, sélectionnez le format dans lequel les données doivent être stockées.

    • CSV: les valeurs séparées par des virgules (CSV) sont le format de stockage par défaut. Pour exporter les en-têtes de colonnes avec les données, sélectionnez l’option Write blob header row (Écrire la ligne d’en-tête d’objet blob). pour plus d’informations sur le format délimité par des virgules utilisé dans Machine Learning, consultez convertir en CSV.

    • TSV: le format TSV (valeurs séparées par des tabulations) est compatible avec de nombreux outils de machine learning. Pour exporter les en-têtes de colonnes avec les données, sélectionnez l’option Write blob header row (Écrire la ligne d’en-tête d’objet blob). pour plus d’informations sur le format séparé par des tabulations utilisé dans Machine Learning, voir Convert to TSV.

    • ARFF: ce format prend en charge l’enregistrement des fichiers au format utilisé par l’ensemble d’outils weka. Ce format n’est pas pris en charge pour les fichiers stockés dans une URL SAS. Pour plus d’informations sur le format ARFF, consultez Convert to ARFF.

  9. Utiliser les résultats mis en cache: sélectionnez cette option si vous voulez éviter de réécrire les résultats dans le fichier d’objet BLOB chaque fois que vous exécutez l’expérience. Si aucune autre modification n’est apportée aux paramètres du module, l’expérience écrit les résultats uniquement lors de la première exécution du module, ou lorsque des données sont modifiées.

Exemples

Pour obtenir des exemples d’utilisation du module exporter des données , consultez la Azure ai Gallery:

Notes techniques

Cette section contient des détails, des conseils et des réponses aux questions fréquentes concernant l’implémentation.

Questions courantes

Comment éviter d’écrire les données si l’expérience n’a pas changé

Lorsque vos résultats d’expérimentation changent, Export Data enregistre toujours le nouveau jeu de données. Toutefois, si vous exécutez l’expérience à plusieurs reprises sans apporter de modifications qui affectent les données de sortie, vous pouvez sélectionner l’option utiliser les résultats en cache .

Le module vérifie si l’expérience a été exécutée précédemment en utilisant les mêmes données et les mêmes options, et si une exécution précédente est trouvée, l’opération d’écriture n’est pas répétée.

Puis-je enregistrer des données dans un compte dans une autre région géographique

Oui, vous pouvez écrire des données dans des comptes de différentes régions. Toutefois, si le compte de stockage se trouve dans une région différente du nœud de calcul utilisé pour l’expérience Machine Learning, l’accès aux données peut être plus lent. En outre, vous êtes facturé pour l’entrée et la sortie des données de l’abonnement.

Paramètres du module

Options générales

Nom Plage Type Default Description
Source de données Liste Source ou récepteur de données Stockage Blob Azure la destination peut être un fichier dans le stockage d’objets BLOB azure, une table azure, une table ou une vue dans un Azure SQL Database ou une table Hive.
Utiliser les résultats mis en cache TRUE/FALSE Booléen false Le module s’exécute uniquement si le cache valide n’existe pas ; Sinon, utilisez les données mises en cache à partir de l’exécution précédente.
Spécifiez le type d'authentification SAS/compte AuthenticationType Compte Indique si les informations d’identification du compte ou de la SAP doivent être utilisées pour l’autorisation d’accès

Options de stockage public ou SAS-public

Nom Plage Type Default Description
URI SAS pour objet blob n'importe laquelle String aucun URI SAS de l’objet BLOB dans lequel écrire (obligatoire)
Format de fichier SAS ARFF

CSV

TSV
LoaderUtils. FileTypes CSV Indique si le fichier est CSV, TSV ou ARFF. (obligatoire)
Écrire la ligne d'en-tête SAS TRUE/FALSE Booléen false Indique si les en-têtes de colonne doivent être écrits dans le fichier

Options de stockage privée du compte

Nom Plage Type Default Description
Nom du compte Azure n'importe laquelle String aucun Nom du compte d’utilisateur Azure
Clé de compte Azure n'importe laquelle SecureString aucun Clé de stockage Azure
Chemin d'accès à l'objet blob commençant par le conteneur n'importe laquelle String aucun Nom du fichier d’objet BLOB, en commençant par le nom du conteneur
mode d’écriture Stockage Blob Azure Liste : erreur, remplacement enum : BlobFileWriteMode Erreur Choisir la méthode d’écriture des fichiers d’objets BLOB
Format de fichier d'objet blob ARFF

CSV

TSV
LoaderUtils. FileTypes CSV Indique si le fichier BLOB est CSV, TSV ou ARFF
Écrire la ligne d'en-tête d'objet blob TRUE/FALSE Booléen false Indique si le fichier BLOB doit avoir une ligne d’en-tête

Exceptions

Exception Description
Erreur 0027 Une exception se produit quand deux objets qui doivent avoir la même taille ne l'ont pas.
Erreur 0003 Une exception se produit si une ou plusieurs entrées ont la valeur Null ou sont vides.
Erreur 0029 Une exception se produit lorsqu'un URI non valide est passé.
Erreur 0030 Une exception se produit lorsqu'il n'est pas possible de télécharger un fichier.
Erreur 0002 Une exception se produit si un ou plusieurs paramètres n'ont pas pu être analysés ou convertis à partir du type spécifié dans le type requis par la méthode cible.
Erreur 0009 Une exception se produit si le nom du compte de stockage Azure ou le nom du conteneur est spécifié de manière incorrecte.
Erreur 0048 Une exception se produit quand il n'est pas possible d'ouvrir un fichier.
Erreur 0046 Une exception se produit quand il n'est pas possible de créer un répertoire sur le chemin d'accès spécifié.
Erreur 0049 Une exception se produit quand il n'est pas possible d'analyser un fichier.

pour obtenir la liste des erreurs spécifiques aux modules Studio (classiques), consultez Machine Learning codes d’erreur.

pour obtenir la liste des exceptions d’api, consultez Machine Learning les Codes d’erreur de l' api REST.

Voir aussi

Importer des données
Exporter les données
Exporter vers Azure SQL Database
Exporter vers une requête Hive
Exporter vers Table Azure