Schéma YAML pour Azure Data Lake Gen2 avec l’interface CLI (v2)

S’APPLIQUE À :Extension Azure ML CLI v2 (actuelle)

Le schéma JSON source se trouve à cette ressource.

Remarque

La syntaxe YAML détaillée dans ce document est basée sur le schéma JSON pour la dernière version de l’extension ML CLI v2. Le fonctionnement de cette syntaxe est garanti uniquement avec la dernière version de l’extension ML CLI v2. Vous trouverez les schémas des versions d’extension plus anciennes sur https://azuremlschemasprod.azureedge.net/.

Syntaxe YAML

Clé Type Description Valeurs autorisées Valeur par défaut
$schema string Schéma YAML. Si vous utilisez l’extension Visual Studio Code de Azure Machine Learning pour créer le fichier YAML, vous pouvez appeler des achèvements de schéma et de ressource si vous ajoutez $schema en haut de votre fichier.
type string Obligatoire. Le type de magasin de données. azure_data_lake_gen2
name string Obligatoire. Nom du magasin de données.
description string Description du magasin de données.
tags object Dictionnaire d’étiquettes de magasin de données.
account_name string Obligatoire. Nom du compte de stockage Azure.
filesystem string Obligatoire. Le nom du système de fichiers. Répertoire parent contenant les fichiers et dossiers, équivalent à un conteneur de stockage Azure Blog.
endpoint string Suffixe de point de terminaison du service de stockage, utilisé pour la création de l’URL du point de terminaison du compte de stockage. Il combine le nom du compte de stockage et endpoint. Exemple d’URL de compte de stockage : https://<storage-account-name>.dfs.core.windows.net. core.windows.net
protocol string Protocole pour la connexion au système de fichiers. https, abfss https
credentials object Informations d’identification du principal de service pour la connexion au compte de stockage Azure. Les secrets des informations d’identification sont stockés dans le coffre de clés de l’espace de travail.
credentials.tenant_id string L’ID de locataire du principal du service. Obligatoire si credentials est spécifié.
credentials.client_id string ID de client du principal du service. Obligatoire si credentials est spécifié.
credentials.client_secret string Secret client du principal du service. Obligatoire si credentials est spécifié.
credentials.resource_url string URL de ressource qui spécifie les opérations qui vont être effectuées sur le compte Azure Data Lake Storage Gen2. https://storage.azure.com/
credentials.authority_url string URL d’autorité utilisée pour l’authentification utilisateur. https://login.microsoftonline.com

Remarques

La commande az ml datastore peut être utilisée pour gérer les magasins de données d’Azure Machine Learning.

Exemples

Des exemples sont disponibles dans le référentiel d’exemples GitHub. Vous en trouverez plusieurs ici :

YAML : accès basé sur l’identité

$schema: https://azuremlschemas.azureedge.net/latest/azureDataLakeGen2.schema.json
name: adls_gen2_credless_example
type: azure_data_lake_gen2
description: Credential-less datastore pointing to an Azure Data Lake Storage Gen2.
account_name: mytestdatalakegen2
filesystem: my-gen2-container

YAML : ID locataire, ID client, secret client

$schema: https://azuremlschemas.azureedge.net/latest/azureDataLakeGen2.schema.json
name: adls_gen2_example
type: azure_data_lake_gen2
description: Datastore pointing to an Azure Data Lake Storage Gen2.
account_name: mytestdatalakegen2
filesystem: my-gen2-container
credentials:
  tenant_id: XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX
  client_id: XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX
  client_secret: XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Étapes suivantes