Partager via


AzureDataLakeGen2Datastore Classe

Représente un magasin de données qui enregistre les informations de connexion dans Azure Data Lake Storage Gen2.

Pour créer un magasin de données qui enregistre les informations de connexion dans Azure Data Lake Storage, utilisez la méthode register_azure_data_lake_gen2 de la classe Datastore.

Pour accéder aux données à partir d’un objet AzureDataLakeGen2Datastore, créez un Dataset et utilisez l’une des méthodes comme from_files pour un FileDataset. Pour plus d’informations, consultez Créer des jeux de données Azure Machine Learning.

Gardez également à l’esprit les points suivants :

  • La classe AzureDataLakeGen2 ne fournit pas de méthode de chargement. Il est recommandé de charger les données dans les magasins de données AzureDataLakeGen2 via le chargement de jeux de données. Vous trouverez plus d’informations à la section : https://docs.microsoft.com/azure/machine-learning/how-to-create-register-datasets

  • Quand vous utilisez un magasin de données pour accéder aux données, vous devez avoir l’autorisation d’accéder aux données. Cela dépend des informations d’identification inscrites auprès du magasin de données.

  • Quand vous utilisez l’authentification du principal de service pour accéder au stockage via AzureDataLakeGen2, le principal de service ou l’inscription de l’application doit disposer au minimum du rôle spécifique de contrôle d’accès en fonction du rôle (RBAC) de « Lecteur des données blob du stockage ». Pour plus d’informations, consultez Rôles intégrés au stockage.

Initialise un nouveau magasin de données Azure Data Lake Gen2.

Héritage
AzureDataLakeGen2Datastore

Constructeur

AzureDataLakeGen2Datastore(workspace, name, container_name, account_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, protocol=None, endpoint=None, service_data_access_auth_identity=None)

Paramètres

workspace
str
Obligatoire

Espace de travail auquel ce magasin de données appartient.

name
str
Obligatoire

Nom du magasin de données.

container_name
str
Obligatoire

Nom du conteneur d’objets blob Azure.

account_name
str
Obligatoire

nom du compte de stockage.

tenant_id
str
valeur par défaut: None

ID de répertoire/ID de locataire du principal de service.

client_id
str
valeur par défaut: None

ID de client/ID d’application du principal de service.

client_secret
str
valeur par défaut: None

Secret du principal de service.

resource_url
str
valeur par défaut: None

URL de ressource qui détermine les opérations à exécuter sur le Data Lake Store.

authority_url
str
valeur par défaut: None

URL de l’autorité utilisée pour authentifier l’utilisateur.

protocol
str
valeur par défaut: None

Protocole à utiliser pour la connexion au conteneur d’objets blob. Si None est défini, la valeur par défaut est https.

endpoint
str
valeur par défaut: None

Point de terminaison du conteneur d’objets blob. Si None est défini, la valeur par défaut est core.windows.net.

service_data_access_auth_identity
str ou <xref:_restclient.models.ServiceDataAccessAuthIdentity>
valeur par défaut: None

Indique l’identité à utiliser pour authentifier l’accès aux données de service au stockage du client. Les valeurs possibles sont notamment : « None », « WorkspaceSystemAssignedIdentity », « WorkspaceUserAssignedIdentity »

workspace
str
Obligatoire

Espace de travail auquel ce magasin de données appartient.

name
str
Obligatoire

Nom du magasin de données.

container_name
str
Obligatoire

Nom du conteneur d’objets blob Azure.

account_name
str
Obligatoire

nom du compte de stockage.

tenant_id
str
Obligatoire

ID de répertoire/ID de locataire du principal de service.

client_id
str
Obligatoire

ID de client/ID d’application du principal de service.

client_secret
str
Obligatoire

Secret du principal de service.

resource_url
str
Obligatoire

URL de ressource qui détermine les opérations à exécuter sur le Data Lake Store.

authority_url
str
Obligatoire

URL de l’autorité utilisée pour authentifier l’utilisateur.

protocol
str
Obligatoire

Protocole à utiliser pour la connexion au conteneur d’objets blob. Si None est défini, la valeur par défaut est https.

endpoint
str
Obligatoire

Point de terminaison du conteneur d’objets blob. Si None est défini, la valeur par défaut est core.windows.net.

service_data_access_auth_identity
str ou <xref:_restclient.models.ServiceDataAccessAuthIdentity>
Obligatoire

Indique l’identité à utiliser pour authentifier l’accès aux données de service au stockage du client. Les valeurs possibles sont notamment : « None », « WorkspaceSystemAssignedIdentity », « WorkspaceUserAssignedIdentity »