AzureDataLakeGen2Datastore Classe
Représente un magasin de données qui enregistre les informations de connexion dans Azure Data Lake Storage Gen2.
Pour créer un magasin de données qui enregistre les informations de connexion dans Azure Data Lake Storage, utilisez la méthode register_azure_data_lake_gen2
de la classe Datastore.
Pour accéder aux données à partir d’un objet AzureDataLakeGen2Datastore, créez un Dataset et utilisez l’une des méthodes comme from_files pour un FileDataset. Pour plus d’informations, consultez Créer des jeux de données Azure Machine Learning.
Gardez également à l’esprit les points suivants :
La classe AzureDataLakeGen2 ne fournit pas de méthode de chargement. Il est recommandé de charger les données dans les magasins de données AzureDataLakeGen2 via le chargement de jeux de données. Vous trouverez plus d’informations à la section : https://docs.microsoft.com/azure/machine-learning/how-to-create-register-datasets
Quand vous utilisez un magasin de données pour accéder aux données, vous devez avoir l’autorisation d’accéder aux données. Cela dépend des informations d’identification inscrites auprès du magasin de données.
Quand vous utilisez l’authentification du principal de service pour accéder au stockage via AzureDataLakeGen2, le principal de service ou l’inscription de l’application doit disposer au minimum du rôle spécifique de contrôle d’accès en fonction du rôle (RBAC) de « Lecteur des données blob du stockage ». Pour plus d’informations, consultez Rôles intégrés au stockage.
Initialise un nouveau magasin de données Azure Data Lake Gen2.
- Héritage
-
AzureDataLakeGen2Datastore
Constructeur
AzureDataLakeGen2Datastore(workspace, name, container_name, account_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, protocol=None, endpoint=None, service_data_access_auth_identity=None)
Paramètres
- resource_url
- str
URL de ressource qui détermine les opérations à exécuter sur le Data Lake Store.
- authority_url
- str
URL de l’autorité utilisée pour authentifier l’utilisateur.
- protocol
- str
Protocole à utiliser pour la connexion au conteneur d’objets blob. Si None est défini, la valeur par défaut est https.
- endpoint
- str
Point de terminaison du conteneur d’objets blob. Si None est défini, la valeur par défaut est core.windows.net.
- service_data_access_auth_identity
- str ou <xref:_restclient.models.ServiceDataAccessAuthIdentity>
Indique l’identité à utiliser pour authentifier l’accès aux données de service au stockage du client. Les valeurs possibles sont notamment : « None », « WorkspaceSystemAssignedIdentity », « WorkspaceUserAssignedIdentity »
- resource_url
- str
URL de ressource qui détermine les opérations à exécuter sur le Data Lake Store.
- protocol
- str
Protocole à utiliser pour la connexion au conteneur d’objets blob. Si None est défini, la valeur par défaut est https.
- endpoint
- str
Point de terminaison du conteneur d’objets blob. Si None est défini, la valeur par défaut est core.windows.net.
- service_data_access_auth_identity
- str ou <xref:_restclient.models.ServiceDataAccessAuthIdentity>
Indique l’identité à utiliser pour authentifier l’accès aux données de service au stockage du client. Les valeurs possibles sont notamment : « None », « WorkspaceSystemAssignedIdentity », « WorkspaceUserAssignedIdentity »
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour