Freigeben über


AzureDataLakeGen2Datastore Klasse

Stellt einen Datenspeicher dar, der Verbindungsinformationen in Azure Data Lake Storage Gen2 speichert.

Verwenden Sie eine der register_azure_data_lake_gen2-Methoden der Datastore-Klasse, um einen Datenspeicher zu erstellen, der Verbindungsinformationen in Azure Data Lake Storage speichert.

Erstellen Sie zum Zugreifen auf Daten aus einem AzureDataLakeGen2Datastore-Objekt ein Dataset, und verwenden Sie eine der Methoden wie from_files für ein Dateidataset (FileDataset). Weitere Informationen finden Sie unter Erstellen von Azure Machine Learning-Datasets.

Berücksichtigen Sie auch Folgendes:

  • Die AzureDataLakeGen2-Klasse bietet keine Uploadmethode. Die empfohlene Methode zum Hochladen von Daten in AzureDataLakeGen2-Datenspeicher ist der Datasetupload. Weitere Informationen finden Sie unter https://docs.microsoft.com/azure/machine-learning/how-to-create-register-datasets.

  • Wenn Sie einen Datenspeicher für den Zugriff auf Daten verwenden, müssen Sie über die Berechtigung für den Zugriff auf die Daten verfügen. Dies hängt von den Anmeldeinformationen ab, die beim Datenspeicher registriert sind.

  • Bei Verwendung der Dienstprinzipalauthentifizierung für den Zugriff auf den Speicher über AzureDataLakeGen2 muss dem Dienstprinzipal oder der App-Registrierung mindestens die RBAC-Rolle „Storage-Blobdatenleser“ zugewiesen werden. Weitere Informationen finden Sie unter Integrierte Azure-Rollen.

Einen neuen Azure Data Lake Gen2-Datenspeicher initialisieren.

Vererbung
AzureDataLakeGen2Datastore

Konstruktor

AzureDataLakeGen2Datastore(workspace, name, container_name, account_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, protocol=None, endpoint=None, service_data_access_auth_identity=None)

Parameter

workspace
str
Erforderlich

Der Arbeitsbereich, zu dem dieser Datenspeicher gehört.

name
str
Erforderlich

Datenspeichername

container_name
str
Erforderlich

Name des Azure-Blobcontainers

account_name
str
Erforderlich

Der Name des Speicherkontos.

tenant_id
str
Standardwert: None

Die Verzeichnis-ID/Mandanten-ID des Dienstprinzipals

client_id
str
Standardwert: None

Die Client-ID/Anwendungs-ID des Dienstprinzipals.

client_secret
str
Standardwert: None

Das Geheimnis des Dienstprinzipals.

resource_url
str
Standardwert: None

Ressourcen-URL, die bestimmt, welche Vorgänge in Data Lake Storage ausgeführt werden

authority_url
str
Standardwert: None

Die URL der Behörde, die zur Authentifizierung des Benutzers verwendet wird.

protocol
str
Standardwert: None

Protokoll, das zum Herstellen einer Verbindung mit dem Blobcontainer verwendet werden soll. Bei fehlender Angabe wird das HTTPS verwendet.

endpoint
str
Standardwert: None

Der Endpunkt des Blobcontainers. Bei „None“ wird „core.windows.net“ verwendet.

service_data_access_auth_identity
str oder <xref:_restclient.models.ServiceDataAccessAuthIdentity>
Standardwert: None

Gibt an, welche Identität für die Authentifizierung des Zugriffs auf die Dienstdaten im Speicher des Kunden verwendet werden soll. Mögliche Werte: „None“, „WorkspaceSystemAssignedIdentity“, „WorkspaceUserAssignedIdentity“

workspace
str
Erforderlich

Der Arbeitsbereich, zu dem dieser Datenspeicher gehört

name
str
Erforderlich

Datenspeichername

container_name
str
Erforderlich

Name des Azure-Blobcontainers

account_name
str
Erforderlich

Der Name des Speicherkontos.

tenant_id
str
Erforderlich

Die Verzeichnis-ID/Mandanten-ID des Dienstprinzipals

client_id
str
Erforderlich

Die Client-ID/Anwendungs-ID des Dienstprinzipals.

client_secret
str
Erforderlich

Das Geheimnis des Dienstprinzipals.

resource_url
str
Erforderlich

Ressourcen-URL, die bestimmt, welche Vorgänge in Data Lake Storage ausgeführt werden

authority_url
str
Erforderlich

Die URL der Behörde, die zur Authentifizierung des Benutzers verwendet wird.

protocol
str
Erforderlich

Protokoll, das zum Herstellen einer Verbindung mit dem Blobcontainer verwendet werden soll. Bei fehlender Angabe wird das HTTPS verwendet.

endpoint
str
Erforderlich

Der Endpunkt des Blobcontainers. Bei „None“ wird „core.windows.net“ verwendet.

service_data_access_auth_identity
str oder <xref:_restclient.models.ServiceDataAccessAuthIdentity>
Erforderlich

Gibt an, welche Identität für die Authentifizierung des Zugriffs auf die Dienstdaten im Speicher des Kunden verwendet werden soll. Mögliche Werte: „None“, „WorkspaceSystemAssignedIdentity“, „WorkspaceUserAssignedIdentity“