AzureDataLakeGen2Datastore 类

表示将连接信息保存到 Azure Data Lake Storage Gen2 的数据存储。

若要创建将连接信息保存到 Azure Data Lake Storage 的数据存储,请使用 Datastore 类的 register_azure_data_lake_gen2 方法。

若要访问 AzureDataLakeGen2Datastore 对象中的数据,请创建 Dataset,并对 FileDataset 使用 from_files 等方法之一。 有关详细信息,请参阅创建 Azure 机器学习数据集

另请记住:

  • AzureDataLakeGen2 类不提供上传方法,建议通过数据集将数据上传到 AzureDataLakeGen2 数据存储。 此处提供了更多详细信息:https://docs.microsoft.com/azure/machine-learning/how-to-create-register-datasets

  • 使用数据存储访问数据时,必须具有访问数据的权限,这取决于在数据存储中注册的凭据。

  • 使用服务主体身份验证通过 AzureDataLakeGen2 访问存储时,必须为服务主体或应用注册分配至少“存储 Blob 数据读取器”的特定基于角色的访问控制 (RBAC) 角色。 有关详细信息,请参阅存储内置角色

初始化新的 Azure Data Lake Gen2 数据存储。

继承
AzureDataLakeGen2Datastore

构造函数

AzureDataLakeGen2Datastore(workspace, name, container_name, account_name, tenant_id=None, client_id=None, client_secret=None, resource_url=None, authority_url=None, protocol=None, endpoint=None, service_data_access_auth_identity=None)

参数

workspace
str
必需

此数据存储所属的工作区。

name
str
必需

数据存储名称。

container_name
str
必需

Azure Blob 容器的名称。

account_name
str
必需

存储帐户名称。

tenant_id
str
默认值: None

服务主体的目录 ID/租户 ID。

client_id
str
默认值: None

服务主体的客户端 ID/应用程序 ID。

client_secret
str
默认值: None

服务主体的机密。

resource_url
str
默认值: None

确定将在 Data Lake Store 上执行哪些操作的资源 URL。

authority_url
str
默认值: None

用于对用户进行身份验证的颁发机构 URL。

protocol
str
默认值: None

用于连接到 Blob 容器的协议。 如果为 None,则默认为 https。

endpoint
str
默认值: None

Blob 容器的终结点。 如果为 None,则默认为 core.windows.net。

service_data_access_auth_identity
str 或 <xref:_restclient.models.ServiceDataAccessAuthIdentity>
默认值: None

指示用于验证客户存储的服务数据访问的标识。 可能的值包括:"None"、"WorkspaceSystemAssignedIdentity"、"WorkspaceUserAssignedIdentity"

workspace
str
必需

此数据存储所属的工作区。

name
str
必需

数据存储名称。

container_name
str
必需

Azure Blob 容器的名称。

account_name
str
必需

存储帐户名称。

tenant_id
str
必需

服务主体的目录 ID/租户 ID。

client_id
str
必需

服务主体的客户端 ID/应用程序 ID。

client_secret
str
必需

服务主体的机密。

resource_url
str
必需

确定将在 Data Lake Store 上执行哪些操作的资源 URL。

authority_url
str
必需

用于对用户进行身份验证的颁发机构 URL。

protocol
str
必需

用于连接到 Blob 容器的协议。 如果为 None,则默认为 https。

endpoint
str
必需

Blob 容器的终结点。 如果为 None,则默认为 core.windows.net。

service_data_access_auth_identity
str 或 <xref:_restclient.models.ServiceDataAccessAuthIdentity>
必需

指示用于验证客户存储的服务数据访问的标识。 可能的值包括:"None"、"WorkspaceSystemAssignedIdentity"、"WorkspaceUserAssignedIdentity"