dataset 模块

管理与 Azure 机器学习数据集的交互。

本模块提供了在 Azure 机器学习中使用原始数据、管理数据,以及对数据执行操作的功能。 使用此模块中的 Dataset 类创建数据集和 data 包中的功能,其中包含支持类 FileDatasetTabularDataset

若要开始使用数据集,请参阅 添加 & 注册数据集一文。

Dataset

表示在 Azure 机器学习中用于探索、转换和管理数据的资源。

Dataset 是对 Datastore 中或公共 Web URL 后面的数据的引用。

对于此类中已弃用的方法,请查看 AbstractDataset 类以获取改进的 API。

支持以下数据集类型:

  • TabularDataset 表示表格格式的、通过分析提供的文件或文件列表所创建的数据。

  • FileDataset 引用数据存储或公共 URL 中的单个或多个文件。

若要开始使用数据集,请参阅 添加 & 注册数据集一文,或查看笔记本 https://aka.ms/tabulardataset-samplenotebookhttps://aka.ms/filedataset-samplenotebook

初始化 Dataset 对象。

若要获取已注册到工作区的数据集,请使用 get 方法。