Microsoft.ML.Data 命名空间
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
包含数据加载和保存、数据架构定义和模型训练指标组件的命名空间。
类
结构
DataViewRowId |
一个结构,用作 行的 IDataView标识符。 对于包含数百万条记录的数据集,这些 ID 需要是唯一的,因此需要如此大的结构来保存这些值。 这些 ID 派生自管道先前组件的其他 ID,并将结构分为两个:位高阶和低位,进一步减少这些冲突的更改。 |
VBuffer<T> |
支持密集和稀疏表示形式的缓冲区。 这是所有 VectorDataViewType 实例的表示形式类型。 此向量的显式定义值通过 GetValues() 公开(如果不是密集 GetIndices()的 )。 |
VBufferEditor<T> |
一个能够通过填写 Values (以及Indices缓冲区不是密集) 来编辑 VBuffer<T> 的对象。 |
接口
IFileHandle |
文件句柄。 |
IMultiStreamSource |
一个接口,用于公开一些可以打开以供读取的项。 |
IRowToRowMapper |
此接口将输入 DataViewRow 映射到输出 DataViewRow。 通常,输出包含由实现类添加的输入列和新列,尽管某些实现可能会返回输入列的子集。 此接口类似于 Microsoft.ML.Data.ISchemaBoundRowMapper,但它没有任何输入角色映射,因此,若要重新绑定,必须使用相同的输入列名称。 此接口的实现通常通过定义的输入 DataViewSchema创建。 |
枚举
DataKind |
指定简单数据类型。 |
MLPixelFormat |
指定图像中每个像素的颜色数据的格式。 |
SchemaDefinition.Direction |
包含数据加载和保存、数据架构定义和模型训练指标组件的命名空间。 |
TransformerScope |
此枚举允许“标记”估算器 (,随后将链中的转换器) 用于“仅用于训练”、“训练和评估”等。最值得注意的示例是,标签列上的转换不应用于评分,因此范围应为 Training 或 TrainTest。 |
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈