TextLoader.Options 类

定义

的设置 TextLoader

public class TextLoader.Options
type TextLoader.Options = class
Public Class TextLoader.Options
继承
TextLoader.Options

构造函数

TextLoader.Options()

的设置 TextLoader

字段

AllowQuoting

输入是否可能包含双引号值。 此参数用于区分输入值中的分隔符与实际分隔符。 当 为 时 true,双引号中的分隔符被视为输入值的一部分。 如果 false为 ,则所有分隔符(即使是引号中的分隔符)都被视为分隔新列。

AllowSparse

输入是否可能包含稀疏表示形式。 例如,包含“5 2:6 4:3”的行表示有 5 列,唯一的非零是列 2 和 4,它们分别具有值 6 和 3。 列索引从零开始,因此第 2 列和第 4 列表示第 3 列和第 5 列。 列可能还具有密集值,后跟以这种方式表示的稀疏值。 例如,包含“1 2 5 2:6 4:3”的行表示两个值 1 和 2 的密集列,后跟值 0、0、6、0 和 3 的稀疏表示列。 稀疏列的索引从 0 开始,即使 0 表示第三列。

此外, InputSize 当本示例中的稀疏元素数 (5 时,应使用) 每行中不存在。 它应指定总大小,而不仅仅是稀疏部分的大小。 但是,稀疏部分的索引与稀疏部分的开始位置相关。 如果 InputSize 设置为 7,则行“1 2 2:6 4:3”将映射到“1 2 0 0 6 0 4”,但如果设置为 10,则同一行将映射到“1 2 0 0 6 0 4 0 0 0”。

Columns

指定应映射到列的 IDataView 输入列。

DecimalMarker

应用作十进制标记的字符。 默认值为“.”。 仅允许使用“.”和“,”是十进制标记。

EscapeChar

用于转义带引号字段内的引号的字符。 它不能是用作分隔符的字符。

HasHeader

文件是否具有具有功能名称的标头。 如果 true为 ,则调用 时 Load(IMultiStreamSource) ,加载程序将跳过第一行。 此示例可用于推断槽名称注释(如果存在)。

HeaderFile

包含具有特征名称的标头的文件。 如果指定,则忽略数据文件中定义的标头,而不考虑 。HasHeader

InputSize

文本数据中的源列数。 默认值为稀疏行包含其大小信息。

MaxRows

要生成的最大行数。

MissingRealsAsNaNs

如果为 true,则缺少实字段 (即双字段或单字段) 将加载为 NaN。 如果为 false,则它们将加载为 0。 默认值为 false。 如果字段为空、只有空格或给定行末尾缺少列,则字段被视为“缺失”。

ReadMultilines

如果为 true,则接受带引号的字段中的新行字符,因此一个字段内可以包含多行文本如果 AllowQuoting 为 false,则忽略此选项。

Separators

应用作分隔符列分隔符的字符。

TrimWhitespace

使用 Wheter 从行中删除尾随空格。

UseThreads

是否使用单独的分析线程。

适用于