TextLoaderSaverCatalog.LoadFromTextFile 方法

定义

重载

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options = default);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, Optional options As TextLoader.Options = Nothing) As IDataView

参数

path
String

指定要从中加载的文件的文件或路径。

options
TextLoader.Options

定义加载操作的设置。

返回

示例

using System;
using System.Collections.Generic;
using System.IO;
using Microsoft.ML;

namespace Samples.Dynamic
{
    public static class SaveAndLoadFromText
    {
        public static void Example()
        {
            // Create a new context for ML.NET operations. It can be used for
            // exception tracking and logging, as a catalog of available operations
            // and as the source of randomness. Setting the seed to a fixed number
            // in this example to make outputs deterministic.
            var mlContext = new MLContext(seed: 0);

            // Create a list of training data points.
            var dataPoints = new List<DataPoint>()
            {
                new DataPoint(){ Label = 0, Features = 4},
                new DataPoint(){ Label = 0, Features = 5},
                new DataPoint(){ Label = 0, Features = 6},
                new DataPoint(){ Label = 1, Features = 8},
                new DataPoint(){ Label = 1, Features = 9},
            };

            // Convert the list of data points to an IDataView object, which is
            // consumable by ML.NET API.
            IDataView data = mlContext.Data.LoadFromEnumerable(dataPoints);

            // Create a FileStream object and write the IDataView to it as a text
            // file.
            using (FileStream stream = new FileStream("data.tsv", FileMode.Create))
                mlContext.Data.SaveAsText(data, stream);

            // Create an IDataView object by loading the text file.
            IDataView loadedData = mlContext.Data.LoadFromTextFile("data.tsv");

            // Inspect the data that is loaded from the previously saved text file.
            var loadedDataEnumerable = mlContext.Data
                .CreateEnumerable<DataPoint>(loadedData, reuseRowObject: false);

            foreach (DataPoint row in loadedDataEnumerable)
                Console.WriteLine($"{row.Label}, {row.Features}");

            // Preview of the loaded data.
            // 0, 4
            // 0, 5
            // 0, 6
            // 1, 8
            // 1, 9
        }

        // Example with label and feature values. A data set is a collection of such
        // examples.
        private class DataPoint
        {
            public float Label { get; set; }

            public float Features { get; set; }
        }
    }
}

适用于

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Column[] columns, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Column[] * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, columns As TextLoader.Column(), Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

参数

path
String

文件的路径 (s) 。

columns
TextLoader.Column[]

架构的列。

separatorChar
Char

用作行中数据点分隔符的字符。 默认情况下,制表符用作分隔符。

hasHeader
Boolean

文件是否具有标头。 何时 true,加载程序将在调用时 Load(IMultiStreamSource) 跳过第一行。

allowQuoting
Boolean

输入是否可能包含双引号值。 此参数用于区分输入值中的分隔符与实际分隔符。 当 true双引号中的分隔符被视为输入值的一部分。 当 false,所有分隔符(即使是那些惠廷引号)都被视为分隔新列。 它还用于区分空值与缺失值。 如果 true缺少值由连续分隔符表示,空值则为“”。 当 false,空值由连续分隔符和缺失值表示为记录 DataKind的每个类型的默认缺失值。

trimWhitespace
Boolean

从行中删除尾随空格。

allowSparse
Boolean

输入是否可能包含稀疏表示形式。 例如,包含“5 2:6 4:3”的行表示有 5 列,唯一的非零是列 2 和 4,分别具有值 6 和 3。 列索引从零开始,因此列 2 和 4 表示第 3 列和第 5 列。 列可能还具有密集值,后跟以这种方式表示的稀疏值。 例如,包含“1 2 5 2:6 4:3”的行表示值为 1 和 2 的两个密集列,后跟值 0、0、6、0 和 3 的稀疏表示列。 稀疏列的索引从 0 开始,即使 0 表示第三列。

返回

数据视图。

适用于

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, options As TextLoader.Options) As IDataView

类型参数

TInput

参数

path
String

指定要从中加载的文件的文件或路径。

options
TextLoader.Options

定义加载操作的设置。 无需指定“列”字段,因为此方法将推断列。

返回

数据视图。

适用于

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

使用 TextLoader a0/> IDataView 从文本文件加载 。 请注意, IDataView这是懒惰的,因此此处不会发生实际加载,只需进行架构验证。

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

类型参数

TInput

参数

path
String

文件的路径 (s) 。

separatorChar
Char

列分隔符。 默认值为“\t”

hasHeader
Boolean

文件是否具有标头。 何时 true,加载程序将在调用时 Load(IMultiStreamSource) 跳过第一行。

allowQuoting
Boolean

输入是否可能包含双引号值。 此参数用于区分输入值中的分隔符与实际分隔符。 当 true双引号中的分隔符被视为输入值的一部分。 当 false,所有分隔符(即使是那些惠廷引号)都被视为分隔新列。 它还用于区分空值与缺失值。 如果 true缺少值由连续分隔符表示,空值则为“”。 当 false,空值由连续分隔符和缺失值表示为记录 DataKind的每个类型的默认缺失值。

trimWhitespace
Boolean

从行中删除尾随空格。

allowSparse
Boolean

输入是否可能包含稀疏表示形式。 例如,包含“5 2:6 4:3”的行表示有 5 列,唯一的非零是列 2 和 4,分别具有值 6 和 3。 列索引从零开始,因此列 2 和 4 表示第 3 列和第 5 列。 列可能还具有密集值,后跟以这种方式表示的稀疏值。 例如,包含“1 2 5 2:6 4:3”的行表示值为 1 和 2 的两个密集列,后跟值 0、0、6、0 和 3 的稀疏表示列。 稀疏列的索引从 0 开始,即使 0 表示第三列。

返回

数据视图。

适用于