Поделиться через


TextLoaderSaverCatalog.LoadFromTextFile Метод

Определение

Перегрузки

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

IDataView Загрузка из текстового файла с помощью TextLoader. Обратите внимание, что IDataView"отложены, поэтому фактическая загрузка здесь не выполняется, просто проверка схемы.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

IDataView Загрузка из текстового файла с помощью TextLoader. Обратите внимание, что IDataView"отложены, поэтому фактическая загрузка здесь не выполняется, просто проверка схемы.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

IDataView Загрузка из текстового файла с помощью TextLoader. Обратите внимание, что IDataView"отложены, поэтому фактическая загрузка здесь не выполняется, просто проверка схемы.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

IDataView Загрузка из текстового файла с помощью TextLoader. Обратите внимание, что IDataView"отложены, поэтому фактическая загрузка здесь не выполняется, просто проверка схемы.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

IDataView Загрузка из текстового файла с помощью TextLoader. Обратите внимание, что IDataView"отложены, поэтому фактическая загрузка здесь не выполняется, просто проверка схемы.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options = default);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, Optional options As TextLoader.Options = Nothing) As IDataView

Параметры

catalog
DataOperationsCatalog

Каталог DataOperationsCatalog .

path
String

Указывает файл или путь к файлам, из которых требуется загрузить.

options
TextLoader.Options

Определяет параметры операции загрузки.

Возвращаемое значение

Примеры

using System;
using System.Collections.Generic;
using System.IO;
using Microsoft.ML;

namespace Samples.Dynamic
{
    public static class SaveAndLoadFromText
    {
        public static void Example()
        {
            // Create a new context for ML.NET operations. It can be used for
            // exception tracking and logging, as a catalog of available operations
            // and as the source of randomness. Setting the seed to a fixed number
            // in this example to make outputs deterministic.
            var mlContext = new MLContext(seed: 0);

            // Create a list of training data points.
            var dataPoints = new List<DataPoint>()
            {
                new DataPoint(){ Label = 0, Features = 4},
                new DataPoint(){ Label = 0, Features = 5},
                new DataPoint(){ Label = 0, Features = 6},
                new DataPoint(){ Label = 1, Features = 8},
                new DataPoint(){ Label = 1, Features = 9},
            };

            // Convert the list of data points to an IDataView object, which is
            // consumable by ML.NET API.
            IDataView data = mlContext.Data.LoadFromEnumerable(dataPoints);

            // Create a FileStream object and write the IDataView to it as a text
            // file.
            using (FileStream stream = new FileStream("data.tsv", FileMode.Create))
                mlContext.Data.SaveAsText(data, stream);

            // Create an IDataView object by loading the text file.
            IDataView loadedData = mlContext.Data.LoadFromTextFile("data.tsv");

            // Inspect the data that is loaded from the previously saved text file.
            var loadedDataEnumerable = mlContext.Data
                .CreateEnumerable<DataPoint>(loadedData, reuseRowObject: false);

            foreach (DataPoint row in loadedDataEnumerable)
                Console.WriteLine($"{row.Label}, {row.Features}");

            // Preview of the loaded data.
            // 0, 4
            // 0, 5
            // 0, 6
            // 1, 8
            // 1, 9
        }

        // Example with label and feature values. A data set is a collection of such
        // examples.
        private class DataPoint
        {
            public float Label { get; set; }

            public float Features { get; set; }
        }
    }
}

Применяется к

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

IDataView Загрузка из текстового файла с помощью TextLoader. Обратите внимание, что IDataView"отложены, поэтому фактическая загрузка здесь не выполняется, просто проверка схемы.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Column[] columns, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Column[] * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, columns As TextLoader.Column(), Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Параметры

catalog
DataOperationsCatalog

Каталог DataOperationsCatalog .

path
String

Путь к файлам.

columns
TextLoader.Column[]

Столбцы схемы.

separatorChar
Char

Символ, используемый в качестве разделителя между точками данных в строке. По умолчанию символ табуляции используется в качестве разделителя.

hasHeader
Boolean

Указывает, имеет ли файл заголовок. Когда trueзагрузчик пропустит первую строку при Load(IMultiStreamSource) вызове.

allowQuoting
Boolean

Могут ли входные данные включать значения с двойными кавычками. Этот параметр используется для различения символов разделителя во входном значении от фактических разделителей. Когда trueразделители в двойных кавычках обрабатываются как часть входного значения. Когда falseвсе разделители, даже эти кавычки, обрабатываются как разделители нового столбца. Он также используется для различения пустых значений от отсутствующих значений. Если trueотсутствующее значение обозначается последовательными разделителями и пустыми значениями "". Если falseпустые значения обозначены последовательными разделителями и отсутствующими значениями по умолчанию, отсутствующими для каждого типа, задокументированного в DataKind.

trimWhitespace
Boolean

Удалите конечные пробелы из строк.

allowSparse
Boolean

Может ли вход включать разреженные представления. Например, строка, содержащая "5 2:6 4:3", означает, что есть 5 столбцов, а только ненулевыми являются столбцы 2 и 4, которые имеют значения 6 и 3 соответственно. Индексы столбцов основаны на нулях, поэтому столбцы 2 и 4 представляют 3-е и 5-е столбцы. Столбец также может иметь плотные значения, за которыми следует разреженные значения, представленные в этом моде. Например, строка, содержащая "1 2 5 2:6 4:3", представляет два плотных столбца со значениями 1 и 2, за которыми следует 5 разреженных столбцов со значениями 0, 0, 6, 0 и 3. Индексы разреженных столбцов начинаются с 0, даже если 0 представляет третий столбец.

Возвращаемое значение

Представление данных.

Применяется к

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

IDataView Загрузка из текстового файла с помощью TextLoader. Обратите внимание, что IDataView"отложены, поэтому фактическая загрузка здесь не выполняется, просто проверка схемы.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, options As TextLoader.Options) As IDataView

Параметры типа

TInput

Параметры

catalog
DataOperationsCatalog

Каталог DataOperationsCatalog .

path
String

Указывает файл или путь к файлам, из которых требуется загрузить.

options
TextLoader.Options

Определяет параметры операции загрузки. Нет необходимости указывать поле "Столбцы", так как столбцы будут выведены этим методом.

Возвращаемое значение

Представление данных.

Применяется к

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

IDataView Загрузка из текстового файла с помощью TextLoader. Обратите внимание, что IDataView"отложены, поэтому фактическая загрузка здесь не выполняется, просто проверка схемы.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Параметры типа

TInput

Параметры

catalog
DataOperationsCatalog

Каталог DataOperationsCatalog .

path
String

Путь к файлам.

separatorChar
Char

Символ разделителя столбцов. Значение по умолчанию — "\t"

hasHeader
Boolean

Указывает, имеет ли файл заголовок. Когда trueзагрузчик пропустит первую строку при Load(IMultiStreamSource) вызове.

allowQuoting
Boolean

Могут ли входные данные включать значения с двойными кавычками. Этот параметр используется для различения символов разделителя во входном значении от фактических разделителей. Когда trueразделители в двойных кавычках обрабатываются как часть входного значения. Когда falseвсе разделители, даже эти кавычки, обрабатываются как разделители нового столбца. Он также используется для различения пустых значений от отсутствующих значений. Если trueотсутствующее значение обозначается последовательными разделителями и пустыми значениями "". Если falseпустые значения обозначены последовательными разделителями и отсутствующими значениями по умолчанию, отсутствующими для каждого типа, задокументированного в DataKind.

trimWhitespace
Boolean

Удалите конечные пробелы из строк.

allowSparse
Boolean

Может ли вход включать разреженные представления. Например, строка, содержащая "5 2:6 4:3", означает, что есть 5 столбцов, а только ненулевыми являются столбцы 2 и 4, которые имеют значения 6 и 3 соответственно. Индексы столбцов основаны на нулях, поэтому столбцы 2 и 4 представляют 3-е и 5-е столбцы. Столбец также может иметь плотные значения, за которыми следует разреженные значения, представленные в этом моде. Например, строка, содержащая "1 2 5 2:6 4:3", представляет два плотных столбца со значениями 1 и 2, за которыми следует 5 разреженных столбцов со значениями 0, 0, 6, 0 и 3. Индексы разреженных столбцов начинаются с 0, даже если 0 представляет третий столбец.

Возвращаемое значение

Представление данных.

Применяется к