Partilhar via


TextLoaderSaverCatalog.LoadFromTextFile Método

Definição

Sobrecargas

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

Carregue um IDataView de um arquivo de texto usando TextLoader. Observe que IDataView's são lentos, portanto, nenhum carregamento real acontece aqui, apenas validação de esquema.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

Carregue um IDataView de um arquivo de texto usando TextLoader. Observe que IDataView's são lentos, portanto, nenhum carregamento real acontece aqui, apenas validação de esquema.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

Carregue um IDataView de um arquivo de texto usando TextLoader. Observe que IDataView's são lentos, portanto, nenhum carregamento real acontece aqui, apenas validação de esquema.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

Carregue um IDataView de um arquivo de texto usando TextLoader. Observe que IDataView's são lentos, portanto, nenhum carregamento real acontece aqui, apenas validação de esquema.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

Carregue um IDataView de um arquivo de texto usando TextLoader. Observe que IDataView's são lentos, portanto, nenhum carregamento real acontece aqui, apenas validação de esquema.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options = default);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, Optional options As TextLoader.Options = Nothing) As IDataView

Parâmetros

path
String

Especifica um arquivo ou caminho de arquivos dos quais carregar.

options
TextLoader.Options

Define as configurações da operação de carga.

Retornos

Exemplos

using System;
using System.Collections.Generic;
using System.IO;
using Microsoft.ML;

namespace Samples.Dynamic
{
    public static class SaveAndLoadFromText
    {
        public static void Example()
        {
            // Create a new context for ML.NET operations. It can be used for
            // exception tracking and logging, as a catalog of available operations
            // and as the source of randomness. Setting the seed to a fixed number
            // in this example to make outputs deterministic.
            var mlContext = new MLContext(seed: 0);

            // Create a list of training data points.
            var dataPoints = new List<DataPoint>()
            {
                new DataPoint(){ Label = 0, Features = 4},
                new DataPoint(){ Label = 0, Features = 5},
                new DataPoint(){ Label = 0, Features = 6},
                new DataPoint(){ Label = 1, Features = 8},
                new DataPoint(){ Label = 1, Features = 9},
            };

            // Convert the list of data points to an IDataView object, which is
            // consumable by ML.NET API.
            IDataView data = mlContext.Data.LoadFromEnumerable(dataPoints);

            // Create a FileStream object and write the IDataView to it as a text
            // file.
            using (FileStream stream = new FileStream("data.tsv", FileMode.Create))
                mlContext.Data.SaveAsText(data, stream);

            // Create an IDataView object by loading the text file.
            IDataView loadedData = mlContext.Data.LoadFromTextFile("data.tsv");

            // Inspect the data that is loaded from the previously saved text file.
            var loadedDataEnumerable = mlContext.Data
                .CreateEnumerable<DataPoint>(loadedData, reuseRowObject: false);

            foreach (DataPoint row in loadedDataEnumerable)
                Console.WriteLine($"{row.Label}, {row.Features}");

            // Preview of the loaded data.
            // 0, 4
            // 0, 5
            // 0, 6
            // 1, 8
            // 1, 9
        }

        // Example with label and feature values. A data set is a collection of such
        // examples.
        private class DataPoint
        {
            public float Label { get; set; }

            public float Features { get; set; }
        }
    }
}

Aplica-se a

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

Carregue um IDataView de um arquivo de texto usando TextLoader. Observe que IDataView's são lentos, portanto, nenhum carregamento real acontece aqui, apenas validação de esquema.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Column[] columns, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Column[] * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, columns As TextLoader.Column(), Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Parâmetros

path
String

O caminho para os arquivos.

columns
TextLoader.Column[]

As colunas do esquema.

separatorChar
Char

O caractere usado como separador entre pontos de dados em uma linha. Por padrão, o caractere de guia é usado como separador.

hasHeader
Boolean

Se o arquivo tem um cabeçalho. Quando true, o carregador ignorará a primeira linha quando Load(IMultiStreamSource) for chamado.

allowQuoting
Boolean

Se a entrada pode incluir valores de aspas duplas. Esse parâmetro é usado para distinguir caracteres separadores em um valor de entrada de separadores reais. Quando true, separadores dentro de aspas duplas são tratados como parte do valor de entrada. Quando false, todos os separadores, mesmo essas aspas whitin, são tratados como delimitando uma nova coluna. Ele também é usado para distinguir valores vazios de valores ausentes. Quando true, o valor ausente é indicado por separadores consecutivos e valores vazios por "". Quando false, valores vazios são indicados por separadores consecutivos e valores ausentes pelo valor padrão ausente para cada tipo documentado em DataKind.

trimWhitespace
Boolean

Remova o espaço em branco à direita das linhas.

allowSparse
Boolean

Se a entrada pode incluir representações esparsas. Por exemplo, uma linha que contém "5 2:6 4:3" significa que há cinco colunas e a única não zero são as colunas 2 e 4, que têm os valores 6 e 3, respectivamente. Os índices de coluna são baseados em zero, portanto, as colunas 2 e 4 representam as 3ª e 5ª colunas. Uma coluna também pode ter valores densos seguidos por valores esparsos representados dessa forma. Por exemplo, uma linha que contém "1 2 5 2:6 4:3" representa duas colunas densas com valores 1 e 2, seguida por 5 colunas pouco representadas com os valores 0, 0, 6, 0 e 3. Os índices das colunas esparsas começam a partir de 0, embora 0 represente a terceira coluna.

Retornos

A exibição de dados.

Aplica-se a

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

Carregue um IDataView de um arquivo de texto usando TextLoader. Observe que IDataView's são lentos, portanto, nenhum carregamento real acontece aqui, apenas validação de esquema.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, options As TextLoader.Options) As IDataView

Parâmetros de tipo

TInput

Parâmetros

path
String

Especifica um arquivo ou caminho de arquivos dos quais carregar.

options
TextLoader.Options

Define as configurações da operação de carga. Não é necessário especificar um campo Colunas, pois as colunas serão inferidas por esse método.

Retornos

A exibição de dados.

Aplica-se a

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

Carregue um IDataView de um arquivo de texto usando TextLoader. Observe que IDataView's são lentos, portanto, nenhum carregamento real acontece aqui, apenas validação de esquema.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Parâmetros de tipo

TInput

Parâmetros

path
String

O caminho para os arquivos.

separatorChar
Char

Caractere separador de coluna. O padrão é '\t'

hasHeader
Boolean

Se o arquivo tem um cabeçalho. Quando true, o carregador ignorará a primeira linha quando Load(IMultiStreamSource) for chamado.

allowQuoting
Boolean

Se a entrada pode incluir valores de aspas duplas. Esse parâmetro é usado para distinguir caracteres separadores em um valor de entrada de separadores reais. Quando true, separadores dentro de aspas duplas são tratados como parte do valor de entrada. Quando false, todos os separadores, mesmo essas aspas whitin, são tratados como delimitando uma nova coluna. Ele também é usado para distinguir valores vazios de valores ausentes. Quando true, o valor ausente é indicado por separadores consecutivos e valores vazios por "". Quando false, valores vazios são indicados por separadores consecutivos e valores ausentes pelo valor padrão ausente para cada tipo documentado em DataKind.

trimWhitespace
Boolean

Remova o espaço em branco à direita das linhas.

allowSparse
Boolean

Se a entrada pode incluir representações esparsas. Por exemplo, uma linha que contém "5 2:6 4:3" significa que há cinco colunas e a única não zero são as colunas 2 e 4, que têm os valores 6 e 3, respectivamente. Os índices de coluna são baseados em zero, portanto, as colunas 2 e 4 representam as 3ª e 5ª colunas. Uma coluna também pode ter valores densos seguidos por valores esparsos representados dessa forma. Por exemplo, uma linha que contém "1 2 5 2:6 4:3" representa duas colunas densas com valores 1 e 2, seguida por 5 colunas pouco representadas com os valores 0, 0, 6, 0 e 3. Os índices das colunas esparsas começam a partir de 0, embora 0 represente a terceira coluna.

Retornos

A exibição de dados.

Aplica-se a