Udostępnij za pośrednictwem


TextLoaderSaverCatalog.LoadFromTextFile Metoda

Definicja

Przeciążenia

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

Załaduj element IDataView z pliku tekstowego przy użyciu polecenia TextLoader. Należy pamiętać, że IDataView"s są leniwe, więc w tym miejscu nie ma rzeczywistego ładowania, po prostu walidacja schematu.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

Załaduj element IDataView z pliku tekstowego przy użyciu polecenia TextLoader. Należy pamiętać, że IDataView"s są leniwe, więc w tym miejscu nie ma rzeczywistego ładowania, po prostu walidacja schematu.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

Załaduj element IDataView z pliku tekstowego przy użyciu polecenia TextLoader. Należy pamiętać, że IDataView"s są leniwe, więc w tym miejscu nie ma rzeczywistego ładowania, po prostu walidacja schematu.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

Załaduj element IDataView z pliku tekstowego przy użyciu polecenia TextLoader. Należy pamiętać, że IDataView"s są leniwe, więc w tym miejscu nie ma rzeczywistego ładowania, po prostu walidacja schematu.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

Załaduj element IDataView z pliku tekstowego przy użyciu polecenia TextLoader. Należy pamiętać, że IDataView"s są leniwe, więc w tym miejscu nie ma rzeczywistego ładowania, po prostu walidacja schematu.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options = default);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, Optional options As TextLoader.Options = Nothing) As IDataView

Parametry

path
String

Określa plik lub ścieżkę plików, z których mają być ładowane.

options
TextLoader.Options

Definiuje ustawienia operacji ładowania.

Zwraca

Przykłady

using System;
using System.Collections.Generic;
using System.IO;
using Microsoft.ML;

namespace Samples.Dynamic
{
    public static class SaveAndLoadFromText
    {
        public static void Example()
        {
            // Create a new context for ML.NET operations. It can be used for
            // exception tracking and logging, as a catalog of available operations
            // and as the source of randomness. Setting the seed to a fixed number
            // in this example to make outputs deterministic.
            var mlContext = new MLContext(seed: 0);

            // Create a list of training data points.
            var dataPoints = new List<DataPoint>()
            {
                new DataPoint(){ Label = 0, Features = 4},
                new DataPoint(){ Label = 0, Features = 5},
                new DataPoint(){ Label = 0, Features = 6},
                new DataPoint(){ Label = 1, Features = 8},
                new DataPoint(){ Label = 1, Features = 9},
            };

            // Convert the list of data points to an IDataView object, which is
            // consumable by ML.NET API.
            IDataView data = mlContext.Data.LoadFromEnumerable(dataPoints);

            // Create a FileStream object and write the IDataView to it as a text
            // file.
            using (FileStream stream = new FileStream("data.tsv", FileMode.Create))
                mlContext.Data.SaveAsText(data, stream);

            // Create an IDataView object by loading the text file.
            IDataView loadedData = mlContext.Data.LoadFromTextFile("data.tsv");

            // Inspect the data that is loaded from the previously saved text file.
            var loadedDataEnumerable = mlContext.Data
                .CreateEnumerable<DataPoint>(loadedData, reuseRowObject: false);

            foreach (DataPoint row in loadedDataEnumerable)
                Console.WriteLine($"{row.Label}, {row.Features}");

            // Preview of the loaded data.
            // 0, 4
            // 0, 5
            // 0, 6
            // 1, 8
            // 1, 9
        }

        // Example with label and feature values. A data set is a collection of such
        // examples.
        private class DataPoint
        {
            public float Label { get; set; }

            public float Features { get; set; }
        }
    }
}

Dotyczy

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

Załaduj element IDataView z pliku tekstowego przy użyciu polecenia TextLoader. Należy pamiętać, że IDataView"s są leniwe, więc w tym miejscu nie ma rzeczywistego ładowania, po prostu walidacja schematu.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Column[] columns, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Column[] * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, columns As TextLoader.Column(), Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Parametry

path
String

Ścieżka do plików.

columns
TextLoader.Column[]

Kolumny schematu.

separatorChar
Char

Znak używany jako separator między punktami danych w wierszu. Domyślnie znak karty jest używany jako separator.

hasHeader
Boolean

Czy plik ma nagłówek. Gdy truemoduł ładujący pominie pierwszy wiersz po Load(IMultiStreamSource) wywołaniu.

allowQuoting
Boolean

Czy dane wejściowe mogą zawierać wartości z podwójnym cudzysłów. Ten parametr służy do rozróżniania znaków separatora w wartości wejściowej z rzeczywistych separatorów. Gdy trueseparatory w cudzysłowach podwójnych są traktowane jako część wartości wejściowej. Gdy falsewszystkie separatory, nawet te cudzysłowy whitin, są traktowane jako ograniczniki nowej kolumny. Służy również do odróżnienia pustych wartości od brakujących wartości. W przypadku true, brakująca wartość jest oznaczona przez kolejne separatory i puste wartości według wartości "". Gdy falsewartości puste są oznaczone przez kolejne separatory i brakujące wartości domyślnie brakuje wartości dla każdego typu udokumentowanego w .DataKind

trimWhitespace
Boolean

Usuń końcowe odstępy z wierszy.

allowSparse
Boolean

Czy dane wejściowe mogą zawierać rozrzedne reprezentacje. Na przykład wiersz zawierający kolumny "5 2:6 4:3" oznacza, że istnieją 5 kolumn, a jedyną wartością niezerową są kolumny 2 i 4, które mają odpowiednio wartości 6 i 3. Indeksy kolumn są oparte na wartości zerowej, dlatego kolumny 2 i 4 reprezentują kolumny 3 i 5. Kolumna może również mieć gęste wartości, a po niej rozrzedzone wartości reprezentowane w ten sposób. Na przykład wiersz zawierający "1 2 5 2:6 4:3" reprezentuje dwie gęste kolumny z wartościami 1 i 2, a następnie 5 słabo reprezentowanych kolumn z wartościami 0, 0, 6, 0 i 3. Indeksy kolumn rozrzednych zaczynają się od 0, mimo że 0 reprezentuje trzecią kolumnę.

Zwraca

Widok danych.

Dotyczy

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

Załaduj element IDataView z pliku tekstowego przy użyciu polecenia TextLoader. Należy pamiętać, że IDataView"s są leniwe, więc w tym miejscu nie ma rzeczywistego ładowania, po prostu walidacja schematu.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, options As TextLoader.Options) As IDataView

Parametry typu

TInput

Parametry

path
String

Określa plik lub ścieżkę plików, z których mają być ładowane.

options
TextLoader.Options

Definiuje ustawienia operacji ładowania. Nie trzeba określać pola Kolumny, ponieważ kolumny będą wnioskowane przez tę metodę.

Zwraca

Widok danych.

Dotyczy

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

Załaduj element IDataView z pliku tekstowego przy użyciu polecenia TextLoader. Należy pamiętać, że IDataView"s są leniwe, więc w tym miejscu nie ma rzeczywistego ładowania, po prostu walidacja schematu.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Parametry typu

TInput

Parametry

path
String

Ścieżka do plików.

separatorChar
Char

Znak separatora kolumny. Wartość domyślna to "\t"

hasHeader
Boolean

Czy plik ma nagłówek. Gdy truemoduł ładujący pominie pierwszy wiersz po Load(IMultiStreamSource) wywołaniu.

allowQuoting
Boolean

Czy dane wejściowe mogą zawierać wartości z podwójnym cudzysłów. Ten parametr służy do rozróżniania znaków separatora w wartości wejściowej z rzeczywistych separatorów. Gdy trueseparatory w cudzysłowach podwójnych są traktowane jako część wartości wejściowej. Gdy falsewszystkie separatory, nawet te cudzysłowy whitin, są traktowane jako ograniczniki nowej kolumny. Służy również do odróżnienia pustych wartości od brakujących wartości. W przypadku true, brakująca wartość jest oznaczona przez kolejne separatory i puste wartości według wartości "". Gdy falsewartości puste są oznaczone przez kolejne separatory i brakujące wartości domyślnie brakuje wartości dla każdego typu udokumentowanego w .DataKind

trimWhitespace
Boolean

Usuń końcowe odstępy z wierszy.

allowSparse
Boolean

Czy dane wejściowe mogą zawierać rozrzedne reprezentacje. Na przykład wiersz zawierający kolumny "5 2:6 4:3" oznacza, że istnieją 5 kolumn, a jedyną wartością niezerową są kolumny 2 i 4, które mają odpowiednio wartości 6 i 3. Indeksy kolumn są oparte na wartości zerowej, dlatego kolumny 2 i 4 reprezentują kolumny 3 i 5. Kolumna może również mieć gęste wartości, a po niej rozrzedzone wartości reprezentowane w ten sposób. Na przykład wiersz zawierający "1 2 5 2:6 4:3" reprezentuje dwie gęste kolumny z wartościami 1 i 2, a następnie 5 słabo reprezentowanych kolumn z wartościami 0, 0, 6, 0 i 3. Indeksy kolumn rozrzednych zaczynają się od 0, mimo że 0 reprezentuje trzecią kolumnę.

Zwraca

Widok danych.

Dotyczy