TextLoaderSaverCatalog.LoadFromTextFile Methode

Definition

Überlädt

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

Laden sie eine IDataView Textdatei mithilfe TextLoadereiner Textdatei. Beachten Sie, dass IDataView's lazy ist, daher tritt hier kein tatsächliches Laden auf, nur die Schemaüberprüfung.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

Laden sie eine IDataView Textdatei mithilfe TextLoadereiner Textdatei. Beachten Sie, dass IDataView's lazy ist, daher tritt hier kein tatsächliches Laden auf, nur die Schemaüberprüfung.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

Laden sie eine IDataView Textdatei mithilfe TextLoadereiner Textdatei. Beachten Sie, dass IDataView's lazy ist, daher tritt hier kein tatsächliches Laden auf, nur die Schemaüberprüfung.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

Laden sie eine IDataView Textdatei mithilfe TextLoadereiner Textdatei. Beachten Sie, dass IDataView's lazy ist, daher tritt hier kein tatsächliches Laden auf, nur die Schemaüberprüfung.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

Laden sie eine IDataView Textdatei mithilfe TextLoadereiner Textdatei. Beachten Sie, dass IDataView's lazy ist, daher tritt hier kein tatsächliches Laden auf, nur die Schemaüberprüfung.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options = default);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, Optional options As TextLoader.Options = Nothing) As IDataView

Parameter

path
String

Gibt eine Datei oder einen Pfad von Dateien an, aus denen geladen werden soll.

options
TextLoader.Options

Definiert die Einstellungen des Ladevorgangs.

Gibt zurück

Beispiele

using System;
using System.Collections.Generic;
using System.IO;
using Microsoft.ML;

namespace Samples.Dynamic
{
    public static class SaveAndLoadFromText
    {
        public static void Example()
        {
            // Create a new context for ML.NET operations. It can be used for
            // exception tracking and logging, as a catalog of available operations
            // and as the source of randomness. Setting the seed to a fixed number
            // in this example to make outputs deterministic.
            var mlContext = new MLContext(seed: 0);

            // Create a list of training data points.
            var dataPoints = new List<DataPoint>()
            {
                new DataPoint(){ Label = 0, Features = 4},
                new DataPoint(){ Label = 0, Features = 5},
                new DataPoint(){ Label = 0, Features = 6},
                new DataPoint(){ Label = 1, Features = 8},
                new DataPoint(){ Label = 1, Features = 9},
            };

            // Convert the list of data points to an IDataView object, which is
            // consumable by ML.NET API.
            IDataView data = mlContext.Data.LoadFromEnumerable(dataPoints);

            // Create a FileStream object and write the IDataView to it as a text
            // file.
            using (FileStream stream = new FileStream("data.tsv", FileMode.Create))
                mlContext.Data.SaveAsText(data, stream);

            // Create an IDataView object by loading the text file.
            IDataView loadedData = mlContext.Data.LoadFromTextFile("data.tsv");

            // Inspect the data that is loaded from the previously saved text file.
            var loadedDataEnumerable = mlContext.Data
                .CreateEnumerable<DataPoint>(loadedData, reuseRowObject: false);

            foreach (DataPoint row in loadedDataEnumerable)
                Console.WriteLine($"{row.Label}, {row.Features}");

            // Preview of the loaded data.
            // 0, 4
            // 0, 5
            // 0, 6
            // 1, 8
            // 1, 9
        }

        // Example with label and feature values. A data set is a collection of such
        // examples.
        private class DataPoint
        {
            public float Label { get; set; }

            public float Features { get; set; }
        }
    }
}

Gilt für:

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

Laden sie eine IDataView Textdatei mithilfe TextLoadereiner Textdatei. Beachten Sie, dass IDataView's lazy ist, daher tritt hier kein tatsächliches Laden auf, nur die Schemaüberprüfung.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Column[] columns, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Column[] * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, columns As TextLoader.Column(), Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Parameter

path
String

Der Pfad zu den Dateien.

columns
TextLoader.Column[]

Die Spalten des Schemas.

separatorChar
Char

Das Zeichen, das als Trennzeichen zwischen Datenpunkten in einer Zeile verwendet wird. Standardmäßig wird das Registerkartenzeichen als Trennzeichen verwendet.

hasHeader
Boolean

Gibt an, ob die Datei über eine Kopfzeile verfügt. Wenn trueder Ladeprogramm die erste Zeile überspringt, wenn Load(IMultiStreamSource) sie aufgerufen wird.

allowQuoting
Boolean

Gibt an, ob die Eingabe doppelte Anführungswerte enthalten kann. Dieser Parameter wird verwendet, um Trennzeichen in einem Eingabewert von tatsächlichen Trennzeichen zu unterscheiden. Wenn trueTrennzeichen innerhalb doppelter Anführungszeichen als Teil des Eingabewerts behandelt werden. Wenn falsealle Trennzeichen, auch diese Whitin-Anführungszeichen, als Trennzeichen behandelt werden, werden als Trennzeichen behandelt. Es wird auch verwendet, um leere Werte von fehlenden Werten zu unterscheiden. Wenn truefehlender Wert durch aufeinander folgende Trennzeichen und leere Werte durch "" bezeichnet wird. Wenn falseleere Werte durch aufeinander folgende Trennzeichen gekennzeichnet werden und fehlende Werte durch den Standardwert für jeden in dokumentierten DataKindTyp fehlen.

trimWhitespace
Boolean

Entfernen Sie nachgestellte Leerzeichen aus Zeilen.

allowSparse
Boolean

Gibt an, ob die Eingabe geringe Darstellungen enthalten kann. Beispielsweise bedeutet eine Zeile mit "5 2:6 4:3", dass es 5 Spalten gibt, und die einzige Nicht-Null sind Spalten 2 und 4, die Werte 6 und 3 aufweisen. Spaltenindizes sind nullbasiert, sodass Spalten 2 und 4 die 3. und 5. Spalten darstellen. Eine Spalte kann auch dichte Werte haben, gefolgt von geringen Werten, die in dieser Weise dargestellt werden. Beispielsweise stellt eine Zeile mit "1 2 5 2:6 4:3" zwei dichte Spalten mit Werten 1 und 2 dar, gefolgt von 5 mit den Werten 0, 0, 0, 6, 0 und 3. Die Indizes der geringen Spalten beginnen mit 0, obwohl 0 die dritte Spalte darstellt.

Gibt zurück

Die Datenansicht.

Gilt für:

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

Laden sie eine IDataView Textdatei mithilfe TextLoadereiner Textdatei. Beachten Sie, dass IDataView's lazy ist, daher tritt hier kein tatsächliches Laden auf, nur die Schemaüberprüfung.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, options As TextLoader.Options) As IDataView

Typparameter

TInput

Parameter

path
String

Gibt eine Datei oder einen Pfad von Dateien an, aus denen geladen werden soll.

options
TextLoader.Options

Definiert die Einstellungen des Ladevorgangs. Es muss kein Spaltenfeld angegeben werden, da Spalten von dieser Methode abgeleitet werden.

Gibt zurück

Die Datenansicht.

Gilt für:

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

Laden sie eine IDataView Textdatei mithilfe TextLoadereiner Textdatei. Beachten Sie, dass IDataView's lazy ist, daher tritt hier kein tatsächliches Laden auf, nur die Schemaüberprüfung.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Typparameter

TInput

Parameter

path
String

Der Pfad zu den Dateien.

separatorChar
Char

Spaltentrennzeichen. Der Standardwert ist "\t".

hasHeader
Boolean

Gibt an, ob die Datei über eine Kopfzeile verfügt. Wenn trueder Ladeprogramm die erste Zeile überspringt, wenn Load(IMultiStreamSource) sie aufgerufen wird.

allowQuoting
Boolean

Gibt an, ob die Eingabe doppelte Anführungswerte enthalten kann. Dieser Parameter wird verwendet, um Trennzeichen in einem Eingabewert von tatsächlichen Trennzeichen zu unterscheiden. Wenn trueTrennzeichen innerhalb doppelter Anführungszeichen als Teil des Eingabewerts behandelt werden. Wenn falsealle Trennzeichen, auch diese Whitin-Anführungszeichen, als Trennzeichen behandelt werden, werden als Trennzeichen behandelt. Es wird auch verwendet, um leere Werte von fehlenden Werten zu unterscheiden. Wenn truefehlender Wert durch aufeinander folgende Trennzeichen und leere Werte durch "" bezeichnet wird. Wenn falseleere Werte durch aufeinander folgende Trennzeichen gekennzeichnet werden und fehlende Werte durch den Standardwert für jeden in dokumentierten DataKindTyp fehlen.

trimWhitespace
Boolean

Entfernen Sie nachgestellte Leerzeichen aus Zeilen.

allowSparse
Boolean

Gibt an, ob die Eingabe geringe Darstellungen enthalten kann. Beispielsweise bedeutet eine Zeile mit "5 2:6 4:3", dass es 5 Spalten gibt, und die einzige Nicht-Null sind Spalten 2 und 4, die Werte 6 und 3 aufweisen. Spaltenindizes sind nullbasiert, sodass Spalten 2 und 4 die 3. und 5. Spalten darstellen. Eine Spalte kann auch dichte Werte haben, gefolgt von geringen Werten, die in dieser Weise dargestellt werden. Beispielsweise stellt eine Zeile mit "1 2 5 2:6 4:3" zwei dichte Spalten mit Werten 1 und 2 dar, gefolgt von 5 mit den Werten 0, 0, 0, 6, 0 und 3. Die Indizes der geringen Spalten beginnen mit 0, obwohl 0 die dritte Spalte darstellt.

Gibt zurück

Die Datenansicht.

Gilt für: