TextLoaderSaverCatalog.LoadFromTextFile Metodo

Definizione

Overload

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

Caricare un oggetto IDataView da un file di testo usando TextLoader. Si noti che IDataView's sono lazy, quindi non viene eseguito alcun caricamento effettivo qui, solo convalida dello schema.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

Caricare un oggetto IDataView da un file di testo usando TextLoader. Si noti che IDataView's sono lazy, quindi non viene eseguito alcun caricamento effettivo qui, solo convalida dello schema.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

Caricare un oggetto IDataView da un file di testo usando TextLoader. Si noti che IDataView's sono lazy, quindi non viene eseguito alcun caricamento effettivo qui, solo convalida dello schema.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

Caricare un oggetto IDataView da un file di testo usando TextLoader. Si noti che IDataView's sono lazy, quindi non viene eseguito alcun caricamento effettivo qui, solo convalida dello schema.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

Caricare un oggetto IDataView da un file di testo usando TextLoader. Si noti che IDataView's sono lazy, quindi non viene eseguito alcun caricamento effettivo qui, solo convalida dello schema.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options = default);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, Optional options As TextLoader.Options = Nothing) As IDataView

Parametri

path
String

Specifica un file o un percorso di file da cui caricare.

options
TextLoader.Options

Definisce le impostazioni dell'operazione di caricamento.

Restituisce

Esempio

using System;
using System.Collections.Generic;
using System.IO;
using Microsoft.ML;

namespace Samples.Dynamic
{
    public static class SaveAndLoadFromText
    {
        public static void Example()
        {
            // Create a new context for ML.NET operations. It can be used for
            // exception tracking and logging, as a catalog of available operations
            // and as the source of randomness. Setting the seed to a fixed number
            // in this example to make outputs deterministic.
            var mlContext = new MLContext(seed: 0);

            // Create a list of training data points.
            var dataPoints = new List<DataPoint>()
            {
                new DataPoint(){ Label = 0, Features = 4},
                new DataPoint(){ Label = 0, Features = 5},
                new DataPoint(){ Label = 0, Features = 6},
                new DataPoint(){ Label = 1, Features = 8},
                new DataPoint(){ Label = 1, Features = 9},
            };

            // Convert the list of data points to an IDataView object, which is
            // consumable by ML.NET API.
            IDataView data = mlContext.Data.LoadFromEnumerable(dataPoints);

            // Create a FileStream object and write the IDataView to it as a text
            // file.
            using (FileStream stream = new FileStream("data.tsv", FileMode.Create))
                mlContext.Data.SaveAsText(data, stream);

            // Create an IDataView object by loading the text file.
            IDataView loadedData = mlContext.Data.LoadFromTextFile("data.tsv");

            // Inspect the data that is loaded from the previously saved text file.
            var loadedDataEnumerable = mlContext.Data
                .CreateEnumerable<DataPoint>(loadedData, reuseRowObject: false);

            foreach (DataPoint row in loadedDataEnumerable)
                Console.WriteLine($"{row.Label}, {row.Features}");

            // Preview of the loaded data.
            // 0, 4
            // 0, 5
            // 0, 6
            // 1, 8
            // 1, 9
        }

        // Example with label and feature values. A data set is a collection of such
        // examples.
        private class DataPoint
        {
            public float Label { get; set; }

            public float Features { get; set; }
        }
    }
}

Si applica a

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

Caricare un oggetto IDataView da un file di testo usando TextLoader. Si noti che IDataView's sono lazy, quindi non viene eseguito alcun caricamento effettivo qui, solo convalida dello schema.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Column[] columns, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Column[] * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, columns As TextLoader.Column(), Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Parametri

path
String

Percorso dei file.

columns
TextLoader.Column[]

Colonne dello schema.

separatorChar
Char

Carattere utilizzato come separatore tra i punti dati in una riga. Per impostazione predefinita, il carattere di scheda viene usato come separatore.

hasHeader
Boolean

Indica se il file ha un'intestazione. Quando true, il caricatore ignora la prima riga quando Load(IMultiStreamSource) viene chiamata.

allowQuoting
Boolean

Se l'input può includere valori con virgolette doppie. Questo parametro viene usato per distinguere i caratteri separatori in un valore di input dai separatori effettivi. Quando true, i separatori all'interno di virgolette doppie vengono considerati come parte del valore di input. Quando false, tutti i separatori, anche quelli con virgolette, vengono considerati come delimitatori di una nuova colonna. Viene usato anche per distinguere i valori vuoti dai valori mancanti. Quando true, il valore mancante viene denotato da separatori consecutivi e valori vuoti per "". Quando false, i valori vuoti vengono denotati da separatori consecutivi e valori mancanti per il valore mancante predefinito per ogni tipo documentato in DataKind.

trimWhitespace
Boolean

Rimuovere spazi vuoti finali dalle righe.

allowSparse
Boolean

Se l'input può includere rappresentazioni sparse. Ad esempio, una riga contenente "5 2:6 4:3" indica che sono presenti 5 colonne e l'unico non zero sono colonne 2 e 4, che hanno rispettivamente valori 6 e 3. Gli indici di colonna sono basati su zero, quindi le colonne 2 e 4 rappresentano le colonne 3 e 5th. Una colonna può anche avere valori densi seguiti da valori sparse rappresentati in questo modo. Ad esempio, una riga contenente "1 2 5 2:6 4:3" rappresenta due colonne dense con valori 1 e 2, seguiti da 5 colonne sparse rappresentate con valori 0, 0, 6, 0 e 3. Gli indici delle colonne sparse iniziano da 0, anche se 0 rappresenta la terza colonna.

Restituisce

Visualizzazione dati.

Si applica a

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

Caricare un oggetto IDataView da un file di testo usando TextLoader. Si noti che IDataView's sono lazy, quindi non viene eseguito alcun caricamento effettivo qui, solo convalida dello schema.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, options As TextLoader.Options) As IDataView

Parametri di tipo

TInput

Parametri

path
String

Specifica un file o un percorso di file da cui caricare.

options
TextLoader.Options

Definisce le impostazioni dell'operazione di caricamento. Non è necessario specificare un campo Columns, poiché le colonne verranno inferte da questo metodo.

Restituisce

Visualizzazione dati.

Si applica a

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

Caricare un oggetto IDataView da un file di testo usando TextLoader. Si noti che IDataView's sono lazy, quindi non viene eseguito alcun caricamento effettivo qui, solo convalida dello schema.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Parametri di tipo

TInput

Parametri

path
String

Percorso dei file.

separatorChar
Char

Carattere separatore di colonna. Il valore predefinito è '\t'

hasHeader
Boolean

Indica se il file ha un'intestazione. Quando true, il caricatore ignora la prima riga quando Load(IMultiStreamSource) viene chiamata.

allowQuoting
Boolean

Se l'input può includere valori con virgolette doppie. Questo parametro viene usato per distinguere i caratteri separatori in un valore di input dai separatori effettivi. Quando true, i separatori all'interno di virgolette doppie vengono considerati come parte del valore di input. Quando false, tutti i separatori, anche quelli con virgolette, vengono considerati come delimitatori di una nuova colonna. Viene usato anche per distinguere i valori vuoti dai valori mancanti. Quando true, il valore mancante viene denotato da separatori consecutivi e valori vuoti per "". Quando false, i valori vuoti vengono denotati da separatori consecutivi e valori mancanti per il valore mancante predefinito per ogni tipo documentato in DataKind.

trimWhitespace
Boolean

Rimuovere spazi vuoti finali dalle righe.

allowSparse
Boolean

Se l'input può includere rappresentazioni sparse. Ad esempio, una riga contenente "5 2:6 4:3" indica che sono presenti 5 colonne e l'unico non zero sono colonne 2 e 4, che hanno rispettivamente valori 6 e 3. Gli indici di colonna sono basati su zero, quindi le colonne 2 e 4 rappresentano le colonne 3 e 5th. Una colonna può anche avere valori densi seguiti da valori sparse rappresentati in questo modo. Ad esempio, una riga contenente "1 2 5 2:6 4:3" rappresenta due colonne dense con valori 1 e 2, seguiti da 5 colonne sparse rappresentate con valori 0, 0, 6, 0 e 3. Gli indici delle colonne sparse iniziano da 0, anche se 0 rappresenta la terza colonna.

Restituisce

Visualizzazione dati.

Si applica a