Bagikan melalui


TextLoaderSaverCatalog.LoadFromTextFile Metode

Definisi

Overload

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options = default);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, Optional options As TextLoader.Options = Nothing) As IDataView

Parameter

path
String

Menentukan file atau jalur file yang akan dimuat.

options
TextLoader.Options

Menentukan pengaturan operasi pemuatan.

Mengembalikan

Contoh

using System;
using System.Collections.Generic;
using System.IO;
using Microsoft.ML;

namespace Samples.Dynamic
{
    public static class SaveAndLoadFromText
    {
        public static void Example()
        {
            // Create a new context for ML.NET operations. It can be used for
            // exception tracking and logging, as a catalog of available operations
            // and as the source of randomness. Setting the seed to a fixed number
            // in this example to make outputs deterministic.
            var mlContext = new MLContext(seed: 0);

            // Create a list of training data points.
            var dataPoints = new List<DataPoint>()
            {
                new DataPoint(){ Label = 0, Features = 4},
                new DataPoint(){ Label = 0, Features = 5},
                new DataPoint(){ Label = 0, Features = 6},
                new DataPoint(){ Label = 1, Features = 8},
                new DataPoint(){ Label = 1, Features = 9},
            };

            // Convert the list of data points to an IDataView object, which is
            // consumable by ML.NET API.
            IDataView data = mlContext.Data.LoadFromEnumerable(dataPoints);

            // Create a FileStream object and write the IDataView to it as a text
            // file.
            using (FileStream stream = new FileStream("data.tsv", FileMode.Create))
                mlContext.Data.SaveAsText(data, stream);

            // Create an IDataView object by loading the text file.
            IDataView loadedData = mlContext.Data.LoadFromTextFile("data.tsv");

            // Inspect the data that is loaded from the previously saved text file.
            var loadedDataEnumerable = mlContext.Data
                .CreateEnumerable<DataPoint>(loadedData, reuseRowObject: false);

            foreach (DataPoint row in loadedDataEnumerable)
                Console.WriteLine($"{row.Label}, {row.Features}");

            // Preview of the loaded data.
            // 0, 4
            // 0, 5
            // 0, 6
            // 1, 8
            // 1, 9
        }

        // Example with label and feature values. A data set is a collection of such
        // examples.
        private class DataPoint
        {
            public float Label { get; set; }

            public float Features { get; set; }
        }
    }
}

Berlaku untuk

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Column[] columns, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Column[] * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, columns As TextLoader.Column(), Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Parameter

path
String

Jalur ke file.

columns
TextLoader.Column[]

Kolom skema.

separatorChar
Char

Karakter yang digunakan sebagai pemisah antara titik data berturut-turut. Secara default karakter tab digunakan sebagai pemisah.

hasHeader
Boolean

Apakah file memiliki header. Ketika true, loader akan melewati baris pertama saat Load(IMultiStreamSource) dipanggil.

allowQuoting
Boolean

Apakah input dapat menyertakan nilai yang dikutip ganda. Parameter ini digunakan untuk membedakan karakter pemisah dalam nilai input dari pemisah aktual. Ketika true, pemisah dalam tanda kutip ganda diperlakukan sebagai bagian dari nilai input. Ketika false, semua pemisah, bahkan tanda kutip whitin tersebut, diperlakukan sebagai pembatas kolom baru. Ini juga digunakan untuk membedakan nilai kosong dari nilai yang hilang. Ketika true, nilai yang hilang ditandai dengan pemisah berturut-turut dan nilai kosong dengan "". Ketika false, nilai kosong ditandai oleh pemisah berturut-turut dan nilai yang hilang secara default nilai yang hilang untuk setiap jenis yang didokumenkan dalam DataKind.

trimWhitespace
Boolean

Hapus spasi kosong berikutnya dari garis.

allowSparse
Boolean

Apakah input mungkin menyertakan representasi yang jarang. Misalnya, baris yang berisi "5 2:6 4:3" berarti bahwa ada 5 kolom, dan satu-satunya non-nol adalah kolom 2 dan 4, yang masing-masing memiliki nilai 6 dan 3. Indeks kolom berbasis nol, sehingga kolom 2 dan 4 mewakili kolom ke-3 dan ke-5. Kolom mungkin juga memiliki nilai padat diikuti dengan nilai jarang yang diwakili dalam mode ini. Misalnya, baris yang berisi "1 2 5 2:6 4:3" mewakili dua kolom padat dengan nilai 1 dan 2, diikuti oleh 5 kolom yang jarang diwakili dengan nilai 0, 0, 6, 0, dan 3. Indeks kolom jarang dimulai dari 0, meskipun 0 mewakili kolom ketiga.

Mengembalikan

Tampilan data.

Berlaku untuk

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, options As TextLoader.Options) As IDataView

Jenis parameter

TInput

Parameter

path
String

Menentukan file atau jalur file yang akan dimuat.

options
TextLoader.Options

Menentukan pengaturan operasi pemuatan. Tidak perlu menentukan bidang Kolom, karena kolom akan disimpulkan oleh metode ini.

Mengembalikan

Tampilan data.

Berlaku untuk

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

Jenis parameter

TInput

Parameter

path
String

Jalur ke file.

separatorChar
Char

Karakter pemisah kolom. Defaultnya adalah '\t'

hasHeader
Boolean

Apakah file memiliki header. Ketika true, loader akan melewati baris pertama saat Load(IMultiStreamSource) dipanggil.

allowQuoting
Boolean

Apakah input dapat menyertakan nilai yang dikutip ganda. Parameter ini digunakan untuk membedakan karakter pemisah dalam nilai input dari pemisah aktual. Ketika true, pemisah dalam tanda kutip ganda diperlakukan sebagai bagian dari nilai input. Ketika false, semua pemisah, bahkan tanda kutip whitin tersebut, diperlakukan sebagai pembatas kolom baru. Ini juga digunakan untuk membedakan nilai kosong dari nilai yang hilang. Ketika true, nilai yang hilang ditandai dengan pemisah berturut-turut dan nilai kosong dengan "". Ketika false, nilai kosong ditandai oleh pemisah berturut-turut dan nilai yang hilang secara default nilai yang hilang untuk setiap jenis yang didokumenkan dalam DataKind.

trimWhitespace
Boolean

Hapus spasi kosong berikutnya dari garis.

allowSparse
Boolean

Apakah input mungkin menyertakan representasi yang jarang. Misalnya, baris yang berisi "5 2:6 4:3" berarti bahwa ada 5 kolom, dan satu-satunya non-nol adalah kolom 2 dan 4, yang masing-masing memiliki nilai 6 dan 3. Indeks kolom berbasis nol, sehingga kolom 2 dan 4 mewakili kolom ke-3 dan ke-5. Kolom mungkin juga memiliki nilai padat diikuti dengan nilai jarang yang diwakili dalam mode ini. Misalnya, baris yang berisi "1 2 5 2:6 4:3" mewakili dua kolom padat dengan nilai 1 dan 2, diikuti oleh 5 kolom yang jarang diwakili dengan nilai 0, 0, 6, 0, dan 3. Indeks kolom jarang dimulai dari 0, meskipun 0 mewakili kolom ketiga.

Mengembalikan

Tampilan data.

Berlaku untuk