TextLoaderSaverCatalog.LoadFromTextFile Metode
Definisi
Penting
Beberapa informasi terkait produk prarilis yang dapat diubah secara signifikan sebelum dirilis. Microsoft tidak memberikan jaminan, tersirat maupun tersurat, sehubungan dengan informasi yang diberikan di sini.
Overload
LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options) |
IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema. |
LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean) |
IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema. |
LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options) |
IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema. |
LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean) |
IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema. |
LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)
IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema.
public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options = default);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, Optional options As TextLoader.Options = Nothing) As IDataView
Parameter
- catalog
- DataOperationsCatalog
Katalognya DataOperationsCatalog .
- path
- String
Menentukan file atau jalur file yang akan dimuat.
- options
- TextLoader.Options
Menentukan pengaturan operasi pemuatan.
Mengembalikan
Contoh
using System;
using System.Collections.Generic;
using System.IO;
using Microsoft.ML;
namespace Samples.Dynamic
{
public static class SaveAndLoadFromText
{
public static void Example()
{
// Create a new context for ML.NET operations. It can be used for
// exception tracking and logging, as a catalog of available operations
// and as the source of randomness. Setting the seed to a fixed number
// in this example to make outputs deterministic.
var mlContext = new MLContext(seed: 0);
// Create a list of training data points.
var dataPoints = new List<DataPoint>()
{
new DataPoint(){ Label = 0, Features = 4},
new DataPoint(){ Label = 0, Features = 5},
new DataPoint(){ Label = 0, Features = 6},
new DataPoint(){ Label = 1, Features = 8},
new DataPoint(){ Label = 1, Features = 9},
};
// Convert the list of data points to an IDataView object, which is
// consumable by ML.NET API.
IDataView data = mlContext.Data.LoadFromEnumerable(dataPoints);
// Create a FileStream object and write the IDataView to it as a text
// file.
using (FileStream stream = new FileStream("data.tsv", FileMode.Create))
mlContext.Data.SaveAsText(data, stream);
// Create an IDataView object by loading the text file.
IDataView loadedData = mlContext.Data.LoadFromTextFile("data.tsv");
// Inspect the data that is loaded from the previously saved text file.
var loadedDataEnumerable = mlContext.Data
.CreateEnumerable<DataPoint>(loadedData, reuseRowObject: false);
foreach (DataPoint row in loadedDataEnumerable)
Console.WriteLine($"{row.Label}, {row.Features}");
// Preview of the loaded data.
// 0, 4
// 0, 5
// 0, 6
// 1, 8
// 1, 9
}
// Example with label and feature values. A data set is a collection of such
// examples.
private class DataPoint
{
public float Label { get; set; }
public float Features { get; set; }
}
}
}
Berlaku untuk
LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)
IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema.
public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Column[] columns, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Column[] * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, columns As TextLoader.Column(), Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView
Parameter
- catalog
- DataOperationsCatalog
Katalognya DataOperationsCatalog .
- path
- String
Jalur ke file.
- columns
- TextLoader.Column[]
Kolom skema.
- separatorChar
- Char
Karakter yang digunakan sebagai pemisah antara titik data berturut-turut. Secara default karakter tab digunakan sebagai pemisah.
- hasHeader
- Boolean
Apakah file memiliki header. Ketika true
, loader akan melewati baris pertama saat Load(IMultiStreamSource) dipanggil.
- allowQuoting
- Boolean
Apakah input dapat menyertakan nilai yang dikutip ganda. Parameter ini digunakan untuk membedakan karakter pemisah dalam nilai input dari pemisah aktual. Ketika true
, pemisah dalam tanda kutip ganda diperlakukan sebagai bagian dari nilai input. Ketika false
, semua pemisah, bahkan tanda kutip whitin tersebut, diperlakukan sebagai pembatas kolom baru.
Ini juga digunakan untuk membedakan nilai kosong dari nilai yang hilang. Ketika true
, nilai yang hilang ditandai dengan pemisah berturut-turut dan nilai kosong dengan "". Ketika false
, nilai kosong ditandai oleh pemisah berturut-turut dan nilai yang hilang secara default nilai yang hilang untuk setiap jenis yang didokumenkan dalam DataKind.
- trimWhitespace
- Boolean
Hapus spasi kosong berikutnya dari garis.
- allowSparse
- Boolean
Apakah input mungkin menyertakan representasi yang jarang. Misalnya, baris yang berisi "5 2:6 4:3" berarti bahwa ada 5 kolom, dan satu-satunya non-nol adalah kolom 2 dan 4, yang masing-masing memiliki nilai 6 dan 3. Indeks kolom berbasis nol, sehingga kolom 2 dan 4 mewakili kolom ke-3 dan ke-5. Kolom mungkin juga memiliki nilai padat diikuti dengan nilai jarang yang diwakili dalam mode ini. Misalnya, baris yang berisi "1 2 5 2:6 4:3" mewakili dua kolom padat dengan nilai 1 dan 2, diikuti oleh 5 kolom yang jarang diwakili dengan nilai 0, 0, 6, 0, dan 3. Indeks kolom jarang dimulai dari 0, meskipun 0 mewakili kolom ketiga.
Mengembalikan
Tampilan data.
Berlaku untuk
LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)
IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema.
public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, options As TextLoader.Options) As IDataView
Jenis parameter
- TInput
Parameter
- catalog
- DataOperationsCatalog
Katalognya DataOperationsCatalog .
- path
- String
Menentukan file atau jalur file yang akan dimuat.
- options
- TextLoader.Options
Menentukan pengaturan operasi pemuatan. Tidak perlu menentukan bidang Kolom, karena kolom akan disimpulkan oleh metode ini.
Mengembalikan
Tampilan data.
Berlaku untuk
LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)
IDataView Muat dari file teks menggunakan TextLoader. Perhatikan bahwa IDataViewmalas, jadi tidak ada pemuatan aktual yang terjadi di sini, hanya validasi skema.
public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView
Jenis parameter
- TInput
Parameter
- catalog
- DataOperationsCatalog
Katalognya DataOperationsCatalog .
- path
- String
Jalur ke file.
- separatorChar
- Char
Karakter pemisah kolom. Defaultnya adalah '\t'
- hasHeader
- Boolean
Apakah file memiliki header. Ketika true
, loader akan melewati baris pertama saat Load(IMultiStreamSource) dipanggil.
- allowQuoting
- Boolean
Apakah input dapat menyertakan nilai yang dikutip ganda. Parameter ini digunakan untuk membedakan karakter pemisah dalam nilai input dari pemisah aktual. Ketika true
, pemisah dalam tanda kutip ganda diperlakukan sebagai bagian dari nilai input. Ketika false
, semua pemisah, bahkan tanda kutip whitin tersebut, diperlakukan sebagai pembatas kolom baru.
Ini juga digunakan untuk membedakan nilai kosong dari nilai yang hilang. Ketika true
, nilai yang hilang ditandai dengan pemisah berturut-turut dan nilai kosong dengan "". Ketika false
, nilai kosong ditandai oleh pemisah berturut-turut dan nilai yang hilang secara default nilai yang hilang untuk setiap jenis yang didokumenkan dalam DataKind.
- trimWhitespace
- Boolean
Hapus spasi kosong berikutnya dari garis.
- allowSparse
- Boolean
Apakah input mungkin menyertakan representasi yang jarang. Misalnya, baris yang berisi "5 2:6 4:3" berarti bahwa ada 5 kolom, dan satu-satunya non-nol adalah kolom 2 dan 4, yang masing-masing memiliki nilai 6 dan 3. Indeks kolom berbasis nol, sehingga kolom 2 dan 4 mewakili kolom ke-3 dan ke-5. Kolom mungkin juga memiliki nilai padat diikuti dengan nilai jarang yang diwakili dalam mode ini. Misalnya, baris yang berisi "1 2 5 2:6 4:3" mewakili dua kolom padat dengan nilai 1 dan 2, diikuti oleh 5 kolom yang jarang diwakili dengan nilai 0, 0, 6, 0, dan 3. Indeks kolom jarang dimulai dari 0, meskipun 0 mewakili kolom ketiga.
Mengembalikan
Tampilan data.