Bagikan melalui


TextLoader.Options Kelas

Definisi

Pengaturan untuk TextLoader

public class TextLoader.Options
type TextLoader.Options = class
Public Class TextLoader.Options
Warisan
TextLoader.Options

Konstruktor

TextLoader.Options()

Pengaturan untuk TextLoader

Bidang

AllowQuoting

Apakah input dapat menyertakan nilai yang dikutip ganda. Parameter ini digunakan untuk membedakan karakter pemisah dalam nilai input dari pemisah aktual. Ketika true, pemisah dalam tanda kutip ganda diperlakukan sebagai bagian dari nilai input. Ketika false, semua pemisah, bahkan yang ada dalam tanda kutip, diperlakukan sebagai pembatas kolom baru.

AllowSparse

Apakah input mungkin menyertakan representasi yang jarang. Misalnya, baris yang berisi "5 2:6 4:3" berarti bahwa ada 5 kolom, dan satu-satunya non-nol adalah kolom 2 dan 4, yang masing-masing memiliki nilai 6 dan 3. Indeks kolom berbasis nol, sehingga kolom 2 dan 4 mewakili kolom ke-3 dan ke-5. Kolom mungkin juga memiliki nilai padat diikuti dengan nilai jarang yang diwakili dalam mode ini. Misalnya, baris yang berisi "1 2 5 2:6 4:3" mewakili dua kolom padat dengan nilai 1 dan 2, diikuti oleh 5 kolom yang jarang diwakili dengan nilai 0, 0, 6, 0, dan 3. Indeks kolom jarang dimulai dari 0, meskipun 0 mewakili kolom ketiga.

Selain itu, InputSize harus digunakan ketika jumlah elemen jarang (5 dalam contoh ini) tidak ada di setiap baris. Ini harus menentukan ukuran total, bukan hanya ukuran bagian jarang. Namun, indeks bagian spar relatif terhadap di mana bagian jarang dimulai. Jika InputSize diatur ke 7, baris "1 2 2:6 4:3" akan dipetakan ke "1 2 0 0 6 0 4", tetapi jika diatur ke 10, baris yang sama akan dipetakan ke "1 2 0 0 6 0 4 0 0 0".

Columns

Menentukan kolom input yang harus dipetakan ke IDataView kolom.

DecimalMarker

Karakter yang harus digunakan sebagai penanda desimal. Nilai defaultnya adalah '.'. Hanya '.' dan ',' yang diizinkan untuk menjadi penanda desimal.

EscapeChar

Karakter yang digunakan untuk meloloskan kutipan di dalam bidang yang dikutip. Ini tidak bisa menjadi karakter yang digunakan sebagai pemisah.

HasHeader

Apakah file memiliki header dengan nama fitur. Ketika true, loader akan melewati baris pertama saat Load(IMultiStreamSource) dipanggil. Sampel dapat digunakan untuk menyimpulkan anotasi nama slot jika ada.

HeaderFile

File yang berisi header dengan nama fitur. Jika ditentukan, header yang ditentukan dalam file data diabaikan terlepas dari HasHeader.

InputSize

Jumlah kolom sumber dalam data teks. Defaultnya adalah baris jarang berisi informasi ukurannya.

MaxRows

Jumlah baris maksimum yang akan dihasilkan.

MissingRealsAsNaNs

Jika true, bidang nyata yang hilang (yaitu bidang ganda atau tunggal) akan dimuat sebagai NaN. Jika false, mereka akan dimuat sebagai 0. Defaultnya adalah false. Bidang dianggap "hilang" jika kosong, jika hanya memiliki spasi kosong, atau jika ada kolom yang hilang di akhir baris tertentu.

ReadMultilines

Jika true, karakter baris baru dapat diterima di dalam bidang yang dikutip, dan dengan demikian satu bidang dapat memiliki beberapa baris teks di dalamnya Jika AllowQuoting salah, opsi ini diabaikan.

Separators

Karakter yang harus digunakan sebagai pemisah kolom pemisah.

TrimWhitespace

Wheter untuk menghapus spasi kosong berikutnya dari garis.

UseThreads

Apakah akan menggunakan utas penguraian terpisah.

Berlaku untuk