Aracılığıyla paylaş


TextLoader.Options Sınıf

Tanım

Ayarları: TextLoader

public class TextLoader.Options
type TextLoader.Options = class
Public Class TextLoader.Options
Devralma
TextLoader.Options

Oluşturucular

TextLoader.Options()

Ayarları: TextLoader

Alanlar

AllowQuoting

Girişin çift tırnaklı değerler içerip içermeyebileceği. Bu parametre, bir giriş değerindeki ayırıcı karakterleri gerçek ayırıcılardan ayırmak için kullanılır. Çift tırnak içindeki ayırıcılar giriş değerinin bir parçası olarak kabul edildiğinde true. Tüm falseayırıcılar, tırnak içindekiler bile yeni bir sütunu sınırlandırma olarak kabul edilir.

AllowSparse

Girişin seyrek gösterimler içerip içermeyebileceği. Örneğin, "5 2:6 4:3" içeren bir satır, 5 sütun olduğu ve sıfır olmayan tek sütunun sırasıyla 6 ve 3 değerlerine sahip 2 ve 4 sütunları olduğu anlamına gelir. Sütun dizinleri sıfır tabanlıdır, bu nedenle 2 ve 4 sütunları 3. ve 5. sütunları temsil eder. Bir sütunun yoğun değerleri ve ardından bu şekilde temsil edilen seyrek değerler de olabilir. Örneğin, "1 2 5 2:6 4:3" içeren bir satır, 1 ve 2 değerlerine sahip iki yoğun sütunu ve ardından 0, 0, 6, 0 ve 3 değerleriyle seyrek temsil edilen 5 sütunu temsil eder. Seyrek sütunların dizinleri, 0 üçüncü sütunu temsil etse de 0'dan başlar.

Ayrıca, InputSize seyrek öğe sayısı (bu örnekte 5) her satırda mevcut olmadığında kullanılmalıdır. Yalnızca seyrek parçanın boyutunu değil toplam boyutunu belirtmelidir. Ancak, spars bölümünün endeksleri seyrek kısmın başladığı yere göre değişir. 7 olarak ayarlanırsa InputSize , "1 2 2:6 4:3" satırı "1 2 0 0 6 0 4" ile eşlenir, ancak 10 olarak ayarlanırsa aynı satır "1 2 0 0 6 0 4 0 0 0" ile eşlenir.

Columns

Sütunlarla eşlenmesi gereken giriş sütunlarını IDataView belirtir.

DecimalMarker

Ondalık işaretçi olarak kullanılması gereken karakter. Varsayılan değer : '.'. Yalnızca '.' ve ',' ondalık işaretçileri olabilir.

EscapeChar

Tırnak içine alınmış alanların içindeki tırnak işaretleri için kullanılacak karakter. Ayırıcı olarak kullanılan bir karakter olamaz.

HasHeader

Dosyanın özellik adlarıyla bir üst bilgisine sahip olup olmadığı. olduğunda true, yükleyici çağrıldığında Load(IMultiStreamSource) ilk satırı atlar. Örnek, varsa yuva adı ek açıklamalarını çıkarsamak için kullanılabilir.

HeaderFile

Özellik adlarıyla üst bilgi içeren dosya. Belirtilirse, veri dosyasında tanımlanan üst bilgi ne olursa olsun HasHeaderyoksayılır.

InputSize

Metin verilerindeki kaynak sütun sayısı. Varsayılan değer, seyrek satırların boyut bilgilerini içermesidir.

MaxRows

Üretilmesi gereken en fazla satır sayısı.

MissingRealsAsNaNs

Doğruysa, eksik gerçek alanlar (örneğin, çift veya tek alanlar) NaN olarak yüklenir. False ise 0 olarak yüklenir. Varsayılan değer false’tur. Boşsa, yalnızca boşluk varsa veya belirli bir satırın sonunda eksik sütunlar varsa, alan "eksik" olarak kabul edilir.

ReadMultilines

Doğruysa, tırnak içinde yeni satır karakterleri kabul edilebilir ve bu nedenle bir alanın içinde birden çok metin satırı olabilir Yanlışsa AllowQuoting , bu seçenek yoksayılır.

Separators

Ayırıcı olarak kullanılması gereken karakterler sütun ayırıcısı.

TrimWhitespace

Satırlardan sondaki boşluğu kaldırmak için wheter.

UseThreads

Ayrı ayrı iş parçacıklarının kullanılıp kullanılmaymayacağı.

Şunlara uygulanır