Udostępnij za pośrednictwem


TextLoader.Options Klasa

Definicja

Ustawienia dla TextLoader

public class TextLoader.Options
type TextLoader.Options = class
Public Class TextLoader.Options
Dziedziczenie
TextLoader.Options

Konstruktory

TextLoader.Options()

Ustawienia dla TextLoader

Pola

AllowQuoting

Czy dane wejściowe mogą zawierać podwójne cytowane wartości. Ten parametr służy do rozróżniania znaków separatora w wartości wejściowej od rzeczywistych separatorów. Gdy trueseparatory w cudzysłowach podwójnych są traktowane jako część wartości wejściowej. Gdy falsewszystkie separatory, nawet te w cudzysłowie, są traktowane jako rozdzielające nową kolumnę.

AllowSparse

Określa, czy dane wejściowe mogą zawierać rozrzedne reprezentacje. Na przykład wiersz zawierający wartość "5 2:6 4:3" oznacza, że istnieje 5 kolumn, a jedyną wartością spoza zera są kolumny 2 i 4, które mają odpowiednio wartości 6 i 3. Indeksy kolumn są oparte na zera, więc kolumny 2 i 4 reprezentują 3 i 5. kolumny. Kolumna może również zawierać gęste wartości, a po nim rozrzedzone wartości reprezentowane w ten sposób. Na przykład wiersz zawierający "1 2 5 2:6 4:3" reprezentuje dwie gęste kolumny z wartościami 1 i 2, a następnie 5 rzadkich kolumn z wartościami 0, 0, 6, 0 i 3. Indeksy kolumn rozrzednych zaczynają się od 0, mimo że 0 reprezentuje trzecią kolumnę.

Ponadto należy użyć, InputSize gdy liczba rozrzednych elementów (5 w tym przykładzie) nie jest obecna w każdym wierszu. Powinien on określać całkowity rozmiar, a nie tylko rozmiar części rozrzedowej. Jednak indeksy części rozrzednia są względne od tego, gdzie zaczyna się część rozrzedli. Jeśli InputSize parametr ma wartość 7, wiersz "1 2 2:6 4:3" zostanie zamapowany na wartość "1 2 0 0 6 0 4", ale jeśli zostanie ustawiona na 10, ten sam wiersz zostanie zamapowany na "1 2 0 0 0 6 0 4 0 0".

Columns

Określa kolumny wejściowe, które mają być mapowane na IDataView kolumny.

DecimalMarker

Znak, który powinien być używany jako znacznik dziesiętny. Wartość domyślna to '.'. Tylko znaki "". i "", mogą być znacznikami dziesiętnych.

EscapeChar

Znak używany do ucieczki cudzysłowów wewnątrz cytowanych pól. Nie może być znakiem używanym jako separator.

HasHeader

Określa, czy plik ma nagłówek z nazwami funkcji. W przypadku true, moduł ładujący pominie pierwszy wiersz po Load(IMultiStreamSource) wywołaniu. Przykład może służyć do wnioskowania adnotacji nazw miejsc, jeśli są obecne.

HeaderFile

Plik zawierający nagłówek z nazwami funkcji. Jeśli zostanie określony, nagłówek zdefiniowany w pliku danych jest ignorowany niezależnie od HasHeader.

InputSize

Liczba kolumn źródłowych w danych tekstowych. Ustawieniem domyślnym jest to, że rozrzedzeni wiersze zawierają informacje o rozmiarze.

MaxRows

Maksymalna liczba wierszy do utworzenia.

MissingRealsAsNaNs

W przypadku wartości true brakujące pola rzeczywiste (tj. podwójne lub pojedyncze pola) zostaną załadowane jako NaN. Jeśli wartość false, zostaną one załadowane jako 0. Wartość domyślna to false. Pole jest uznawane za "brakujące", jeśli jest puste, jeśli zawiera tylko białe znaki lub jeśli brakuje kolumn na końcu danego wiersza.

ReadMultilines

Jeśli to prawda, nowe znaki wiersza są dopuszczalne wewnątrz pola cudzysłów, a zatem jedno pole może zawierać wiele wierszy tekstu wewnątrz niego AllowQuoting Jeśli jest fałsz, ta opcja jest ignorowana.

Separators

Znaki, które powinny być używane jako separatory kolumn.

TrimWhitespace

Wheter usunąć końcowy biały znak z wierszy.

UseThreads

Czy używać oddzielnych wątków analizowania.

Dotyczy