TextLoader.Options Klasa
Definicja
Ważne
Niektóre informacje odnoszą się do produktu w wersji wstępnej, który może zostać znacząco zmodyfikowany przed wydaniem. Firma Microsoft nie udziela żadnych gwarancji, jawnych lub domniemanych, w odniesieniu do informacji podanych w tym miejscu.
Ustawienia dla TextLoader
public class TextLoader.Options
type TextLoader.Options = class
Public Class TextLoader.Options
- Dziedziczenie
-
TextLoader.Options
Konstruktory
TextLoader.Options() |
Ustawienia dla TextLoader |
Pola
AllowQuoting |
Czy dane wejściowe mogą zawierać podwójne cytowane wartości. Ten parametr służy do rozróżniania znaków separatora w wartości wejściowej od rzeczywistych separatorów. Gdy |
AllowSparse |
Określa, czy dane wejściowe mogą zawierać rozrzedne reprezentacje. Na przykład wiersz zawierający wartość "5 2:6 4:3" oznacza, że istnieje 5 kolumn, a jedyną wartością spoza zera są kolumny 2 i 4, które mają odpowiednio wartości 6 i 3. Indeksy kolumn są oparte na zera, więc kolumny 2 i 4 reprezentują 3 i 5. kolumny. Kolumna może również zawierać gęste wartości, a po nim rozrzedzone wartości reprezentowane w ten sposób. Na przykład wiersz zawierający "1 2 5 2:6 4:3" reprezentuje dwie gęste kolumny z wartościami 1 i 2, a następnie 5 rzadkich kolumn z wartościami 0, 0, 6, 0 i 3. Indeksy kolumn rozrzednych zaczynają się od 0, mimo że 0 reprezentuje trzecią kolumnę. Ponadto należy użyć, InputSize gdy liczba rozrzednych elementów (5 w tym przykładzie) nie jest obecna w każdym wierszu. Powinien on określać całkowity rozmiar, a nie tylko rozmiar części rozrzedowej. Jednak indeksy części rozrzednia są względne od tego, gdzie zaczyna się część rozrzedli. Jeśli InputSize parametr ma wartość 7, wiersz "1 2 2:6 4:3" zostanie zamapowany na wartość "1 2 0 0 6 0 4", ale jeśli zostanie ustawiona na 10, ten sam wiersz zostanie zamapowany na "1 2 0 0 0 6 0 4 0 0". |
Columns |
Określa kolumny wejściowe, które mają być mapowane na IDataView kolumny. |
DecimalMarker |
Znak, który powinien być używany jako znacznik dziesiętny. Wartość domyślna to '.'. Tylko znaki "". i "", mogą być znacznikami dziesiętnych. |
EscapeChar |
Znak używany do ucieczki cudzysłowów wewnątrz cytowanych pól. Nie może być znakiem używanym jako separator. |
HasHeader |
Określa, czy plik ma nagłówek z nazwami funkcji. W przypadku |
HeaderFile |
Plik zawierający nagłówek z nazwami funkcji. Jeśli zostanie określony, nagłówek zdefiniowany w pliku danych jest ignorowany niezależnie od HasHeader. |
InputSize |
Liczba kolumn źródłowych w danych tekstowych. Ustawieniem domyślnym jest to, że rozrzedzeni wiersze zawierają informacje o rozmiarze. |
MaxRows |
Maksymalna liczba wierszy do utworzenia. |
MissingRealsAsNaNs |
W przypadku wartości true brakujące pola rzeczywiste (tj. podwójne lub pojedyncze pola) zostaną załadowane jako NaN. Jeśli wartość false, zostaną one załadowane jako 0. Wartość domyślna to false. Pole jest uznawane za "brakujące", jeśli jest puste, jeśli zawiera tylko białe znaki lub jeśli brakuje kolumn na końcu danego wiersza. |
ReadMultilines |
Jeśli to prawda, nowe znaki wiersza są dopuszczalne wewnątrz pola cudzysłów, a zatem jedno pole może zawierać wiele wierszy tekstu wewnątrz niego AllowQuoting Jeśli jest fałsz, ta opcja jest ignorowana. |
Separators |
Znaki, które powinny być używane jako separatory kolumn. |
TrimWhitespace |
Wheter usunąć końcowy biały znak z wierszy. |
UseThreads |
Czy używać oddzielnych wątków analizowania. |