TextLoader.Options Klasse
Definition
Wichtig
Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.
Die Einstellungen für TextLoader
public class TextLoader.Options
type TextLoader.Options = class
Public Class TextLoader.Options
- Vererbung
-
TextLoader.Options
Konstruktoren
TextLoader.Options() |
Die Einstellungen für TextLoader |
Felder
AllowQuoting |
Gibt an, ob die Eingabe Werte in doppelter Anführungszeichen enthalten darf. Dieser Parameter wird verwendet, um Trennzeichen in einem Eingabewert von tatsächlichen Trennzeichen zu unterscheiden. Wenn |
AllowSparse |
Gibt an, ob die Eingabe Sparsedarstellungen enthalten kann. Beispielsweise bedeutet eine Zeile mit "5 2:6 4:3", dass es fünf Spalten gibt, und die einzigen Spalten ungleich Null sind die Spalten 2 und 4, die die Werte 6 bzw. 3 aufweisen. Spaltenindizes sind nullbasiert, sodass die Spalten 2 und 4 die 3. und 5. Spalte darstellen. Eine Spalte kann auch dichte Werte aufweisen, gefolgt von Sparsewerten, die auf diese Weise dargestellt werden. Beispielsweise stellt eine Zeile mit "1 2 5 2:6 4:3" zwei dichte Spalten mit den Werten 1 und 2 dar, gefolgt von 5 spär dargestellten Spalten mit den Werten 0, 0, 6, 0 und 3. Die Indizes der Sparsespalten beginnen bei 0, obwohl 0 die dritte Spalte darstellt. Darüber hinaus sollte verwendet werden, InputSize wenn die Anzahl der Sparseelemente (in diesem Beispiel 5) nicht in jeder Zeile vorhanden ist. Es sollte die Gesamtgröße angeben, nicht nur die Größe des Sparseteils. Die Indizes des Spars-Teils sind jedoch relativ zum Anfang des Sparseteils. Wenn InputSize auf 7 festgelegt ist, wird die Zeile "1 2 2:6 4:3" "1 2 0 0 0 6 0 4" zugeordnet, aber wenn auf 10 festgelegt ist, wird dieselbe Zeile "1 2 0 0 6 0 4 0 0 0" zugeordnet. |
Columns |
Gibt die Eingabespalten an IDataView , die Spalten zugeordnet werden sollen. |
DecimalMarker |
Das Zeichen, das als Dezimalmarkierung verwendet werden soll. Der Standardwert ist ".". Nur "." und "," dürfen Dezimalmarkierungen sein. |
EscapeChar |
Zeichen, das verwendet werden soll, um Anführungszeichen in Anführungszeichen zu escapen. Es darf kein Zeichen sein, das als Trennzeichen verwendet wird. |
HasHeader |
Gibt an, ob die Datei über einen Header mit Featurenamen verfügt. Wenn |
HeaderFile |
Datei, die einen Header mit Featurenamen enthält. Wenn angegeben, wird der in der Datendatei definierte Header unabhängig von HasHeaderignoriert. |
InputSize |
Anzahl der Quellspalten in den Textdaten. Der Standardwert ist, dass Sparsezeilen ihre Größeninformationen enthalten. |
MaxRows |
Maximale Anzahl der zu erzeugenden Zeilen. |
MissingRealsAsNaNs |
Wenn true, werden fehlende reale Felder (d. h. doppel oder einzelne Felder) als NaN geladen. Wenn false, werden sie als 0 geladen. Der Standardwert ist "false". Ein Feld wird als "fehlend" betrachtet, wenn es leer ist, wenn es nur Leerzeichen enthält oder wenn am Ende einer bestimmten Zeile Spalten fehlen. |
ReadMultilines |
Wenn true, sind neue Zeilenzeichen innerhalb eines Felds in Anführungszeichen zulässig, sodass ein Feld mehrere Textzeilen enthalten kann. Wenn AllowQuoting false ist, wird diese Option ignoriert. |
Separators |
Die Zeichen, die als Trennzeichen verwendet werden sollen. |
TrimWhitespace |
Wheter, um nachfolgende Leerzeichen von Zeilen zu entfernen. |
UseThreads |
Gibt an, ob separate Analysethreads verwendet werden sollen. |