Freigeben über


TextCatalog.ProduceWordBags Methode

Definition

Überlädt

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Erstellen Sie einen WordBagEstimator, der die in inputColumnName angegebene Spalte einem Vektor der n-Gramm-Anzahl in einer neuen Spalte mit dem Namen outputColumnNamezuordnet.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Erstellen Sie einen WordBagEstimator, der die in inputColumnName angegebene Spalte einem Vektor der n-Gramm-Anzahl in einer neuen Spalte mit dem Namen outputColumnNamezuordnet.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Erstellen Sie ein WordBagEstimator, das die in angegebenen inputColumnNames mehrere Spalten einem Vektor von n-Gramm-Zahlen in einer neuen Spalte mit dem Namen outputColumnNamezuordnet.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Erstellen Sie einen WordBagEstimator, der die in inputColumnName angegebene Spalte einem Vektor der n-Gramm-Anzahl in einer neuen Spalte mit dem Namen outputColumnNamezuordnet.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator

Parameter

catalog
TransformsCatalog.TextTransforms

Der Katalog der Transformation.

outputColumnName
String

Der Name der Spalte, die sich aus der Transformation von inputColumnNameergibt. Der Datentyp dieser Spalte ist der Vektor der bekannten Größe.Single

termSeparator
Char
freqSeparator
Char
inputColumnName
String

Name der Spalte, aus der die Daten entnommen werden sollen. Maximale Anzahl von n-Grammen, die im Wörterbuch gespeichert werden sollen.Trennzeichen, das zum Trennen von Begriffs-/Häufigkeitspaaren verwendet wird.Trennzeichen, das verwendet wird, um Begriffe von ihrer Häufigkeit zu trennen. Dieser Schätzer arbeitet über den Textvektor.

maximumNgramsCount
Int32

Gibt zurück

Hinweise

WordBagEstimator unterscheidet sich darin NgramExtractingEstimator , dass ersterer Text intern tokenisiert und tokenisierten Text als Eingabe übernimmt.

Gilt für:

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Erstellen Sie einen WordBagEstimator, der die in inputColumnName angegebene Spalte einem Vektor der n-Gramm-Anzahl in einer neuen Spalte mit dem Namen outputColumnNamezuordnet.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Parameter

catalog
TransformsCatalog.TextTransforms

Der Katalog der Transformation.

outputColumnName
String

Der Name der Spalte, die sich aus der Transformation von inputColumnNameergibt. Der Datentyp dieser Spalte ist der Vektor der bekannten Größe.Single

inputColumnName
String

Name der Spalte, aus der die Daten entnommen werden sollen. Dieser Schätzer arbeitet über den Textvektor.

ngramLength
Int32

Ngramlänge.

skipLength
Int32

Maximale Anzahl von Token, die beim Erstellen eines n-Gramms übersprungen werden sollen.

useAllLengths
Boolean

Gibt an, ob alle n-Gramm-Längen bis oder ngramLength nur ngramLengtheingeschlossen werden sollen.

maximumNgramsCount
Int32

Maximale Anzahl von n-Grammen, die im Wörterbuch gespeichert werden sollen.

weighting
NgramExtractingEstimator.WeightingCriteria

Statistisches Maß, mit dem ausgewertet wird, wie wichtig ein Wort für ein Dokument in einem Korpus ist.

Gibt zurück

Hinweise

WordBagEstimator unterscheidet sich darin NgramExtractingEstimator , dass ersterer Text intern tokenisiert und tokenisierten Text als Eingabe übernimmt.

Gilt für:

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Erstellen Sie ein WordBagEstimator, das die in angegebenen inputColumnNames mehrere Spalten einem Vektor von n-Gramm-Zahlen in einer neuen Spalte mit dem Namen outputColumnNamezuordnet.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Parameter

catalog
TransformsCatalog.TextTransforms

Der Katalog der Transformation.

outputColumnName
String

Der Name der Spalte, die sich aus der Transformation von inputColumnNamesergibt. Der Datentyp dieser Spalte ist der Vektor der bekannten Größe.Single

inputColumnNames
String[]

Namen der mehrere Spalten, aus der die Daten entnommen werden sollen. Dieser Schätzer arbeitet über den Textvektor.

ngramLength
Int32

Ngramlänge.

skipLength
Int32

Maximale Anzahl von Token, die beim Erstellen eines n-Gramms übersprungen werden sollen.

useAllLengths
Boolean

Gibt an, ob alle n-Gramm-Längen bis oder ngramLength nur ngramLengtheingeschlossen werden sollen.

maximumNgramsCount
Int32

Maximale Anzahl von n-Grammen, die im Wörterbuch gespeichert werden sollen.

weighting
NgramExtractingEstimator.WeightingCriteria

Statistisches Maß, mit dem ausgewertet wird, wie wichtig ein Wort für ein Dokument in einem Korpus ist.

Gibt zurück

Hinweise

WordBagEstimator unterscheidet sich darin NgramExtractingEstimator , dass ersterer Text intern tokenisiert und tokenisierten Text als Eingabe übernimmt.

Gilt für: