TextCatalog.ProduceWordBags Methode
Definition
Wichtig
Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.
Überlädt
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32) |
Erstellen Sie einen WordBagEstimator, der die in |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Erstellen Sie einen WordBagEstimator, der die in |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Erstellen Sie ein WordBagEstimator, das die in angegebenen |
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)
Erstellen Sie einen WordBagEstimator, der die in inputColumnName
angegebene Spalte einem Vektor der n-Gramm-Anzahl in einer neuen Spalte mit dem Namen outputColumnName
zuordnet.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator
Parameter
- catalog
- TransformsCatalog.TextTransforms
Der Katalog der Transformation.
- outputColumnName
- String
Der Name der Spalte, die sich aus der Transformation von inputColumnName
ergibt.
Der Datentyp dieser Spalte ist der Vektor der bekannten Größe.Single
- termSeparator
- Char
- freqSeparator
- Char
- inputColumnName
- String
Name der Spalte, aus der die Daten entnommen werden sollen. Maximale Anzahl von n-Grammen, die im Wörterbuch gespeichert werden sollen.Trennzeichen, das zum Trennen von Begriffs-/Häufigkeitspaaren verwendet wird.Trennzeichen, das verwendet wird, um Begriffe von ihrer Häufigkeit zu trennen. Dieser Schätzer arbeitet über den Textvektor.
- maximumNgramsCount
- Int32
Gibt zurück
Hinweise
WordBagEstimator unterscheidet sich darin NgramExtractingEstimator , dass ersterer Text intern tokenisiert und tokenisierten Text als Eingabe übernimmt.
Gilt für:
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Erstellen Sie einen WordBagEstimator, der die in inputColumnName
angegebene Spalte einem Vektor der n-Gramm-Anzahl in einer neuen Spalte mit dem Namen outputColumnName
zuordnet.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Parameter
- catalog
- TransformsCatalog.TextTransforms
Der Katalog der Transformation.
- outputColumnName
- String
Der Name der Spalte, die sich aus der Transformation von inputColumnName
ergibt.
Der Datentyp dieser Spalte ist der Vektor der bekannten Größe.Single
- inputColumnName
- String
Name der Spalte, aus der die Daten entnommen werden sollen. Dieser Schätzer arbeitet über den Textvektor.
- ngramLength
- Int32
Ngramlänge.
- skipLength
- Int32
Maximale Anzahl von Token, die beim Erstellen eines n-Gramms übersprungen werden sollen.
- useAllLengths
- Boolean
Gibt an, ob alle n-Gramm-Längen bis oder ngramLength
nur ngramLength
eingeschlossen werden sollen.
- maximumNgramsCount
- Int32
Maximale Anzahl von n-Grammen, die im Wörterbuch gespeichert werden sollen.
Statistisches Maß, mit dem ausgewertet wird, wie wichtig ein Wort für ein Dokument in einem Korpus ist.
Gibt zurück
Hinweise
WordBagEstimator unterscheidet sich darin NgramExtractingEstimator , dass ersterer Text intern tokenisiert und tokenisierten Text als Eingabe übernimmt.
Gilt für:
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Erstellen Sie ein WordBagEstimator, das die in angegebenen inputColumnNames
mehrere Spalten einem Vektor von n-Gramm-Zahlen in einer neuen Spalte mit dem Namen outputColumnName
zuordnet.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Parameter
- catalog
- TransformsCatalog.TextTransforms
Der Katalog der Transformation.
- outputColumnName
- String
Der Name der Spalte, die sich aus der Transformation von inputColumnNames
ergibt.
Der Datentyp dieser Spalte ist der Vektor der bekannten Größe.Single
- inputColumnNames
- String[]
Namen der mehrere Spalten, aus der die Daten entnommen werden sollen. Dieser Schätzer arbeitet über den Textvektor.
- ngramLength
- Int32
Ngramlänge.
- skipLength
- Int32
Maximale Anzahl von Token, die beim Erstellen eines n-Gramms übersprungen werden sollen.
- useAllLengths
- Boolean
Gibt an, ob alle n-Gramm-Längen bis oder ngramLength
nur ngramLength
eingeschlossen werden sollen.
- maximumNgramsCount
- Int32
Maximale Anzahl von n-Grammen, die im Wörterbuch gespeichert werden sollen.
Statistisches Maß, mit dem ausgewertet wird, wie wichtig ein Wort für ein Dokument in einem Korpus ist.
Gibt zurück
Hinweise
WordBagEstimator unterscheidet sich darin NgramExtractingEstimator , dass ersterer Text intern tokenisiert und tokenisierten Text als Eingabe übernimmt.