Share via


TextCatalog.ProduceWordBags Méthode

Définition

Surcharges

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Créez un WordBagEstimator, qui mappe la colonne spécifiée dans inputColumnName à un vecteur de nombres de n grammes dans une nouvelle colonne nommée outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Créez un WordBagEstimator, qui mappe la colonne spécifiée dans inputColumnName à un vecteur de nombres de n grammes dans une nouvelle colonne nommée outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Créez un WordBagEstimator, qui mappe les plusieurs colonnes spécifiées dans à inputColumnNames un vecteur de nombres de n grammes dans une nouvelle colonne nommée outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Créez un WordBagEstimator, qui mappe la colonne spécifiée dans inputColumnName à un vecteur de nombres de n grammes dans une nouvelle colonne nommée outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator

Paramètres

catalog
TransformsCatalog.TextTransforms

Catalogue de la transformation.

outputColumnName
String

Nom de la colonne résultant de la transformation de inputColumnName. Le type de données de cette colonne sera le vecteur de taille connue de Single.

termSeparator
Char
freqSeparator
Char
inputColumnName
String

Nom de la colonne à partir de laquelle prendre les données. Nombre maximal de n grammes à stocker dans le dictionnaire.Séparateur utilisé pour séparer les paires termes/fréquences.Séparateur utilisé pour séparer les termes de leur fréquence. Cet estimateur fonctionne sur un vecteur de texte.

maximumNgramsCount
Int32

Retours

Remarques

WordBagEstimator est différent de NgramExtractingEstimator par le fait que le premier tokenize le texte en interne et que le second prend du texte tokenisé comme entrée.

S’applique à

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Créez un WordBagEstimator, qui mappe la colonne spécifiée dans inputColumnName à un vecteur de nombres de n grammes dans une nouvelle colonne nommée outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Paramètres

catalog
TransformsCatalog.TextTransforms

Catalogue de la transformation.

outputColumnName
String

Nom de la colonne résultant de la transformation de inputColumnName. Le type de données de cette colonne sera le vecteur de taille connue de Single.

inputColumnName
String

Nom de la colonne à partir de laquelle prendre les données. Cet estimateur fonctionne sur un vecteur de texte.

ngramLength
Int32

Longueur du Ngramme.

skipLength
Int32

Nombre maximal de jetons à ignorer lors de la construction d’un n-gramme.

useAllLengths
Boolean

Indique s’il faut inclure toutes les longueurs de n grammes jusqu’à ngramLength ou uniquement ngramLength.

maximumNgramsCount
Int32

Nombre maximal de n grammes à stocker dans le dictionnaire.

weighting
NgramExtractingEstimator.WeightingCriteria

Mesure statistique utilisée pour évaluer l’importance d’un mot pour un document dans un corpus.

Retours

Remarques

WordBagEstimator est différent de NgramExtractingEstimator par le fait que le premier tokenize le texte en interne et que le second prend du texte tokenisé comme entrée.

S’applique à

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Créez un WordBagEstimator, qui mappe les plusieurs colonnes spécifiées dans à inputColumnNames un vecteur de nombres de n grammes dans une nouvelle colonne nommée outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Paramètres

catalog
TransformsCatalog.TextTransforms

Catalogue de la transformation.

outputColumnName
String

Nom de la colonne résultant de la transformation de inputColumnNames. Le type de données de cette colonne sera le vecteur de taille connue de Single.

inputColumnNames
String[]

Noms des plusieurs colonnes à partir de laquelle extraire les données. Cet estimateur fonctionne sur un vecteur de texte.

ngramLength
Int32

Longueur du Ngramme.

skipLength
Int32

Nombre maximal de jetons à ignorer lors de la construction d’un n-gramme.

useAllLengths
Boolean

Indique s’il faut inclure toutes les longueurs de n grammes jusqu’à ngramLength ou uniquement ngramLength.

maximumNgramsCount
Int32

Nombre maximal de n grammes à stocker dans le dictionnaire.

weighting
NgramExtractingEstimator.WeightingCriteria

Mesure statistique utilisée pour évaluer l’importance d’un mot pour un document dans un corpus.

Retours

Remarques

WordBagEstimator est différent de NgramExtractingEstimator par le fait que le premier tokenize le texte en interne et que le second prend du texte tokenisé comme entrée.

S’applique à