Compartilhar via


TextCatalog.ProduceWordBags Método

Definição

Sobrecargas

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Crie um WordBagEstimator, que mapeia a coluna especificada em inputColumnName para um vetor de contagens de n-gramas em uma nova coluna chamada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Crie um WordBagEstimator, que mapeia a coluna especificada em inputColumnName para um vetor de contagens de n-gramas em uma nova coluna chamada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Crie um WordBagEstimator, que mapeia as várias colunas especificadas em inputColumnNames para um vetor de contagens de n-gramas em uma nova coluna chamada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Crie um WordBagEstimator, que mapeia a coluna especificada em inputColumnName para um vetor de contagens de n-gramas em uma nova coluna chamada outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator

Parâmetros

catalog
TransformsCatalog.TextTransforms

O catálogo da transformação.

outputColumnName
String

Nome da coluna resultante da transformação de inputColumnName. O tipo de dados dessa coluna será um vetor de tamanho conhecido de Single.

termSeparator
Char
freqSeparator
Char
inputColumnName
String

Nome da coluna da qual os dados serão extraídos. Número máximo de n-gramas a serem armazenados no dicionário.Separador usado para separar pares de termos/frequência.Separador usado para separar os termos de sua frequência. Esse avaliador opera sobre o vetor de texto.

maximumNgramsCount
Int32

Retornos

Comentários

WordBagEstimator é diferente de NgramExtractingEstimator em que o primeiro gera tokens de texto internamente e o último usa o texto com token como entrada.

Aplica-se a

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Crie um WordBagEstimator, que mapeia a coluna especificada em inputColumnName para um vetor de contagens de n-gramas em uma nova coluna chamada outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Parâmetros

catalog
TransformsCatalog.TextTransforms

O catálogo da transformação.

outputColumnName
String

Nome da coluna resultante da transformação de inputColumnName. O tipo de dados dessa coluna será um vetor de tamanho conhecido de Single.

inputColumnName
String

Nome da coluna da qual os dados serão extraídos. Esse avaliador opera sobre o vetor de texto.

ngramLength
Int32

Comprimento de Ngram.

skipLength
Int32

Número máximo de tokens a serem ignoradas ao construir um n-gram.

useAllLengths
Boolean

Se deve incluir todos os comprimentos de n-grama até ngramLength ou apenas ngramLength.

maximumNgramsCount
Int32

Número máximo de n-gramas a serem armazenados no dicionário.

weighting
NgramExtractingEstimator.WeightingCriteria

Medida estatística usada para avaliar a importância de uma palavra para um documento em um corpus.

Retornos

Comentários

WordBagEstimator é diferente de NgramExtractingEstimator em que o primeiro gera tokens de texto internamente e o último usa o texto com token como entrada.

Aplica-se a

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Crie um WordBagEstimator, que mapeia as várias colunas especificadas em inputColumnNames para um vetor de contagens de n-gramas em uma nova coluna chamada outputColumnName.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

Parâmetros

catalog
TransformsCatalog.TextTransforms

O catálogo da transformação.

outputColumnName
String

Nome da coluna resultante da transformação de inputColumnNames. O tipo de dados dessa coluna será um vetor de tamanho conhecido de Single.

inputColumnNames
String[]

Nomes das várias colunas das qual os dados serão extraídos. Esse avaliador opera sobre o vetor de texto.

ngramLength
Int32

Comprimento de Ngram.

skipLength
Int32

Número máximo de tokens a serem ignoradas ao construir um n-gram.

useAllLengths
Boolean

Se deve incluir todos os comprimentos de n-grama até ngramLength ou apenas ngramLength.

maximumNgramsCount
Int32

Número máximo de n-gramas a serem armazenados no dicionário.

weighting
NgramExtractingEstimator.WeightingCriteria

Medida estatística usada para avaliar a importância de uma palavra para um documento em um corpus.

Retornos

Comentários

WordBagEstimator é diferente de NgramExtractingEstimator em que o primeiro gera tokens de texto internamente e o último usa o texto com token como entrada.

Aplica-se a