TextCatalog.ProduceWordBags Método
Definição
Importante
Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.
Sobrecargas
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32) |
Crie um WordBagEstimator, que mapeia a coluna especificada em |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Crie um WordBagEstimator, que mapeia a coluna especificada em |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Crie um WordBagEstimator, que mapeia as várias colunas especificadas em |
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)
Crie um WordBagEstimator, que mapeia a coluna especificada em inputColumnName
para um vetor de contagens de n-gramas em uma nova coluna chamada outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator
Parâmetros
- catalog
- TransformsCatalog.TextTransforms
O catálogo da transformação.
- outputColumnName
- String
Nome da coluna resultante da transformação de inputColumnName
.
O tipo de dados dessa coluna será um vetor de tamanho conhecido de Single.
- termSeparator
- Char
- freqSeparator
- Char
- inputColumnName
- String
Nome da coluna da qual os dados serão extraídos. Número máximo de n-gramas a serem armazenados no dicionário.Separador usado para separar pares de termos/frequência.Separador usado para separar os termos de sua frequência. Esse avaliador opera sobre o vetor de texto.
- maximumNgramsCount
- Int32
Retornos
Comentários
WordBagEstimator é diferente de NgramExtractingEstimator em que o primeiro gera tokens de texto internamente e o último usa o texto com token como entrada.
Aplica-se a
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Crie um WordBagEstimator, que mapeia a coluna especificada em inputColumnName
para um vetor de contagens de n-gramas em uma nova coluna chamada outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Parâmetros
- catalog
- TransformsCatalog.TextTransforms
O catálogo da transformação.
- outputColumnName
- String
Nome da coluna resultante da transformação de inputColumnName
.
O tipo de dados dessa coluna será um vetor de tamanho conhecido de Single.
- inputColumnName
- String
Nome da coluna da qual os dados serão extraídos. Esse avaliador opera sobre o vetor de texto.
- ngramLength
- Int32
Comprimento de Ngram.
- skipLength
- Int32
Número máximo de tokens a serem ignoradas ao construir um n-gram.
- useAllLengths
- Boolean
Se deve incluir todos os comprimentos de n-grama até ngramLength
ou apenas ngramLength
.
- maximumNgramsCount
- Int32
Número máximo de n-gramas a serem armazenados no dicionário.
Medida estatística usada para avaliar a importância de uma palavra para um documento em um corpus.
Retornos
Comentários
WordBagEstimator é diferente de NgramExtractingEstimator em que o primeiro gera tokens de texto internamente e o último usa o texto com token como entrada.
Aplica-se a
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Crie um WordBagEstimator, que mapeia as várias colunas especificadas em inputColumnNames
para um vetor de contagens de n-gramas em uma nova coluna chamada outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Parâmetros
- catalog
- TransformsCatalog.TextTransforms
O catálogo da transformação.
- outputColumnName
- String
Nome da coluna resultante da transformação de inputColumnNames
.
O tipo de dados dessa coluna será um vetor de tamanho conhecido de Single.
- inputColumnNames
- String[]
Nomes das várias colunas das qual os dados serão extraídos. Esse avaliador opera sobre o vetor de texto.
- ngramLength
- Int32
Comprimento de Ngram.
- skipLength
- Int32
Número máximo de tokens a serem ignoradas ao construir um n-gram.
- useAllLengths
- Boolean
Se deve incluir todos os comprimentos de n-grama até ngramLength
ou apenas ngramLength
.
- maximumNgramsCount
- Int32
Número máximo de n-gramas a serem armazenados no dicionário.
Medida estatística usada para avaliar a importância de uma palavra para um documento em um corpus.
Retornos
Comentários
WordBagEstimator é diferente de NgramExtractingEstimator em que o primeiro gera tokens de texto internamente e o último usa o texto com token como entrada.