TextCatalog.ProduceWordBags Método
Definición
Importante
Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.
Sobrecargas
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32) |
Cree un WordBagEstimatorobjeto , que asigna la columna especificada en |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Cree un WordBagEstimatorobjeto , que asigna la columna especificada en |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Cree un WordBagEstimatorobjeto , que asigna las varias columnas especificadas en |
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)
Cree un WordBagEstimatorobjeto , que asigna la columna especificada en inputColumnName
a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator
Parámetros
- catalog
- TransformsCatalog.TextTransforms
Catálogo de la transformación.
- outputColumnName
- String
Nombre de la columna resultante de la transformación de inputColumnName
.
El tipo de datos de esta columna será un vector de tamaño conocido de Single.
- termSeparator
- Char
- freqSeparator
- Char
- inputColumnName
- String
Nombre de la columna de la que se van a tomar los datos. Número máximo de n-gramas que se almacenarán en el diccionario.Separador utilizado para separar los pares de términos y frecuencias.Separador usado para separar los términos de su frecuencia. Este estimador funciona sobre el vector de texto.
- maximumNgramsCount
- Int32
Devoluciones
Comentarios
WordBagEstimator es diferente de NgramExtractingEstimator en que el anterior tokeniza el texto internamente y el último toma texto tokenizado como entrada.
Se aplica a
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Cree un WordBagEstimatorobjeto , que asigna la columna especificada en inputColumnName
a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Parámetros
- catalog
- TransformsCatalog.TextTransforms
Catálogo de la transformación.
- outputColumnName
- String
Nombre de la columna resultante de la transformación de inputColumnName
.
El tipo de datos de esta columna será un vector de tamaño conocido de Single.
- inputColumnName
- String
Nombre de la columna de la que se van a tomar los datos. Este estimador funciona sobre el vector de texto.
- ngramLength
- Int32
Longitud del ngrama.
- skipLength
- Int32
Número máximo de tokens que se omitirán al construir un n-grama.
- useAllLengths
- Boolean
Si se deben incluir todas las longitudes de n-gramas hasta ngramLength
o solo ngramLength
.
- maximumNgramsCount
- Int32
Número máximo de n-gramas que se almacenarán en el diccionario.
Medida estadística utilizada para evaluar lo importante que una palabra es para un documento en un corpus.
Devoluciones
Comentarios
WordBagEstimator es diferente de NgramExtractingEstimator en que el anterior tokeniza el texto internamente y el último toma texto tokenizado como entrada.
Se aplica a
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)
Cree un WordBagEstimatorobjeto , que asigna las varias columnas especificadas en inputColumnNames
a un vector de recuentos de n-gramas en una nueva columna denominada outputColumnName
.
public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator
Parámetros
- catalog
- TransformsCatalog.TextTransforms
Catálogo de la transformación.
- outputColumnName
- String
Nombre de la columna resultante de la transformación de inputColumnNames
.
El tipo de datos de esta columna será un vector de tamaño conocido de Single.
- inputColumnNames
- String[]
Nombres de las varias columnas de las que se van a tomar los datos. Este estimador funciona sobre el vector de texto.
- ngramLength
- Int32
Longitud del ngrama.
- skipLength
- Int32
Número máximo de tokens que se omitirán al construir un n-grama.
- useAllLengths
- Boolean
Si se deben incluir todas las longitudes de n-gramas hasta ngramLength
o solo ngramLength
.
- maximumNgramsCount
- Int32
Número máximo de n-gramas que se almacenarán en el diccionario.
Medida estadística utilizada para evaluar lo importante que una palabra es para un documento en un corpus.
Devoluciones
Comentarios
WordBagEstimator es diferente de NgramExtractingEstimator en que el anterior tokeniza el texto internamente y el último toma texto tokenizado como entrada.