Share via


TextCatalog Classe

Definição

Coleção de métodos de extensão para o TransformsCatalog.

public static class TextCatalog
type TextCatalog = class
Public Module TextCatalog
Herança
TextCatalog

Métodos

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

Crie um WordEmbeddingEstimator, que é um featurizer de texto que converte vetores de texto em vetores numéricos usando modelos de inserções pré-treinados.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

Crie um WordEmbeddingEstimator, que é um featurizer de texto que converte um vetor de texto em um vetor numérico usando modelos de inserções pré-treinados.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Crie um TextFeaturizingEstimator, que transforma uma coluna de texto em um vetor em destaque de Single que representa contagens normalizadas de n-gramas e char-grams.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Crie um TextFeaturizingEstimator, que transforma uma coluna de texto em um vetor em destaque do Single que representa contagens normalizadas de n-grams e char-grams.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

Crie um LatentDirichletAllocationEstimator, que usa LightLDA para transformar texto (representado como um vetor de floats) em um vetor de Single indicando a similaridade do texto com cada tópico identificado.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

Cria um TextNormalizingEstimator, que normaliza o texto de entrada em inputColumnName , opcionalmente, alterando maiúsculas e minúsculas, removendo marcas diacríticas, marcas de pontuação, números e saídas de novo texto como outputColumnName.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Crie um NgramHashingEstimator, que copia os dados da coluna especificada em para inputColumnName uma nova coluna: outputColumnName e produz um vetor de contagens de n-grams com hash.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Crie um NgramHashingEstimator, que leva os dados das várias colunas especificadas em inputColumnNames para uma nova coluna: outputColumnName e produz um vetor de contagens de n-gramas com hash.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Crie um WordHashBagEstimator, que mapeia a coluna especificada em para inputColumnName um vetor de contagens de n-grams com hash em uma nova coluna chamada outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Crie um WordHashBagEstimator, que mapeia as várias colunas especificadas em inputColumnNames para um vetor de contagens de n-grams com hash em uma nova coluna chamada outputColumnName.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Cria um NgramExtractingEstimator que produz um vetor de contagens de n-gramas (sequências de palavras consecutivas) encontradas no texto de entrada.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Crie um WordBagEstimator, que mapeia a coluna especificada em inputColumnName para um vetor de contagens de n-grama em uma nova coluna chamada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Crie um WordBagEstimator, que mapeia a coluna especificada em inputColumnName para um vetor de contagens de n-grama em uma nova coluna chamada outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Crie um WordBagEstimator, que mapeia as várias colunas especificadas em inputColumnNames para um vetor de contagens de n-grama em uma nova coluna chamada outputColumnName.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

Crie um CustomStopWordsRemovingEstimator, que copia os dados da coluna especificada em para inputColumnName uma nova coluna: outputColumnName e remove o conjunto predicado de texto específico para language ele.

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

Crie um CustomStopWordsRemovingEstimator, que copia os dados da coluna especificada em para inputColumnName uma nova coluna: outputColumnName e remove o texto especificado nela stopwords .

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Crie um TokenizingByCharactersEstimator, que é tokenizado dividindo o texto em sequências de caracteres usando uma janela deslizante.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Crie um WordTokenizingEstimator, que tokeniza o texto de entrada usando separators como separadores.

Aplica-se a