TransformsCatalog.TextTransforms Classe

Referência

Definição

Namespace:: Microsoft.ML

Assembly:: Microsoft.ML.Data.dll

Pacote:: Microsoft.ML v4.0.1

Pacote:: Microsoft.ML v1.0.0

Pacote:: Microsoft.ML v1.1.0

Pacote:: Microsoft.ML v1.2.0

Pacote:: Microsoft.ML v1.3.1

Pacote:: Microsoft.ML v1.4.0

Pacote:: Microsoft.ML v1.5.5

Pacote:: Microsoft.ML v1.6.0

Pacote:: Microsoft.ML v1.7.0

Pacote:: Microsoft.ML v2.0.1

Pacote:: Microsoft.ML v3.0.1

Pacote:: Microsoft.ML v5.0.0-preview.1.25125.4

Origem:: TransformsCatalog.cs

Origem:: TransformsCatalog.cs

Origem:: TransformsCatalog.cs

Importante

Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.

Classe usada por MLContext para criar instâncias de componentes de transformação de dados de texto.

public sealed class TransformsCatalog.TextTransforms

type TransformsCatalog.TextTransforms = class

Public NotInheritable Class TransformsCatalog.TextTransforms

Herança: Object
TransformsCatalog.TextTransforms

Métodos de Extensão

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)	Crie um WordEmbeddingEstimator, que é um featurizer de texto que converte um vetor de texto em um vetor numérico usando modelos de inserções pré-treinados.
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)	Crie um WordEmbeddingEstimator, que é um featurizer de texto que converte vetores de texto em vetores numéricos usando modelos de inserções pré-treinados.
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])	Crie um TextFeaturizingEstimator, que transforma uma coluna de texto em um vetor em destaque de Single que representa contagens normalizadas de n-gramas e char-grams.
FeaturizeText(TransformsCatalog+TextTransforms, String, String)	Crie um TextFeaturizingEstimator, que transforma uma coluna de texto em um vetor em destaque de Single que representa contagens normalizadas de n-gramas e char-grams.
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)	Crie um LatentDirichletAllocationEstimator, que usa LightLDA para transformar texto (representado como um vetor de floats) em um vetor de Single indicando a similaridade do texto com cada tópico identificado.
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)	Cria um TextNormalizingEstimator, que normaliza o texto de entrada em `inputColumnName` , opcionalmente, alterando maiúsculas e minúsculas, removendo marcas diacríticas, marcas de pontuação, números e gera um novo texto como `outputColumnName`.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Crie um NgramHashingEstimator, que copia os dados da coluna especificada em `inputColumnName` para uma nova coluna: `outputColumnName` e produz um vetor de contagens de n-gramas com hash.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Crie um NgramHashingEstimator, que leva os dados das várias colunas especificadas em `inputColumnNames` para uma nova coluna: `outputColumnName` e produz um vetor de contagens de n-gramas com hash.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Crie um WordHashBagEstimator, que mapeia a coluna especificada em `inputColumnName` para um vetor de contagens de n-grams com hash em uma nova coluna chamada `outputColumnName`.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Crie um WordHashBagEstimator, que mapeia as várias colunas especificadas em `inputColumnNames` para um vetor de contagens de n-gramas com hash em uma nova coluna chamada `outputColumnName`.
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Cria um NgramExtractingEstimator que produz um vetor de contagens de n-gramas (sequências de palavras consecutivas) encontradas no texto de entrada.
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)	Crie um WordBagEstimator, que mapeia a coluna especificada em `inputColumnName` para um vetor de contagens de n-gramas em uma nova coluna chamada `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Crie um WordBagEstimator, que mapeia a coluna especificada em `inputColumnName` para um vetor de contagens de n-gramas em uma nova coluna chamada `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Crie um WordBagEstimator, que mapeia as várias colunas especificadas em `inputColumnNames` para um vetor de contagens de n-gramas em uma nova coluna chamada `outputColumnName`.
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)	Crie um CustomStopWordsRemovingEstimator, que copia os dados da coluna especificada em `inputColumnName` para uma nova coluna: `outputColumnName` e remove um conjunto predicado de texto específico para `language` ele.
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])	Crie um CustomStopWordsRemovingEstimator, que copia os dados da coluna especificada em `inputColumnName` para uma nova coluna: `outputColumnName` e remove o texto especificado nele `stopwords` .
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)	Crie um TokenizingByCharactersEstimator, que gera tokens dividindo o texto em sequências de caracteres usando uma janela deslizante.
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])	Crie um WordTokenizingEstimator, que gera tokens de texto de entrada usando `separators` como separadores.

Aplica-se a