TextCatalog Classe

Referência

Definição

Namespace:: Microsoft.ML

Assembly:: Microsoft.ML.Transforms.dll

Pacote:: Microsoft.ML v3.0.1

Pacote:: Microsoft.ML v1.0.0

Pacote:: Microsoft.ML v1.1.0

Pacote:: Microsoft.ML v1.2.0

Pacote:: Microsoft.ML v1.3.1

Pacote:: Microsoft.ML v1.4.0

Pacote:: Microsoft.ML v1.5.5

Pacote:: Microsoft.ML v1.6.0

Pacote:: Microsoft.ML v1.7.0

Pacote:: Microsoft.ML v2.0.0

Importante

Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.

Coleção de métodos de extensão para o TransformsCatalog.

public static class TextCatalog

type TextCatalog = class

Public Module TextCatalog

Herança: Object
TextCatalog

Métodos

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)	Crie um WordEmbeddingEstimator, que é um featurizer de texto que converte vetores de texto em vetores numéricos usando modelos de inserções pré-treinados.
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)	Crie um WordEmbeddingEstimator, que é um featurizer de texto que converte um vetor de texto em um vetor numérico usando modelos de inserções pré-treinados.
FeaturizeText(TransformsCatalog+TextTransforms, String, String)	Crie um TextFeaturizingEstimator, que transforma uma coluna de texto em um vetor em destaque de Single que representa contagens normalizadas de n-gramas e char-grams.
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])	Crie um TextFeaturizingEstimator, que transforma uma coluna de texto em um vetor em destaque do Single que representa contagens normalizadas de n-grams e char-grams.
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)	Crie um LatentDirichletAllocationEstimator, que usa LightLDA para transformar texto (representado como um vetor de floats) em um vetor de Single indicando a similaridade do texto com cada tópico identificado.
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)	Cria um TextNormalizingEstimator, que normaliza o texto de entrada em `inputColumnName` , opcionalmente, alterando maiúsculas e minúsculas, removendo marcas diacríticas, marcas de pontuação, números e saídas de novo texto como `outputColumnName`.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Crie um NgramHashingEstimator, que copia os dados da coluna especificada em para `inputColumnName` uma nova coluna: `outputColumnName` e produz um vetor de contagens de n-grams com hash.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Crie um NgramHashingEstimator, que leva os dados das várias colunas especificadas em `inputColumnNames` para uma nova coluna: `outputColumnName` e produz um vetor de contagens de n-gramas com hash.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Crie um WordHashBagEstimator, que mapeia a coluna especificada em para `inputColumnName` um vetor de contagens de n-grams com hash em uma nova coluna chamada `outputColumnName`.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Crie um WordHashBagEstimator, que mapeia as várias colunas especificadas em `inputColumnNames` para um vetor de contagens de n-grams com hash em uma nova coluna chamada `outputColumnName`.
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Cria um NgramExtractingEstimator que produz um vetor de contagens de n-gramas (sequências de palavras consecutivas) encontradas no texto de entrada.
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)	Crie um WordBagEstimator, que mapeia a coluna especificada em `inputColumnName` para um vetor de contagens de n-grama em uma nova coluna chamada `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Crie um WordBagEstimator, que mapeia a coluna especificada em `inputColumnName` para um vetor de contagens de n-grama em uma nova coluna chamada `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Crie um WordBagEstimator, que mapeia as várias colunas especificadas em `inputColumnNames` para um vetor de contagens de n-grama em uma nova coluna chamada `outputColumnName`.
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)	Crie um CustomStopWordsRemovingEstimator, que copia os dados da coluna especificada em para `inputColumnName` uma nova coluna: `outputColumnName` e remove o conjunto predicado de texto específico para `language` ele.
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])	Crie um CustomStopWordsRemovingEstimator, que copia os dados da coluna especificada em para `inputColumnName` uma nova coluna: `outputColumnName` e remove o texto especificado nela `stopwords` .
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)	Crie um TokenizingByCharactersEstimator, que é tokenizado dividindo o texto em sequências de caracteres usando uma janela deslizante.
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])	Crie um WordTokenizingEstimator, que tokeniza o texto de entrada usando `separators` como separadores.

Aplica-se a

Compartilhar via

TextCatalog Classe

Definição

Métodos

Aplica-se a

Recursos adicionais