Поделиться через


TransformsCatalog.TextTransforms Класс

Определение

Класс, используемый для MLContext создания экземпляров компонентов преобразования текстовых данных.

public sealed class TransformsCatalog.TextTransforms
type TransformsCatalog.TextTransforms = class
Public NotInheritable Class TransformsCatalog.TextTransforms
Наследование
TransformsCatalog.TextTransforms

Методы расширения

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

Создайте WordEmbeddingEstimator, который является текстовым конструированием признаков, который преобразует вектор текста в числовой вектор с помощью предварительно обученных моделей внедрения.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

Создайте WordEmbeddingEstimator, который является текстовым конструктором признаков, который преобразует векторы текста в числовые векторы с помощью предварительно обученных моделей внедрения.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Создайте TextFeaturizingEstimatorобъект , который преобразует текстовый столбец в вектор с признаками Single , представляющий нормализованные счетчики n-граммов и символов.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Создайте TextFeaturizingEstimatorобъект , который преобразует текстовый столбец в вектор с признаками Single , представляющий нормализованное количество n-граммов и символов.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

Создайте LatentDirichletAllocationEstimatorобъект , который использует LightLDA для преобразования текста (представленного в виде вектора с плавающей запятой) в вектор Single , указывающий на сходство текста с каждым определенным разделом.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

Создает TextNormalizingEstimator, который нормализует входящий текст в inputColumnName , при необходимости изменяя регистр, удаляя диакритические знаки, знаки препинания, числа, и выводит новый текст в виде outputColumnName.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Создайте NgramHashingEstimatorобъект , который копирует данные из столбца, указанного в , в inputColumnName новый столбец: outputColumnName и создает вектор количества хэшированных n-граммов.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Создайте NgramHashingEstimatorобъект , который принимает данные из нескольких столбцов, указанных в , в inputColumnNames новый столбец: outputColumnName и создает вектор количества хэшированных n-граммов.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Создайте WordHashBagEstimatorобъект , который сопоставляет столбец, указанный в , inputColumnName с вектором количества хэшированных n-граммов в новом столбце с именем outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Создайте WordHashBagEstimatorобъект , который сопоставляет несколько столбцов, указанных в , inputColumnNames с вектором количества хэшированных n-граммов в новом столбце с именем outputColumnName.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Создает объект , NgramExtractingEstimator который создает вектор количества n-граммов (последовательностей последовательных слов), встречающихся во входном тексте.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , inputColumnName с вектором n-граммов в новом столбце с именем outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , inputColumnName с вектором n-граммов в новом столбце с именем outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Создайте WordBagEstimatorобъект , который сопоставляет несколько столбцов, указанных в , inputColumnNames с вектором n-граммов в новом столбце с именем outputColumnName.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

Создайте CustomStopWordsRemovingEstimatorобъект , который копирует данные из столбца, указанного в , в inputColumnName новый столбец: outputColumnName и удаляет из него предопределенный набор текста, характерный для language .

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

Создайте CustomStopWordsRemovingEstimatorобъект , который копирует данные из столбца, указанного в , в inputColumnName новый столбец: outputColumnName и удаляет из него текст, указанный в stopwords .

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Создайте TokenizingByCharactersEstimator, который помещает путем разделения текста на последовательности символов с помощью скользящего окна.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Создайте WordTokenizingEstimatorобъект , который помещает входной текст, используя в separators качестве разделителей.

Применяется к