TransformsCatalog.TextTransforms Класс

Ссылка

Определение

Пространство имен:: Microsoft.ML

Сборка:: Microsoft.ML.Data.dll

Пакет:: Microsoft.ML v3.0.1

Пакет:: Microsoft.ML v1.0.0

Пакет:: Microsoft.ML v1.1.0

Пакет:: Microsoft.ML v1.2.0

Пакет:: Microsoft.ML v1.3.1

Пакет:: Microsoft.ML v1.4.0

Пакет:: Microsoft.ML v1.5.5

Пакет:: Microsoft.ML v1.6.0

Пакет:: Microsoft.ML v1.7.0

Пакет:: Microsoft.ML v2.0.0

Важно!

Некоторые сведения относятся к предварительной версии продукта, в которую до выпуска могут быть внесены существенные изменения. Майкрософт не предоставляет никаких гарантий, явных или подразумеваемых, относительно приведенных здесь сведений.

Класс, используемый для MLContext создания экземпляров компонентов преобразования текстовых данных.

public sealed class TransformsCatalog.TextTransforms

type TransformsCatalog.TextTransforms = class

Public NotInheritable Class TransformsCatalog.TextTransforms

Наследование: Object
TransformsCatalog.TextTransforms

Методы расширения

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)	Создайте WordEmbeddingEstimator, который является текстовым конструированием признаков, который преобразует вектор текста в числовой вектор с помощью предварительно обученных моделей внедрения.
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)	Создайте WordEmbeddingEstimator, который является текстовым конструктором признаков, который преобразует векторы текста в числовые векторы с помощью предварительно обученных моделей внедрения.
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])	Создайте TextFeaturizingEstimatorобъект , который преобразует текстовый столбец в вектор с признаками Single , представляющий нормализованные счетчики n-граммов и символов.
FeaturizeText(TransformsCatalog+TextTransforms, String, String)	Создайте TextFeaturizingEstimatorобъект , который преобразует текстовый столбец в вектор с признаками Single , представляющий нормализованное количество n-граммов и символов.
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)	Создайте LatentDirichletAllocationEstimatorобъект , который использует LightLDA для преобразования текста (представленного в виде вектора с плавающей запятой) в вектор Single , указывающий на сходство текста с каждым определенным разделом.
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)	Создает TextNormalizingEstimator, который нормализует входящий текст в `inputColumnName` , при необходимости изменяя регистр, удаляя диакритические знаки, знаки препинания, числа, и выводит новый текст в виде `outputColumnName`.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Создайте NgramHashingEstimatorобъект , который копирует данные из столбца, указанного в , в `inputColumnName` новый столбец: `outputColumnName` и создает вектор количества хэшированных n-граммов.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Создайте NgramHashingEstimatorобъект , который принимает данные из нескольких столбцов, указанных в , в `inputColumnNames` новый столбец: `outputColumnName` и создает вектор количества хэшированных n-граммов.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Создайте WordHashBagEstimatorобъект , который сопоставляет столбец, указанный в , `inputColumnName` с вектором количества хэшированных n-граммов в новом столбце с именем `outputColumnName`.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Создайте WordHashBagEstimatorобъект , который сопоставляет несколько столбцов, указанных в , `inputColumnNames` с вектором количества хэшированных n-граммов в новом столбце с именем `outputColumnName`.
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Создает объект , NgramExtractingEstimator который создает вектор количества n-граммов (последовательностей последовательных слов), встречающихся во входном тексте.
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)	Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , `inputColumnName` с вектором n-граммов в новом столбце с именем `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Создайте WordBagEstimatorобъект , который сопоставляет столбец, указанный в , `inputColumnName` с вектором n-граммов в новом столбце с именем `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Создайте WordBagEstimatorобъект , который сопоставляет несколько столбцов, указанных в , `inputColumnNames` с вектором n-граммов в новом столбце с именем `outputColumnName`.
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)	Создайте CustomStopWordsRemovingEstimatorобъект , который копирует данные из столбца, указанного в , в `inputColumnName` новый столбец: `outputColumnName` и удаляет из него предопределенный набор текста, характерный для `language` .
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])	Создайте CustomStopWordsRemovingEstimatorобъект , который копирует данные из столбца, указанного в , в `inputColumnName` новый столбец: `outputColumnName` и удаляет из него текст, указанный в `stopwords` .
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)	Создайте TokenizingByCharactersEstimator, который помещает путем разделения текста на последовательности символов с помощью скользящего окна.
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])	Создайте WordTokenizingEstimatorобъект , который помещает входной текст, используя в `separators` качестве разделителей.

Применяется к

Поделиться через

TransformsCatalog.TextTransforms Класс

Определение

Методы расширения

Применяется к

Обратная связь

Дополнительные ресурсы