Поделиться через


WordEmbeddingEstimator Класс

Определение

Средство создания признаков текста, которое преобразует векторы текстовых маркеров в числовой вектор с помощью предварительно обученной модели внедрения.

public sealed class WordEmbeddingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.WordEmbeddingTransformer>
type WordEmbeddingEstimator = class
    interface IEstimator<WordEmbeddingTransformer>
Public NotInheritable Class WordEmbeddingEstimator
Implements IEstimator(Of WordEmbeddingTransformer)
Наследование
WordEmbeddingEstimator
Реализации

Комментарии

Характеристики оценщика

Должен ли этот оценщик просмотреть данные для обучения его параметров? Нет
Тип данных входного столбца Вектор текста
Тип данных выходного столбца Известный вектор размера Single
Экспортируемый в ONNX Нет

Создает WordEmbeddingTransformer новый столбец с именем, указанным в параметрах имени выходного столбца, где каждый входной вектор сопоставляется с числовым вектором размером 3 * размер используемой модели внедрения. Обратите внимание, что это не зависит от размера входного вектора.

Например, при использовании GloVe50D, который сам по себе имеет размер 50, выходной столбец является вектором размера 150. Первая треть слотов содержит минимальные значения в внедрениях, соответствующих каждой строке во входном векторе. Вторая треть содержит среднее значение внедрения. Последняя треть слотов содержит максимальные значения обнаруженного внедрения. Min/max предоставляет ограничивающий гипер-прямоугольник для слов в пространстве внедрения слов. Это может помочь в более длинных фразах, где среднее количество слов заглушает полезный сигнал.

Пользователь может указать пользовательскую предварительно обученную модель внедрения или одну из доступных предварительно обученных моделей. Доступны различные версии GloVe Models, FastText и SSWE.

Ссылки на примеры использования см. в разделе "См. также".

Методы

Fit(IDataView)

Тренирует и возвращает .WordEmbeddingTransformer

GetOutputSchema(SchemaShape)

Возвращает схему SchemaShape , которая будет производиться преобразователем. Используется для распространения и проверки схемы в конвейере.

Методы расширения

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Добавьте "контрольную точку кэширования" в цепочку оценщика. Это гарантирует, что подчиненные оценщики будут обучены на основе кэшированных данных. Рекомендуется использовать контрольную точку кэширования перед обучением, которые принимают несколько данных.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Учитывая оценщик, верните объект-оболочку, который будет вызывать делегат один раз Fit(IDataView) . Часто важно, чтобы оценщик возвращал сведения о том, что было положено, поэтому Fit(IDataView) метод возвращает специально типизированный объект, а не просто общий ITransformer. Однако в то же время часто IEstimator<TTransformer> формируются в конвейеры со многими объектами, поэтому нам может потребоваться создать цепочку оценщиков, где EstimatorChain<TLastTransformer> оценщик, для которого мы хотим получить преобразователь, похоронен где-то в этой цепочке. В этом сценарии мы можем подключить делегат, который будет вызываться после вызова соответствия.

Применяется к

См. также раздел