WordEmbeddingEstimator Класс
Определение
Важно!
Некоторые сведения относятся к предварительной версии продукта, в которую до выпуска могут быть внесены существенные изменения. Майкрософт не предоставляет никаких гарантий, явных или подразумеваемых, относительно приведенных здесь сведений.
Средство создания признаков текста, которое преобразует векторы текстовых маркеров в числовой вектор с помощью предварительно обученной модели внедрения.
public sealed class WordEmbeddingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.WordEmbeddingTransformer>
type WordEmbeddingEstimator = class
interface IEstimator<WordEmbeddingTransformer>
Public NotInheritable Class WordEmbeddingEstimator
Implements IEstimator(Of WordEmbeddingTransformer)
- Наследование
-
WordEmbeddingEstimator
- Реализации
Комментарии
Характеристики оценщика
Должен ли этот оценщик просмотреть данные для обучения его параметров? | Нет |
Тип данных входного столбца | Вектор текста |
Тип данных выходного столбца | Известный вектор размера Single |
Экспортируемый в ONNX | Нет |
Создает WordEmbeddingTransformer новый столбец с именем, указанным в параметрах имени выходного столбца, где каждый входной вектор сопоставляется с числовым вектором размером 3 * размер используемой модели внедрения. Обратите внимание, что это не зависит от размера входного вектора.
Например, при использовании GloVe50D, который сам по себе имеет размер 50, выходной столбец является вектором размера 150. Первая треть слотов содержит минимальные значения в внедрениях, соответствующих каждой строке во входном векторе. Вторая треть содержит среднее значение внедрения. Последняя треть слотов содержит максимальные значения обнаруженного внедрения. Min/max предоставляет ограничивающий гипер-прямоугольник для слов в пространстве внедрения слов. Это может помочь в более длинных фразах, где среднее количество слов заглушает полезный сигнал.
Пользователь может указать пользовательскую предварительно обученную модель внедрения или одну из доступных предварительно обученных моделей. Доступны различные версии GloVe Models, FastText и SSWE.
Ссылки на примеры использования см. в разделе "См. также".
Методы
Fit(IDataView) |
Тренирует и возвращает .WordEmbeddingTransformer |
GetOutputSchema(SchemaShape) |
Возвращает схему SchemaShape , которая будет производиться преобразователем. Используется для распространения и проверки схемы в конвейере. |
Методы расширения
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Добавьте "контрольную точку кэширования" в цепочку оценщика. Это гарантирует, что подчиненные оценщики будут обучены на основе кэшированных данных. Рекомендуется использовать контрольную точку кэширования перед обучением, которые принимают несколько данных. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Учитывая оценщик, верните объект-оболочку, который будет вызывать делегат один раз Fit(IDataView) . Часто важно, чтобы оценщик возвращал сведения о том, что было положено, поэтому Fit(IDataView) метод возвращает специально типизированный объект, а не просто общий ITransformer. Однако в то же время часто IEstimator<TTransformer> формируются в конвейеры со многими объектами, поэтому нам может потребоваться создать цепочку оценщиков, где EstimatorChain<TLastTransformer> оценщик, для которого мы хотим получить преобразователь, похоронен где-то в этой цепочке. В этом сценарии мы можем подключить делегат, который будет вызываться после вызова соответствия. |