Поделиться через


NgramExtractingEstimator Класс

Определение

Создает вектор количества n-граммов (последовательностей последовательных слов), встречающихся во входном тексте.

public sealed class NgramExtractingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.Text.NgramExtractingTransformer>
type NgramExtractingEstimator = class
    interface IEstimator<NgramExtractingTransformer>
Public NotInheritable Class NgramExtractingEstimator
Implements IEstimator(Of NgramExtractingTransformer)
Наследование
NgramExtractingEstimator
Реализации

Комментарии

Характеристики оценщика

Должен ли этот оценщик просмотреть данные для обучения его параметров? Да
Тип данных входного столбца Вектор типа ключа .
Тип данных выходного столбца Известный вектор размера Single
Экспортируемый в ONNX Да

В результате NgramExtractingTransformer создается новый столбец с именем, указанным в параметрах имени выходного столбца, где каждый входной вектор сопоставляется с вектором счетчиков n-граммов (последовательности последовательных слов), встречающихся во входном тексте.

Оценщик создает словарь n-граммов и NgramExtractingTransformer использует идентификатор в словаре в качестве индекса в векторе счетчика, который он создает.

Ссылки на примеры использования см. в разделе "См. также".

Методы

Fit(IDataView)

Тренирует и возвращает .NgramExtractingTransformer

GetOutputSchema(SchemaShape)

Возвращает схему SchemaShape , которая будет производиться преобразователем. Используется для распространения и проверки схемы в конвейере.

Методы расширения

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Добавьте "контрольную точку кэширования" в цепочку оценщика. Это гарантирует, что подчиненные оценщики будут обучены на основе кэшированных данных. Рекомендуется использовать контрольную точку кэширования перед обучением, которые принимают несколько данных.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Учитывая оценщик, верните объект-оболочку, который будет вызывать делегат один раз Fit(IDataView) . Часто важно, чтобы оценщик возвращал сведения о том, что было положено, поэтому Fit(IDataView) метод возвращает специально типизированный объект, а не просто общий ITransformer. Однако в то же время часто IEstimator<TTransformer> формируются в конвейеры со многими объектами, поэтому нам может потребоваться создать цепочку оценщиков, где EstimatorChain<TLastTransformer> оценщик, для которого мы хотим получить преобразователь, похоронен где-то в этой цепочке. В этом сценарии мы можем подключить делегат, который будет вызываться после вызова соответствия.

Применяется к

См. также раздел