Поделиться через


CountFeatureSelectingEstimator Класс

Определение

Выбирает слоты, для которых число значений не по умолчанию не меньше порогового значения.

public sealed class CountFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type CountFeatureSelectingEstimator = class
    interface IEstimator<ITransformer>
Public NotInheritable Class CountFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
Наследование
CountFeatureSelectingEstimator
Реализации

Комментарии

Характеристики оценщика

Нужно ли этому оценщику просмотреть данные для обучения параметров? Да
Тип данных входного столбца Векторные или скалярные типы данных или текстовыеSingleDouble типы данных
Тип данных выходного столбца То же, что и входной столбец
Экспортируемый в ONNX Да

В этом преобразовании используется набор агрегаторов для подсчета количества значений для каждого слота (векторного элемента), которые не используются по умолчанию и отсутствуют (для определений по умолчанию и отсутствующих см. раздел примечаний).DataKind Если значение счетчика меньше указанного параметра счетчика, этот слот удаляется. Это преобразование полезно при применении вместе с .OneHotHashEncodingTransformer Он может удалить функции, созданные хэш-преобразованием, которые не имеют данных в примерах.

Например, если задать для параметра count значение 3 и поместить оценщик, примените преобразователь к следующему столбцу Features, мы увидим второй слот, содержащий: NaN (отсутствующее значение), значения 5, 5, 5, 0 (значение по умолчанию), которые удаляются, так как этот слот имеет только два значения, отличные от по умолчанию и не отсутствующие значения, т. е. два 5 значений. Третий слот хранится, так как он имеет значения 6, 6, 6, NaN; поэтому он имеет 3 не по умолчанию и отсутствует.

Компоненты
4,NaN,6
4,5,6
4,5,6
4,0,NaN

Вот как будет выглядеть приведенный выше набор данных после преобразования.

Компоненты
4,6
4,6
4,6
4,NaN

Ознакомьтесь с разделом "См. также" ссылки на примеры использования.

Методы

Fit(IDataView)

Поезда и возвращается ITransformer.

GetOutputSchema(SchemaShape)

Возвращает схему SchemaShape , которая будет производиться преобразователем. Используется для распространения и проверки схемы в конвейере.

Методы расширения

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Добавьте "контрольную точку кэширования" в цепочку оценщика. Это обеспечит обучение подчиненных оценщиков на основе кэшированных данных. Рекомендуется создать контрольную точку кэширования перед обучением, которые принимают несколько передач данных.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Учитывая оценщик, возвращает объект-оболочку, который будет вызывать делегат один раз Fit(IDataView) . Часто важно, чтобы оценщик возвращал сведения о том, что было в форме, поэтому Fit(IDataView) метод возвращает специально типизированный объект, а не просто общий ITransformer. Однако, в то же время, IEstimator<TTransformer> часто формируются в конвейеры со многими объектами, поэтому нам может потребоваться построить цепочку оценщиков, где EstimatorChain<TLastTransformer> оценщик, для которого мы хотим получить преобразователь, похоронен где-то в этой цепочке. В этом сценарии мы можем подключить делегат, который будет вызываться после вызова соответствия.

Применяется к

См. также раздел