Поделиться через


microsoftml.count_select: выбор признаков по количеству

Использование

microsoftml.count_select(cols: [list, str], count: int = 1, **kargs)

Описание

Выбирает признаки, для которых количество значений, не являющихся значениями по умолчанию, больше или равно пороговому значению.

Сведения

При использовании количества в преобразовании с выбором признаков признак выбирается в том случае, если в число примеров входит минимальное указанное число примеров, значения в которых отличаются от значений по умолчанию в признаке. Преобразование с выбором признаков по количеству очень удобно, если оно применятся совместно с преобразованием хэша категории (см. также categorical_hash). Выбор признаков по количеству может удалить признаки, созданные с помощью преобразования хэша и не содержащие данных в примерах.

Аргументы

cols

Задает строку символов или список имен переменных для выбора.

количество

Пороговое значение для выбора признаков по количеству. Признак выбирается в том и только в том случае, если как минимум в count примерах значения отличаются от значений по умолчанию в признаке. Значение по умолчанию — 1.

kargs

Дополнительные аргументы, отправляемые в подсистему вычислений.

Возвращаемое значение

Объект, определяющий преобразование.

См. также

mutualinformation_select