SupportedTransformers 类

为 AutoML 支持的转换器定义面向客户的名称。

转换器被分类用于 Categorical 数据(例如,CatImputer)、DateTime 数据(例如,DataTimeTransformer)、Text 数据(例如,TfIdf)或 Generic 数据类型(例如,Imputer)。

继承
builtins.object
SupportedTransformers

构造函数

SupportedTransformers()

注解

在使用自动化 ML 中的自动预处理或使用 FeaturizationConfig 类自定义特征化时,SupportedTransformers 中定义的属性用于特征化摘要,如示例中所示。


   featurization_config = FeaturizationConfig()
   featurization_config.add_transformer_params('Imputer', ['column1'], {"strategy": "median"})
   featurization_config.add_transformer_params('HashOneHotEncoder', [], {"number_of_bits": 3})

有关详细信息,请参阅配置自动化 ML 试验

属性

ImputationMarker

为估算值添加布尔值插补标记。

ImputationMarker = 'ImputationMarker'

Imputer

填补缺失值。

Imputer = 'Imputer'

MaxAbsScaler

按数据的最大绝对值缩放数据。

MaxAbsScaler = 'MaxAbsScaler'

CatImputer

按最常用类别插补分类功能的缺失值。

CatImputer = 'CatImputer'

HashOneHotEncoder

将输入转换为哈希,并将其编码为一个热编码向量。

HashOneHotEncoder = 'HashOneHotEncoder'

LabelEncoder

将分类数据编码为数字。

LabelEncoder = 'LabelEncoder'

CatTargetEncoder

将回归的类别数据与平均目标值映射到分类的类概率。

CatTargetEncoder = 'CatTargetEncoder'

WoETargetEncoder

计算分类数据与目标列相关证据的权重。

WoETargetEncoder = 'WoETargetEncoder'

OneHotEncoder

将输入转换为独热编码向量。

OneHotEncoder = 'OneHotEncoder'

DateTimeTransformer

将数据时间特征扩展到子功能,例如年、月、日。

DateTimeTransformer = 'DateTimeTransformer'

CountVectorizer

将文档集合转换为标记计数矩阵。

CountVectorizer = 'CountVectorizer'

NaiveBayes

使用 sklearn Multinomial Naïve Bayes 转换文本数据。

NaiveBayes = 'NaiveBayes'

StringCast

将输入强制转换为小写格式的字符串。

StringCast = 'StringCast'

TextTargetEncoder

将目标编码应用于文本数据,其中包含词包的堆积线性模型生成每个类的概率。

TextTargetEncoder = 'TextTargetEncoder'

TfIdf

将计数矩阵转换为规范化的 TF 或 TF-iDF 表示形式。

TfIdf = 'TfIdf'

TimeIndexFeaturizer

使用 time_index_featurizer 类创建基于日期/时间的特征的转换器。

TimeIndexFeaturizer = 'TimeIndexFeaturizer'

WordEmbedding

使用预定型模型将文本令牌向量转换为句向量。

WordEmbedding = 'WordEmbedding'

CUSTOMIZABLE_TRANSFORMERS

使用 FeaturizationConfig 类中方法的参数在特征化中自定义的转换器。

CUSTOMIZABLE_TRANSFORMERS = {'HashOneHotEncoder', 'Imputer', 'TfIdf'}

BLOCK_TRANSFORMERS

可阻止在 FeaturizationConfig 类中的特征化中使用的转换器。

BLOCK_TRANSFORMERS = {'CatTargetEncoder', 'CountVectorizer', 'HashOneHotEncoder', 'LabelEncoder', 'NaiveBayes', 'OneHotEncoder', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}

FULL_SET

转换器的完整集。

FULL_SET = {'CatImputer', 'CatTargetEncoder', 'CountVectorizer', 'DateTimeTransformer', 'HashOneHotEncoder', 'ImputationMarker', 'Imputer', 'LabelEncoder', 'MaxAbsScaler', 'NaiveBayes', 'OneHotEncoder', 'StringCast', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}