SupportedTransformers 类
为 AutoML 支持的转换器定义面向客户的名称。
转换器被分类用于 Categorical 数据(例如,CatImputer
)、DateTime 数据(例如,DataTimeTransformer
)、Text 数据(例如,TfIdf
)或 Generic 数据类型(例如,Imputer
)。
- 继承
-
builtins.objectSupportedTransformers
构造函数
SupportedTransformers()
注解
在使用自动化 ML 中的自动预处理或使用 FeaturizationConfig 类自定义特征化时,SupportedTransformers 中定义的属性用于特征化摘要,如示例中所示。
featurization_config = FeaturizationConfig()
featurization_config.add_transformer_params('Imputer', ['column1'], {"strategy": "median"})
featurization_config.add_transformer_params('HashOneHotEncoder', [], {"number_of_bits": 3})
有关详细信息,请参阅配置自动化 ML 试验。
属性
ImputationMarker
为估算值添加布尔值插补标记。
ImputationMarker = 'ImputationMarker'
Imputer
填补缺失值。
Imputer = 'Imputer'
MaxAbsScaler
按数据的最大绝对值缩放数据。
MaxAbsScaler = 'MaxAbsScaler'
CatImputer
按最常用类别插补分类功能的缺失值。
CatImputer = 'CatImputer'
HashOneHotEncoder
将输入转换为哈希,并将其编码为一个热编码向量。
HashOneHotEncoder = 'HashOneHotEncoder'
LabelEncoder
将分类数据编码为数字。
LabelEncoder = 'LabelEncoder'
CatTargetEncoder
将回归的类别数据与平均目标值映射到分类的类概率。
CatTargetEncoder = 'CatTargetEncoder'
WoETargetEncoder
计算分类数据与目标列相关证据的权重。
WoETargetEncoder = 'WoETargetEncoder'
OneHotEncoder
将输入转换为独热编码向量。
OneHotEncoder = 'OneHotEncoder'
DateTimeTransformer
将数据时间特征扩展到子功能,例如年、月、日。
DateTimeTransformer = 'DateTimeTransformer'
CountVectorizer
将文档集合转换为标记计数矩阵。
CountVectorizer = 'CountVectorizer'
NaiveBayes
使用 sklearn Multinomial Naïve Bayes 转换文本数据。
NaiveBayes = 'NaiveBayes'
StringCast
将输入强制转换为小写格式的字符串。
StringCast = 'StringCast'
TextTargetEncoder
将目标编码应用于文本数据,其中包含词包的堆积线性模型生成每个类的概率。
TextTargetEncoder = 'TextTargetEncoder'
TfIdf
将计数矩阵转换为规范化的 TF 或 TF-iDF 表示形式。
TfIdf = 'TfIdf'
TimeIndexFeaturizer
使用 time_index_featurizer 类创建基于日期/时间的特征的转换器。
TimeIndexFeaturizer = 'TimeIndexFeaturizer'
WordEmbedding
使用预定型模型将文本令牌向量转换为句向量。
WordEmbedding = 'WordEmbedding'
CUSTOMIZABLE_TRANSFORMERS
使用 FeaturizationConfig 类中方法的参数在特征化中自定义的转换器。
CUSTOMIZABLE_TRANSFORMERS = {'HashOneHotEncoder', 'Imputer', 'TfIdf'}
BLOCK_TRANSFORMERS
可阻止在 FeaturizationConfig 类中的特征化中使用的转换器。
BLOCK_TRANSFORMERS = {'CatTargetEncoder', 'CountVectorizer', 'HashOneHotEncoder', 'LabelEncoder', 'NaiveBayes', 'OneHotEncoder', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}
FULL_SET
转换器的完整集。
FULL_SET = {'CatImputer', 'CatTargetEncoder', 'CountVectorizer', 'DateTimeTransformer', 'HashOneHotEncoder', 'ImputationMarker', 'Imputer', 'LabelEncoder', 'MaxAbsScaler', 'NaiveBayes', 'OneHotEncoder', 'StringCast', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈