SupportedTransformers Classe
Define nomes voltados para o cliente para transformadores compatíveis com o ML automatizado.
Os transformadores são classificados para uso com os dados de Categorical (por exemplo, CatImputer
), os dados de DateTime (por exemplo, DataTimeTransformer
), os dados de Text (por exemplo, TfIdf
) ou para tipos de dados Generic (por exemplo, Imputer
).
- Herança
-
builtins.objectSupportedTransformers
Construtor
SupportedTransformers()
Comentários
Os atributos definidos em SupportedTransformers são usados em resumos de definição de recursos ao usar o pré-processamento automático no ML automatizado ou ao personalizar a definição de recursos com a classe FeaturizationConfig, conforme mostrado no exemplo.
featurization_config = FeaturizationConfig()
featurization_config.add_transformer_params('Imputer', ['column1'], {"strategy": "median"})
featurization_config.add_transformer_params('HashOneHotEncoder', [], {"number_of_bits": 3})
Para obter mais informações, confira Configurar experimentos de ML automatizado.
Atributos
ImputationMarker
Adicionar o marcador imputação booliano para valores imputados.
ImputationMarker = 'ImputationMarker'
Imputer
Valores ausentes completos.
Imputer = 'Imputer'
MaxAbsScaler
Dimensionar dados por seu valor absoluto máximo.
MaxAbsScaler = 'MaxAbsScaler'
CatImputer
Inserir valores ausentes em recursos categóricos segundo a categoria mais frequente.
CatImputer = 'CatImputer'
HashOneHotEncoder
Converter entrada em hash e codificar para vetor codificado one-hot.
HashOneHotEncoder = 'HashOneHotEncoder'
LabelEncoder
Codificar dados categóricos em números.
LabelEncoder = 'LabelEncoder'
CatTargetEncoder
Mapear dados de categoria com valor de destino médio para regressão e para probabilidade de classe para classificação.
CatTargetEncoder = 'CatTargetEncoder'
WoETargetEncoder
Calcular o peso de evidência da correlação de dados categóricos em uma coluna de destino.
WoETargetEncoder = 'WoETargetEncoder'
OneHotEncoder
Converter a entrada em um vetor codificado one-hot.
OneHotEncoder = 'OneHotEncoder'
DateTimeTransformer
Expandir recursos de data e hora em sub-recursos, como ano, mês e dia.
DateTimeTransformer = 'DateTimeTransformer'
CountVectorizer
Converter uma coleção de documentos em uma matriz de contagens de token.
CountVectorizer = 'CountVectorizer'
NaiveBayes
Transformar dados textuais usando sklearn do Multinomial Naïve Bayes.
NaiveBayes = 'NaiveBayes'
StringCast
Converter a entrada em cadeia de caracteres e letras minúsculas.
StringCast = 'StringCast'
TextTargetEncoder
Aplicar codificação de destino a dados de texto em que um modelo linear empilhado com conjunto de palavras gera a probabilidade de cada classe.
TextTargetEncoder = 'TextTargetEncoder'
TfIdf
Transformar uma matriz de contagem em uma representação de TF ou TF-iDF normalizada.
TfIdf = 'TfIdf'
TimeIndexFeaturizer
Transformador para criar recursos baseados em datetime usando time_index_featurizer a classe .
TimeIndexFeaturizer = 'TimeIndexFeaturizer'
WordEmbedding
Converter vetores de tokens de texto em vetores de sentença usando um modelo pré-treinado.
WordEmbedding = 'WordEmbedding'
CUSTOMIZABLE_TRANSFORMERS
Transformadores que são personalizados na personalização com parâmetros de métodos na classe FeaturizationConfig.
CUSTOMIZABLE_TRANSFORMERS = {'HashOneHotEncoder', 'Imputer', 'TfIdf'}
BLOCK_TRANSFORMERS
Transformadores que podem ser impedidos de usar em personalização na classe FeaturizationConfig.
BLOCK_TRANSFORMERS = {'CatTargetEncoder', 'CountVectorizer', 'HashOneHotEncoder', 'LabelEncoder', 'NaiveBayes', 'OneHotEncoder', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}
FULL_SET
O conjunto completo de transformadores.
FULL_SET = {'CatImputer', 'CatTargetEncoder', 'CountVectorizer', 'DateTimeTransformer', 'HashOneHotEncoder', 'ImputationMarker', 'Imputer', 'LabelEncoder', 'MaxAbsScaler', 'NaiveBayes', 'OneHotEncoder', 'StringCast', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}
Comentários
https://aka.ms/ContentUserFeedback.
Em breve: Ao longo de 2024, eliminaremos os problemas do GitHub como o mecanismo de comentários para conteúdo e o substituiremos por um novo sistema de comentários. Para obter mais informações, consulteEnviar e exibir comentários de