SupportedTransformers Klas
Definieert klantgerichte namen voor transformatoren die worden ondersteund door AutoML.
Transformatoren worden geclassificeerd voor gebruik met Categorical gegevens (bijvoorbeeld CatImputer
), DateTime gegevens (bijvoorbeeld DataTimeTransformer
), gegevens (bijvoorbeeld ), Text gegevens (bijvoorbeeld TfIdf
), of voor Generic gegevenstypen (bijvoorbeeld Imputer
).
- Overname
-
builtins.objectSupportedTransformers
Constructor
SupportedTransformers()
Opmerkingen
De kenmerken die zijn gedefinieerd in SupportedTransformers worden gebruikt in featurization-samenvattingen bij het gebruik van automatische voorverwerking in geautomatiseerde ML of bij het aanpassen van featurization met de FeaturizationConfig klasse, zoals wordt weergegeven in het voorbeeld.
featurization_config = FeaturizationConfig()
featurization_config.add_transformer_params('Imputer', ['column1'], {"strategy": "median"})
featurization_config.add_transformer_params('HashOneHotEncoder', [], {"number_of_bits": 3})
Zie Geautomatiseerde ML-experimenten configureren voor meer informatie.
Kenmerken
ImputationMarker
Voeg booleaanse invoermarkering toe voor de opgegeven waarden.
ImputationMarker = 'ImputationMarker'
Imputer
Ontbrekende waarden voltooien.
Imputer = 'Imputer'
MaxAbsScaler
Gegevens schalen met de maximale absolute waarde.
MaxAbsScaler = 'MaxAbsScaler'
CatImputer
Ontbrekende waarden voor categorische functies invoeren op basis van de meest voorkomende categorie.
CatImputer = 'CatImputer'
HashOneHotEncoder
Converteer invoer naar hash en codeer naar one-hot gecodeerde vector.
HashOneHotEncoder = 'HashOneHotEncoder'
LabelEncoder
Categorische gegevens coderen in getallen.
LabelEncoder = 'LabelEncoder'
CatTargetEncoder
Wijs categoriegegevens toe met een gemiddelde doelwaarde voor regressie en de klassekans voor classificatie.
CatTargetEncoder = 'CatTargetEncoder'
WoETargetEncoder
Bereken het bewijsgewicht van de correlatie van een categorische gegevens met een doelkolom.
WoETargetEncoder = 'WoETargetEncoder'
OneHotEncoder
Invoer converteren naar one-hot gecodeerde vector.
OneHotEncoder = 'OneHotEncoder'
DateTimeTransformer
Breid datatime-functies uit naar subfuncties zoals jaar, maand en dag.
DateTimeTransformer = 'DateTimeTransformer'
CountVectorizer
Converteer een verzameling documenten naar een matrix van tokenaantallen.
CountVectorizer = 'CountVectorizer'
NaiveBayes
Tekstgegevens transformeren met behulp van sklearn Multinomial Naïve Bayes.
NaiveBayes = 'NaiveBayes'
StringCast
Cast-invoer naar tekenreeks en kleine letters.
StringCast = 'StringCast'
TextTargetEncoder
Doelcodering toepassen op tekstgegevens, waarbij een gestapeld lineair model met woorden de waarschijnlijkheid van elke klasse genereert.
TextTargetEncoder = 'TextTargetEncoder'
TfIdf
Een tellingsmatrix transformeren naar een genormaliseerde TF- of TF-iDF-weergave.
TfIdf = 'TfIdf'
TimeIndexFeaturizer
Transformer voor het maken van op datum/tijd gebaseerde functies met behulp van time_index_featurizer klasse.
TimeIndexFeaturizer = 'TimeIndexFeaturizer'
WordEmbedding
Converteer vectoren van teksttokens naar zinsvectoren met behulp van een vooraf getraind model.
WordEmbedding = 'WordEmbedding'
CUSTOMIZABLE_TRANSFORMERS
Transformatoren die zijn aangepast in featurization met parameters van methoden in de FeaturizationConfig klasse.
CUSTOMIZABLE_TRANSFORMERS = {'HashOneHotEncoder', 'Imputer', 'TfIdf'}
BLOCK_TRANSFORMERS
Transformatoren die kunnen worden geblokkeerd voor gebruik in featurization in de FeaturizationConfig klasse.
BLOCK_TRANSFORMERS = {'CatTargetEncoder', 'CountVectorizer', 'HashOneHotEncoder', 'LabelEncoder', 'NaiveBayes', 'OneHotEncoder', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}
FULL_SET
De volledige set transformatoren.
FULL_SET = {'CatImputer', 'CatTargetEncoder', 'CountVectorizer', 'DateTimeTransformer', 'HashOneHotEncoder', 'ImputationMarker', 'Imputer', 'LabelEncoder', 'MaxAbsScaler', 'NaiveBayes', 'OneHotEncoder', 'StringCast', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor