SupportedTransformers 類別
定義 AutoML 所支援之轉換器的客戶面向名稱。
轉換器會分類為與資料 (搭配 Categorical 使用, CatImputer
例如) 、 DateTime 資料 (, DataTimeTransformer
例如) 、 Text 資料 (TfIdf
例如) ,或用於 Generic 資料類型 (,例如 Imputer
) 。
- 繼承
-
builtins.objectSupportedTransformers
建構函式
SupportedTransformers()
備註
在 自動化 ML 中使用自動前置處理 或使用 類別自訂特徵 FeaturizationConfig 化時,SupportedTransformers 中定義的屬性會用於特徵化摘要,如範例所示。
featurization_config = FeaturizationConfig()
featurization_config.add_transformer_params('Imputer', ['column1'], {"strategy": "median"})
featurization_config.add_transformer_params('HashOneHotEncoder', [], {"number_of_bits": 3})
如需詳細資訊,請參閱 設定自動化 ML 實驗。
屬性
ImputationMarker
為插補值新增布林值插補標記。
ImputationMarker = 'ImputationMarker'
Imputer
完成遺漏值。
Imputer = 'Imputer'
MaxAbsScaler
依據資料的最大絕對值來調整資料。
MaxAbsScaler = 'MaxAbsScaler'
CatImputer
依最常見的類別來插補類別特徵的遺漏值。
CatImputer = 'CatImputer'
HashOneHotEncoder
將輸入轉換成雜湊,並將編碼為單熱編碼向量。
HashOneHotEncoder = 'HashOneHotEncoder'
LabelEncoder
將類別資料編碼為數字。
LabelEncoder = 'LabelEncoder'
CatTargetEncoder
將具有回歸平均目標值的分類資料對應至分類的類別機率。
CatTargetEncoder = 'CatTargetEncoder'
WoETargetEncoder
計算類別資料與目標資料行相互關聯之辨識項的權數。
WoETargetEncoder = 'WoETargetEncoder'
OneHotEncoder
將輸入轉換成一熱編碼向量。
OneHotEncoder = 'OneHotEncoder'
DateTimeTransformer
將資料時間特徵擴充為子功能,例如年、月和日。
DateTimeTransformer = 'DateTimeTransformer'
CountVectorizer
將檔的集合轉換為權杖計數的矩陣。
CountVectorizer = 'CountVectorizer'
NaiveBayes
使用 sklearn 多項貝氏機率分類轉換文字資料。
NaiveBayes = 'NaiveBayes'
StringCast
將輸入轉換成字串和小寫。
StringCast = 'StringCast'
TextTargetEncoder
將目標編碼套用至文字資料,其中具有字包的堆疊線性模型會產生每個類別的機率。
TextTargetEncoder = 'TextTargetEncoder'
TfIdf
將計數矩陣轉換成標準化的 TF 或 TF-iDF 標記法。
TfIdf = 'TfIdf'
TimeIndexFeaturizer
使用 類別建立日期時間型功能的 time_index_featurizer 轉換器。
TimeIndexFeaturizer = 'TimeIndexFeaturizer'
WordEmbedding
使用預先定型的模型,將文字標記的向量轉換成句子向量。
WordEmbedding = 'WordEmbedding'
CUSTOMIZABLE_TRANSFORMERS
在特徵化中使用 類別中方法 FeaturizationConfig 參數自訂的轉換器。
CUSTOMIZABLE_TRANSFORMERS = {'HashOneHotEncoder', 'Imputer', 'TfIdf'}
BLOCK_TRANSFORMERS
可以封鎖的轉換器無法在 類別的特徵化中使用 FeaturizationConfig 。
BLOCK_TRANSFORMERS = {'CatTargetEncoder', 'CountVectorizer', 'HashOneHotEncoder', 'LabelEncoder', 'NaiveBayes', 'OneHotEncoder', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}
FULL_SET
完整的轉換器集。
FULL_SET = {'CatImputer', 'CatTargetEncoder', 'CountVectorizer', 'DateTimeTransformer', 'HashOneHotEncoder', 'ImputationMarker', 'Imputer', 'LabelEncoder', 'MaxAbsScaler', 'NaiveBayes', 'OneHotEncoder', 'StringCast', 'TextTargetEncoder', 'TfIdf', 'TimeIndexFeaturizer', 'WoETargetEncoder', 'WordEmbedding'}
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應