資料轉換-調整規模並減少
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
本文說明機器學習 Studio (傳統) 中的模組,可協助您處理數值資料。 針對機器學習,常見的資料工作包括裁剪、分類收納和標準化數值。 其他模組則支援維度縮減。
模型化數值資料
標準化、分類收納或轉散發數值變數等工作,是機器學習資料準備的重要部分。 此群組中的模組支援下列資料準備工作:
- 將資料分組成不同大小或分佈的各組。
- 移除極端值或變更其值。
- 將一組數值正規化成特定的範圍。
- 從高維度的資料集建立一組精簡的特徵資料行。
相關工作
- 選取用來建立模型的相關和實用功能:使用 特徵選取 或 費雪線性判別分析 模組。
- 根據值的計數選取功能:使用Learning 與計數模組。
- 移除或取代遺漏值:使用 [ 清除遺漏的資料 ] 模組。
- 以衍生自計算的數值取代類別值:使用 [ 取代離散值 ] 模組。
- 計算離散或數值資料行的機率分佈:使用 評估機率函數 模組。
- 篩選和轉換數位信號和波形:使用 篩選 模組。
模組清單
這 項資料轉換-調整規模和縮減 類別包含下列模組:
- 剪輯值:偵測極端值,然後裁剪或取代其值。
- 將資料分組成 bin:將數值資料放入 bin 中。
- 將資料正規化:方式將數值資料,將資料集值限制在標準範圍內。
- 主體元件分析:計算一組具有精簡維度的功能,以獲得更有效率的學習。