機器學習 Studio (傳統) 模組的 a-z 清單

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning

自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。

提示

我們鼓勵目前正在使用或評估 Machine Learning Studio (傳統) 的客戶嘗試使用 Azure Machine Learning 設計工具,這會提供拖放 ML 模組加上延展性、版本控制及企業安全性。

這些課程模組涵蓋了機器學習工作所需的各種功能和功能:

  • 資料轉換函數
  • 資料轉換函數
  • 執行 R 或 Python 腳本的模組
  • 演算法,包括:
    • 決策樹
    • 決策樹系
    • 叢集
    • 時間序列
    • 建議模型
    • 異常偵測

若要尋找模組:

依字母順序排列的模組資料表

模組名稱 說明
新增資料行 將一組資料行從一個資料集加入至另一個資料集。
新增資料列 將輸入資料集的一組資料列附加至另一個資料集的結尾。
套用篩選 將篩選套用至資料集的指定資料行。
套用數學運算 將數學運算套用至資料行值。
套用 SQL 轉換 在輸入資料集上執行 SQLite 查詢來轉換資料。
套用轉換 將妥善指定的資料轉換套用至資料集。
將資料指派給叢集 使用現有的定型群集模型將資料指派給群集。
貝氏線性迴歸 建立貝氏線性回歸模型。
促進式決策樹迴歸 使用促進式決策樹演算法建立回歸模型。
組建計數轉換 建立用來建立功能的計數。
清除遺漏的資料 指定如何處理資料集遺漏的值。
剪輯值 偵測極端值,然後裁剪或取代其值。
計算基本統計資料 針對選取的資料集資料行計算指定的摘要統計資料。
偵測語言 偵測輸入檔中每一行的語言。
計算線性相互關聯 計算資料集中資料行值之間的線性關聯。
轉換成 ARFF 將資料輸入轉換成 Weka 工具組所使用的屬性關聯檔案格式。
轉換為 CSV 將資料輸入轉換成逗點分隔值格式。
轉換為資料集 將資料輸入轉換為機器學習所使用的內部資料集格式。
轉換為指標值 將資料行中的類別值轉換成指標值。
轉換成 SVMLight 將資料輸入轉換成 SVMlight framework 所使用的格式。
轉換成 TSV 將資料輸入轉換為定位字元分隔格式。
建立 R 模型 使用自訂資源建立 R 模型。
交叉驗證模型 藉由分割資料來交叉驗證分類或回歸模型的參數估計值。
決策樹系迴歸 使用決策樹系演算法建立回歸模型。
偵測語言 偵測輸入檔中每一行的語言。
編輯中繼資料 編輯與資料集中的資料行相關聯的中繼資料。
手動輸入資料 藉由輸入值來啟用輸入和編輯小型資料集。
評估模型 使用標準計量來評估計分的分類或回歸模型。
評估機率函數 將指定的機率分佈函數納入資料集。
評估推薦 評估推薦模型預測的精確度。
執行 Python 指令碼 從機器學習實驗執行 Python 腳本。
執行 R 指令碼 從機器學習實驗執行 R 腳本。
匯出計數資料表 從計數轉換匯出計數。
匯出資料 將資料集寫入 web url 或 Azure 中各種形式的雲端式儲存體,例如資料表、blob 和 Azure SQL 資料庫。

此模組先前命名為 Writer
從文字中將關鍵字組解壓縮 從文字資料行中解壓縮關鍵字和片語。
從文字擷取 N-Gram 特徵 建立 N 語法的字典功能,然後對其進行特徵選取。
快速樹系分量迴歸 建立分量回歸模型。
特性雜湊 使用 Vowpal Wabbit 程式庫將文字資料轉換成整數編碼的功能。
以篩選為基礎的特徵選取 識別資料集內具有最大預測能力的功能。
FIR 濾波器 為信號處理建立有限脈衝回應篩選。
Fisher 線性判別分析 識別功能變數的線性組合,這些變數可以將資料最妥善地分組至不同的類別。
群組類別值 將來自多個類別目錄的資料分組至新的分類。
將資料分組成 Bin 將數值資料放入 bin 中。
IIR 濾波器 為信號處理建立無限脈衝回應篩選。
匯入計數資料表 從現有的計數資料表匯入計數。
匯入資料 從網路上的外部來源,或從 Azure 中各種形式的雲端式儲存體載入資料,例如資料表、blob、SQL 資料庫和 Azure Cosmos DB。 如果已設定閘道,就可以從內部部署 SQL Server 資料庫載入資料。

此模組先前稱為「 讀取器」。
匯入影像 將映射從 Azure Blob 儲存體載入至資料集。
聯結資料 聯結兩個資料集。
K-Means 群集 設定及初始化 K 意指叢集模型。
隱含狄利克雷分佈 使用 Vowpal Wabbit 程式庫來執行主題模型化,以進行潛在狄氏配置 (LDA) 。
線性迴歸 建立線性回歸模型。
載入定型的模型 取得定型的模型,您可以在實驗中用來進行評分。
中值濾波器 建立用來讓資料平滑以進行趨勢分析的中間值篩選。
合併計數轉換 合併兩組計數資料表。
修改計數資料表參數 從計數資料表建立一組以計數為基礎的精簡特徵。
移動平均濾波器 建立會將資料平滑以進行趨勢分析的移動平均篩選。
多元決策樹系 使用決策樹系演算法來建立多元分類模型。
多級決策叢林 使用決策蛙演算法來建立多元分類模型。
多元羅吉斯迴歸 建立多元羅吉斯回歸分類模型。
多元神經網路 使用類神經網路演算法建立多元分類模型。
具名實體辨識 辨識文字資料行中的已命名實體。
類神經網路迴歸 使用類神經網路演算法建立回歸模型。
將資料標準化 方式將數值資料,以將資料集值限制在標準範圍內。
一級支援向量機器 建立單一類別支援向量機器模型以進行異常偵測。
一對多多級 從二元分類模型的集團建立多元分類模型。
序數迴歸 建立序數回歸模型。
資料分割和取樣 根據取樣建立資料集的多個資料分割。
排列功能重要性 計算定型模型和測試資料集內功能變數的排列功能重要性分數。
PCA 型異常偵測 使用主體元件分析 (PCA) 來建立異常偵測模型。
波氏迴歸 建立假設資料具有波氏分佈的回歸模型。
前置處理文字 對文字執行清除作業。
預先定型的重疊顯示影像分類 使用 OpenCV 程式庫建立正面臉部的預先定型影像分類模型。
主體元件分析 計算一組具有精簡維度的功能,以獲得更有效率的學習。
移除重複的資料列 從資料集移除重複的資料列。
取代離散值 根據另一個資料行,以數值取代一個資料行的離散值。
計分 Matchbox 推薦 使用 Matchbox 推薦為資料集評分預測。
為模型評分 評分定型分類或回歸模型的預測。
計分 Vowpal Wabbit 7-4 模型 使用 Vowpal Wabbit 機器學習系統來計分資料。

需要使用 Vowpal Wabbit 7-4 和7-6 版建立的定型模型。
計分 Vowpal Wabbit 7-10 模型 使用 Vowpal Wabbit 機器學習系統來計分資料。

需要使用 Vowpal Wabbit 7-10 版所建立的定型模型。
計分 Vowpal Wabbit 8 模型 從命令列介面使用 Vowpal Wabbit 機器學習系統來計分資料。

需要使用 Vowpal Wabbit 第8版建立的定型模型。
選取資料集中的資料行 選取要在作業中包含或排除資料集的資料行。
SMOTE 使用綜合少數超取樣來增加資料集中的低發生範例數目。
資料分割 將資料集的資料列分割成兩個不同的集合。
摘要資料 針對資料集中的資料行產生基本描述性統計資料包表。
清理叢集 在群集模型上執行參數清除,以判斷最佳參數設定。
使用 T 測試的測試假設 使用 t 測試來比較兩個資料集的意思。
臨界值篩選器 建立限制值的臨界值篩選準則。
時間序列異常偵測 學習時間序列資料中的趨勢,然後使用趨勢來偵測異常狀況。
定型異常偵測模型 訓練異常偵測器模型,然後從定型集中標示資料。
將群集模型定型 定型群集模型,然後將定型集的資料指派給叢集。
定型 Matchbox 推薦 使用 Matchbox 演算法來訓練貝氏推薦。
訓練模型 以監督的方式訓練分類或回歸模型。
定型 Vowpal Wabbit 7-4 模型 從 Vowpal Wabbit 機器學習系統訓練模型。

此課程模組是為了與 Vowpal Wabbit 7-4 和7-6 版相容。
定型 Vowpal Wabbit 7-10 模型 從 Vowpal Wabbit 機器學習系統訓練模型。

此模組適用于 Vowpal Wabbit 7-10 版。
定型 Vowpal Wabbit 8 模型 使用第8版的 Vowpal Wabbit 機器學習系統來訓練模型。

此課程模組適用于 Vowpal Wabbit 第8版。
微調模型超參數 在回歸或分類模型上執行參數清除,以決定最佳的參數設定。
二元平均感知器 建立平均認知二元分類模型。
二級貝氏點機器 建立貝氏機率分類點機器二元分類模型。
二元促進式決策樹 使用促進式決策樹演算法建立二元分類器。
二元決策樹系 使用決策樹系演算法建立雙類別分類模型。
二級決策叢林 使用決策蛙演算法建立二級分類模型。
二級局部深度支援向量機器 使用本機深度支援向量機器演算法建立二元分類模型。
二元羅吉斯迴歸 建立兩個類別的羅吉斯回歸模型。
二元神經網路 使用類神經網路演算法建立二元分類器。
二元支援向量機器 使用支援向量機器演算法建立二元分類模型。
解壓縮壓縮的資料集 從使用者儲存體中 .zip 套件解壓縮資料集。
使用者定義的篩選 建立自訂的有限或無限脈衝回應篩選。

另請參閱