Azure 機器學習 設計工具的演算法和元件參考

適用於:Python SDK azure-ai-ml v2 (目前)

注意

設計工具支援兩種類型的元件:傳統預建元件和自定義元件。 這兩種類型的元件不相容。

傳統預建元件主要針對數據處理和傳統機器學習工作提供預先建置的元件,例如回歸和分類。 此類型的元件會繼續受到支援,但將不會新增任何新元件。

自定義元件可讓您提供自己的程式碼做為元件。 其支援跨工作區共用,且可跨 Studio、CLI 和 SDK 介面順暢製作。

本文適用於傳統預先建置的元件。

此參考內容提供 Azure 機器學習 設計工具中每個傳統預先建置元件的技術背景。

每個元件都代表一組程式代碼,這些程式代碼可以獨立執行,並視需要輸入來執行機器學習工作。 元件可能包含特定演算法,或執行在機器學習中很重要的工作,例如遺漏值取代或統計分析。

如需選擇演算法的說明,請參閱

提示

在設計工具的任何管線中,您可以取得特定元件的相關信息。 將滑鼠停留在元件清單中的元件或元件右窗格中時,選取元件卡片中的 [深入瞭解] 連結。

數據準備元件

功能 描述 component
資料輸入和輸出 將數據從雲端來源移至您的管線。 在執行管線時,將您的結果或元數據寫入 Azure 儲存體 或 SQL 資料庫,或使用雲端記憶體在管線之間交換數據。 手動輸入數據
匯出資料
匯入資料
資料轉換 機器學習服務特有的數據作業,例如正規化或量化數據、減少維度,以及在各種檔格式之間轉換數據。 新增數據行
新增數據列
套用數學運算
套用 SQL 轉換
清除遺漏的數據
裁剪值
轉換為 CSV
轉換成數據集
轉換為指標值
編輯元數據
將數據分組為 Bin
聯結數據
正規化數據
數據分割和範例
拿掉重複的數據列
擊打
選取資料行轉換
選取數據集中的數據行
分割數據
特徵選取 選取要用來建置分析模型的相關實用功能子集。 篩選型特徵選取
排列特徵重要性
統計函數 提供與數據科學相關的各種統計方法。 摘要數據

機器學習演算法

功能 描述 component
迴歸 預測值。 提升式判定樹回歸
決策樹系回歸
快速樹系分位數回歸
線性回歸
類神經網路回歸
波氏回歸
叢集 將數據分組在一起。 K-Means 叢集
分類 預測類別。 從二進位 (雙類別) 或多類別演算法中選擇。 多類別提升判定樹
多類別決策樹系
多類別羅吉斯回歸
多類別類神經網路
一個與所有多類別
一個與一個多類別
雙類別平均 Perceptron
雙類別提升判定樹
雙類別判定樹系
雙類別羅吉斯回歸
雙類別類神經網路
兩個類別支援向量機器

用於建置和評估模型的元件

功能 描述 component
模型定型 透過演算法執行數據。 定型叢集模型
定型模型
將 Pytorch 模型定型
微調模型超參數
模型評分和評估 測量定型模型的精確度。 套用轉換
將數據指派給叢集
交叉驗證模型
評估模型
評分影像模型
評分模型
Python 語言 撰寫程式代碼並將其內嵌在元件中,以整合 Python 與您的管線。 建立 Python 模型
執行 Python 腳本
R 語言 撰寫程式代碼並將它內嵌在元件中,以整合 R 與您的管線。 執行 R 文稿
文字分析 提供特殊的計算工具,以使用結構化和非結構化文字。 將 Word 轉換為向量
從文字擷取 N 克特徵
功能哈希
前置處理文字
延遲 Dirichlet 配置
評分 Vowpal Wabbit 模型
定型 Vowpal Wabbit 模型
電腦視覺 影像數據前置處理和影像辨識相關元件。 套用影像轉換
轉換成映像目錄
Init 影像轉換
分割映像目錄
DenseNet
ResNet
建議 建置建議模型。 評估推薦
分數 SVD 推薦
評分寬和深度推薦
訓練 SVD 推薦
訓練寬和深度推薦
異常偵測 建置異常偵測模型。 PCA 型異常偵測
定型異常偵測模型

Web 服務

瞭解 Azure 機器學習 設計工具中即時推斷所需的 Web 服務元件

錯誤訊息

瞭解您在 Azure 機器學習 設計工具中使用元件時可能會遇到的錯誤訊息和例外狀況碼

元件環境

設計工具中的所有內建元件都會在 Microsoft 提供的固定環境中執行。

先前此環境是以 Python 3.6 為基礎,現在已升級至 Python 3.8。 此升級是透明的,因為元件會自動在 Python 3.8 環境中執行,而且不需要使用者採取任何動作。 環境更新可能會影響元件輸出,並從即時推斷部署即時端點,請參閱下列各節以深入瞭解。

元件輸出與先前的結果不同

將 Python 版本從 3.6 升級至 3.8 之後,內建元件的相依性也可能隨之升級。 因此,您可能會發現某些元件輸出與先前的結果不同。

如果您使用執行 Python 腳本元件,且先前已安裝系結至 Python 3.6 的套件,您可能會遇到如下的錯誤:

  • 「找不到符合需求的版本。」
  • 「找不到相符的分佈」。然後,您必須指定適用於 Python 3.8 的套件版本,然後再次執行管線。

從即時推斷管線問題部署即時端點

如果您直接從先前完成的即時推斷管線部署即時端點,它可能會發生錯誤。

建議:複製推斷管線並再次提交,然後部署到即時端點。

下一步