Azure 機器學習 設計工具的演算法和元件參考
適用於:Python SDK azure-ai-ml v2 (目前)
注意
設計工具支援兩種類型的元件:傳統預先建置的元件和自訂元件。 這兩種類型的元件互不相容。
傳統預先建置的元件主要提供用於資料處理和傳統機器學習工作 (例如迴歸和分類) 的預先建置元件。 此類型的元件會繼續受到支援,但將不會新增任何新元件。
自訂元件可讓您提供自己的程式碼作為元件。 其支援跨工作區共用,且可跨 Studio、CLI 和 SDK 介面順暢製作。
此文章適用於傳統預先建置的元件。
此參考內容提供 Azure 機器學習 設計工具中每個傳統預建元件的技術背景。
每個元件都代表一組程式代碼,這些程式代碼可以獨立執行,並視需要輸入來執行機器學習工作。 元件可能包含特定演算法,或執行在機器學習中很重要的工作,例如遺漏值取代或統計分析。
如需選擇演算法的說明,請參閱
提示
在設計工具的任何管線中,您可以取得特定元件的相關信息。 將滑鼠停留在元件清單中的元件或元件右窗格中時,選取元件卡片中的 [深入瞭解] 連結。
數據準備元件
功能 | 描述 | component |
---|---|---|
資料輸入和輸出 | 將數據從雲端來源移至您的管線。 在執行管線時,將您的結果或中繼數據寫入 Azure 儲存體 或 SQL 資料庫,或使用雲端記憶體在管線之間交換數據。 | 手動輸入數據 匯出資料 匯入資料 |
資料轉換 | 機器學習服務特有的數據作業,例如正規化或量化數據、減少維度,以及在各種檔格式之間轉換數據。 | 新增數據行 新增數據列 套用數學運算 套用 SQL 轉換 清除遺漏的數據 裁剪值 轉換為 CSV 轉換成數據集 轉換為指標值 編輯元數據 將數據分組為 Bin 聯結數據 正規化數據 數據分割和範例 拿掉重複的數據列 擊打 選取資料行轉換 選取數據集中的數據行 分割數據 |
特徵選取 | 選取要用來建置分析模型的相關實用功能子集。 | 篩選型特徵選取 排列特徵重要性 |
統計函數 | 提供與數據科學相關的各種統計方法。 | 摘要數據 |
機器學習演算法
功能 | 描述 | component |
---|---|---|
迴歸 | 預測值。 | 提升式判定樹回歸 決策樹系回歸 快速樹系分位數回歸 線性回歸 類神經網路回歸 波氏回歸 |
叢集 | 將數據分組在一起。 | K-Means 叢集 |
分類 | 預測類別。 從二進位 (雙類別) 或多類別演算法中選擇。 | 多類別提升判定樹 多類別決策樹系 多類別羅吉斯回歸 多類別類神經網路 一個與所有多類別 一個與一個多類別 雙類別平均 Perceptron 雙類別提升判定樹 雙類別判定樹系 雙類別羅吉斯回歸 雙類別類神經網路 兩個類別支援向量機器 |
用於建置和評估模型的元件
功能 | 描述 | component |
---|---|---|
模型定型 | 透過演算法執行數據。 | 定型叢集模型 訓練模型 將 Pytorch 模型定型 微調模型超參數 |
模型評分和評估 | 測量定型模型的精確度。 | 套用轉換 將數據指派給叢集 交叉驗證模型 評估模型 評分影像模型 評分模型 |
Python 語言 | 撰寫程式代碼並將其內嵌在元件中,以整合 Python 與您的管線。 | 建立 Python 模型 執行 Python 腳本 |
R 語言 | 撰寫程式代碼並將它內嵌在元件中,以整合 R 與您的管線。 | 執行 R 文稿 |
文字分析 | 提供特殊的計算工具,以使用結構化和非結構化文字。 | 將 Word 轉換為向量 從文字擷取 N 克特徵 功能哈希 前置處理文字 延遲 Dirichlet 配置 評分 Vowpal Wabbit 模型 定型 Vowpal Wabbit 模型 |
電腦視覺 | 影像數據前置處理和影像辨識相關元件。 | 套用影像轉換 轉換成映像目錄 Init 影像轉換 分割映像目錄 DenseNet ResNet |
建議 | 建置建議模型。 | 評估推薦 分數 SVD 推薦 評分寬和深度推薦 訓練 SVD 推薦 訓練寬和深度推薦 |
異常偵測 | 建置異常偵測模型。 | PCA 型異常偵測 定型異常偵測模型 |
Web 服務
瞭解 Azure 機器學習 設計工具中即時推斷所需的 Web 服務元件。
錯誤訊息
瞭解您在 Azure 機器學習 設計工具中使用元件時可能會遇到的錯誤訊息和例外狀況代碼。
元件環境
設計工具中的所有內建元件都會在 Microsoft 提供的固定環境中執行。
先前此環境是以 Python 3.6 為基礎,現在已升級至 Python 3.8。 此升級是透明的,因為元件會自動在 Python 3.8 環境中執行,而且不需要使用者採取任何動作。 環境更新可能會影響元件輸出,並從即時推斷部署即時端點,請參閱下列各節以深入瞭解。
元件輸出與先前的結果不同
將 Python 版本從 3.6 升級至 3.8 之後,內建元件的相依性也可能隨之升級。 因此,您可能會發現某些元件輸出與先前的結果不同。
如果您使用執行 Python 腳本元件,且先前已安裝系結至 Python 3.6 的套件,您可能會遇到如下的錯誤:
- 「找不到符合需求的版本。」
- 「找不到相符的分佈」。然後,您必須指定適用於 Python 3.8 的套件版本,然後再次執行管線。
從即時推斷管線問題部署即時端點
如果您直接從先前完成的即時推斷管線部署即時端點,它可能會發生錯誤。
建議:複製推斷管線並再次提交,然後部署到即時端點。