監視並分析 Studio 中的作業
可以使用 Azure Machine Learning 工作室 來監視、組織和追蹤作業,以進行定型和實驗。 您的 ML 作業記錄會有助於說明和重複 ML 開發程序。
本文示範如何執行下列工作:
- 新增作業顯示名稱。
- 建立自訂檢視。
- 新增作業描述。
- 標記並尋找作業。
- 執行搜尋您的作業記錄。
- 作業取消或失敗。
- 透過電子郵件通知來監視作業狀態。
- 監視您的作業資源 (預覽版)
提示
- 若想尋找使用 Azure Machine Learning SDK v1 或 CLI v1 的相關資訊,請參閱 如何追蹤、監視和分析作業 (v1)。
- 若想尋找從 CLI 或 SDK v2 監視定型作業的相關資訊,請參閱 使用 MLflow 和 CLI v2 來追蹤實驗。
- 如果您要尋找有關監視 Azure Machine Learning 服務和相關聯 Azure 服務的資訊,請參閱如何監視 Azure Machine Learning。
若想尋找部署至線上端點的監視模型相關資訊,請參閱監視線上端點。
必要條件
您將需要下列項目:
- 如要使用 Azure Machine Learning,您必須擁有 Azure 訂閱。 如尚未擁有 Azure 訂用帳戶,請在開始之前先建立免費帳戶。 試用免費或付費版本的 Azure Machine Learning。
- 您必須具有 Azure Machine Learning 工作區。 在安裝、設定和使用 CLI (v2) 中建立工作區。
作業顯示名稱
作業顯示名稱為可選用且可自訂的名稱,可以為您的作業來提供。 若要編輯該作業顯示名稱:
瀏覽至 [作業] 清單。
選取要編輯的 [作業]。
選取 [編輯] 按鈕來編輯作業顯示名稱。
自訂檢視
若要在工作室中檢視您的作業:
瀏覽至 [作業] 索引標籤。
選取 [所有實驗] 以檢視實驗中的全部作業,或選取 [所有作業] 以檢視工作區中已提交的全部作業。
在 [所有執行] 分頁中,您可以依標記、實驗和計算目標篩選作業清單,並讓組織和工作範圍設定,變得更好。
選取作業來比較、新增圖表或套用篩選,以對分頁進行自訂。 這些變更可以另存為 [自訂檢視],讓您可以輕鬆地返回您的工作。 具有工作區權限的使用者可以編輯或檢視自訂檢視。 此外,您也可以選取 [共用檢視],與小組成員共用自訂檢視,以增強共同作業。
若要檢視作業記錄檔,請選取特定的作業,然後在 [輸出 + 記錄檔] 索引標籤中,可以找到作業的診斷和錯誤記錄檔。
作業描述
作業描述可以新增至作業,以針對作業提供更多內容和資訊。 您亦可以從作業清單中搜尋這些描述,並將作業描述新增為作業清單中的資料行。
瀏覽至作業的 [作業詳細資料] 分頁,然後選取編輯或鉛筆圖示,即可新增、編輯或刪除您的作業描述。 若要保存作業清單的變更,請將變更儲存至現有的「自訂檢視」或新的「自訂檢視」。 作業描述支援 Markdown 格式,允許內嵌影像和深層連結,如下列所示。
標記並尋找作業
在 Azure Machine Learning 中,您可以使用屬性和標記來協助組織和查詢作業中的重要資訊。
編輯標籤
可以從工作室新增、編輯或刪除作業標記。 瀏覽至作業的 [作業詳細資料] 分頁,然後選取編輯或鉛筆圖示,即可新增、編輯或刪除您的作業描述。 您也可以從作業清單分頁來搜尋並篩選這些標記。
查詢屬性和標記
可以查詢實驗內的作業,以傳回符合特定屬性和標記的作業清單。
若要搜尋特定作業,請瀏覽至 [所有作業] 清單。 您在這裡有兩個選項:
使用 [新增篩選] 按鈕,然後在標記上選取 [篩選],依指派給作業的標記來篩選您的作業。
OR透過搜尋作業的中繼資料 (例如執行狀態、描述、實驗名稱和提交者名稱),以使用搜尋列快速尋找作業。
作業取消或失敗
若發現錯誤,或作業時間過長而無法完成,則可以取消該作業。
若要在工作室中取消作業,請進行下列步驟:
在 [作業] 或 [Azure Pipelines] 區段中,前往正在執行的管線。
選取想要取消的管線工作編號。
在工具列中,選取 [取消]。
透過電子郵件通知來監視作業狀態
在 Azure 入口網站的左側導覽列中,選取 [監視] 索引標籤。
選取 [診斷設定],然後選取 [+ 新增診斷設定]。
在 [診斷設定] 中,
- 在 [類別詳細資料] 底下,選取 [AmlRunStatusChangedEvent]。
- 在 [目的地詳細資料] 中,選取 [傳送至 Log Analytics 工作區],並指定 [訂 用帳戶] 和 [Log Analytics 工作區]。
注意
[Azure Log Analytics 工作區] 是與 [Azure Machine Learning service 工作區] 不同類型的 Azure 資源。 如果該清單中沒有任何選項,則您可以建立 Log Analytics 工作區。
在 [記錄] 索引標籤中,新增 [新增警示規則]。
下一步
- 若要學習如何記錄您的實驗計量,請參閱定型作業期間記錄計量。
- 若要了解如何監視 Azure Machine Learning 的資源和記錄,請參閱監視 Azure Machine Learning。
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應