使用 Azure Machine Learning 工作室偵錯管線失敗
提交管線作業之後,您可以在 Azure Machine Learning 工作室的工作區中選取作業連結。 此連結可開啟管線作業詳細資料頁面,以利檢查結果並針對管線作業進行偵錯。 本文將說明如何使用管線作業詳細資料頁面和管線比較功能 (預覽版),來針對機器學習管線失敗進行偵錯。
重要
本文中標示為 (預覽) 的項目目前處於公開預覽狀態。 此預覽版本會在沒有服務等級協定的情況下提供,不建議用於實際執行工作負載。 可能不支援特定功能,或可能已經限制功能。 如需詳細資訊,請參閱 Microsoft Azure 預覽版增補使用條款。
使用大綱快速尋找節點
在管線作業詳細資料頁面中,左側的 [大綱] 窗格會顯示管線作業的整體結構。 將游標停留於任一資料列上,然後選取 [在畫布中尋找] 圖示,即可在畫布上醒目提示該節點,並在右側開啟節點的資訊窗格。
在 [大綱] 窗格中,您可以選取 [篩選] 圖示,以快速將檢視篩選為 [僅限已完成節點]、[僅限元件] 或 [僅限資料]。 也可透過在從 [搜尋] 方塊中輸入節點名稱或元件名稱來篩選清單,或選取 [新增篩選],並從篩選清單中選擇。
左窗格會顯示相符的節點,其中包含狀態、持續時間、執行時間與日期等詳細資訊。 您可以替篩選的節點排序。
檢查元件的記錄和輸出
如果您的管線失敗或卡在節點上,請先檢視記錄。
選取節點以在右側開啟資訊窗格。
選取 [輸出+記錄] 索引標籤,檢視此節點的所有輸出和記錄。
user_logs 資料夾包含使用者程式碼所產生記錄檔的相關資訊。 預設會開啟此資料夾,並選取 std_log.txt 記錄檔。 print 陳述式等程式碼記錄會顯示在 std_log.txt 中。
system_logs 資料夾包含 Azure Machine Learning 所產生的記錄。 若要深入瞭解,請參閱檢視和下載診斷記錄。
注意
若未看到這些資料夾,代表計算執行階段更新可能尚未發行至計算叢集。 請先查看 azureml-logs 資料夾中的 70_driver_log.txt。
比較管線作業 (預覽)
您可以比較不同的管線作業,以針對失敗或其他非預期的問題找出原因 (預覽)。 管線比較可識別多個管線作業之間的差異,例如拓撲、元件屬性和作業屬性。
您可以比較成功和失敗的管線作業,以找出可能導致管線作業失敗的差異所在。 您可以藉由比較失敗和已完成的管線作業,或比較管道中失敗的與相似的已完成節點來進行偵錯。
若要在 Azure Machine Learning 工作室中啟用此功能,請選取右上角的擴音器圖示以管理預覽功能。 在 [受控預覽功能] 面板中,請確認 [比較管線作業以偵錯失敗或未預期的問題] 功能已設定為 [已啟用]。
比較失敗與成功的管線作業
在反覆式模型開發期間,您可能會透過變更參數、資料集、計算資源或其他設定,藉此複製與修改成功的基準管線。 如果新的管線失敗,您可以使用管線比較功能來識別父代管線中的變更項目,藉此找出失敗之處。
例如,如果新的管線因記憶體不足問題而失敗,您可以使用管線比較功能,檢視父代管線中可能導致記憶體問題的變更項目。
比較管線與其父代
在失敗管線作業頁面上,選取 [顯示譜系]。
選取 [複製來源] 快顯視窗中的連結,在新瀏覽器索引標籤中開啟父代管線作業頁面。
在兩個頁面上,分別選取頂部功能表列的 [新增至比較],以將這兩個作業新增至 [比較] 清單中。
將兩個管線新增至比較清單後,可以選取 [比較詳細資料] 或 [比較圖表]。
比較圖表
[比較圖表] 會顯示管線 A 與 B 之間的圖表拓撲變更。在畫布上,管線 A 的特殊節點會標示為 A 並以紅色醒目提示,管線 B 的特殊節點則會標示為 B 並以綠色醒目提示。 變更描述會出現在有差異的節點頂端。
您可以選擇任一節點來開啟 [元件資訊] 窗格,其中可檢視 [資料集屬性] 或 [元件] 屬性,例如 [參數]、[runSettings] 以及 [outputSettings]。 您可以選取 [只顯示差異] 與 [顯示內嵌差異]。
在此檢視中,可以選取右上方的 [顯示比較詳細資料] 以開啟管道的 [比較概觀],其中會顯示與 [比較詳情] 頁面相同的資訊。
比較詳細資料
若要檢視整體管線與作業的中繼資料、屬性與差異,請在比較清單中選取 [比較詳細資料]。 [比較詳情] 頁面會顯示兩個管線作業的 [管線屬性] 與 [作業屬性]。
- 管線屬性包括管線參數、計算設定和輸出設定。
- 執行屬性包括執行狀態、提交時間和持續時間,以及其他執行設定。
您可以選擇 [只顯示差異] 與 [顯示內嵌差異],或在右上角選取 [比較圖表] 以開啟圖表拓樸比較。
下列螢幕擷取畫面顯示了使用詳細資料比較的範例,其中 defaultCompute 設定可能是失敗的原因。
比較失敗管線節點與類似的已完成節點
如果只更新節點屬性,則可以藉由與其他作業中的相同節點進行比較來偵錯。
以滑鼠右鍵按一下失敗的節點,然後選取 [檢視作業] 以取得作業清單。
選擇已完成的作業作為比較目標,並加以開啟。
在兩個作業頁面上,分別選取頂部功能表列的 [新增至比較],以將這兩個作業新增至 [比較] 清單中。
將兩個作業新增至比較清單中後,選取 [比較詳細資料] 以顯示差異。
分享偵錯結果
若要向小組成員或其他專案關係人分享偵錯結果,請選取頂端功能表列的 [分享]。 您可以選擇 [將可共用連結複製到圖表],或 [複製管線作業識別碼] 以與他人共用。