共用方式為


識別 Spark DAG 中的昂貴讀取

前往 DAG

假設您正在查看昂貴的作業,首先我們需要執行讀取的階段標識碼。 我們在這裡可以看到階段標識碼為 194:

階段標識碼

現在我們需要取得 SQL DAG。 向上捲動至作業頁面頂端,然後按兩下 [相關聯的 SQL 查詢]:

SQL 識別碼

您現在應該會看到 DAG。 如果沒有,請捲動一點,您應該會看到它:

SQL DAG

在某些情況下,您可以遵循 DAG 並查看數據的來源。 在其他情況下,尋找您注意到的階段標識碼:

DAG 中的 SQL 階段

然後,您需要尋找「掃描」節點。 在此情況下,我們很容易知道我們正在讀取名為 的 transactions數據表:

在 DAG 中掃描

在某些情況下,您可能需要按兩下或變換節點,以取得所讀取資料的位置。