如何确定 Spark 是否正在重写数据

首先为写入阶段打开 SQL DAG。 向上滚动到作业页面顶部,然后单击关联的 SQL 查询:

暂存到 SQL

现在,你应该会看到 DAG。 如果没有,请滚动一下,应该就会看到它:

SQL DAG

如果要执行“删除”或“更新”操作,请查看编写器写入的数据量与你的预期数据量。 如果看到写入的数据多于预期,则你可能正在重写数据:

写入统计信息

如果要执行合并,则合并节点具有关于它正在重写的数据量的显式统计信息。