Apache Spark for Microsoft Fabric 中的作业排队

适用于: Microsoft Fabric 中的数据工程和数据科学

当达到 Fabric 容量的 Spark 计算限制时,Microsoft Fabric 支持后台作业排队。 作业排队系统为添加到队列中的作业提供自动重试功能,直到队列到期为止。 用户在 Azure 上创建 Microsoft Fabric 容量时,可以根据其分析工作负载大小选择容量大小。 购买容量后,管理员可以在 Microsoft Fabric 中的容量内创建工作区。 在这些工作区中运行的 Spark 作业最多可以使用为给定容量分配的最大内核数,一旦达到最大限制,作业就会受到限制或排队。

详细了解 Microsoft Fabric 中的 Spark 并发限制

由管道或调度程序触发的 Notebook 作业以及 Spark 作业定义支持作业排队。 交互式笔记本作业和通过笔记本公共 API 触发的笔记本作业不支持排队。

队列以先进先出 (FIFO) 方式运行,即作业根据提交时间添加到队列中,并不断重试并在容量释放时开始执行。

注意

当 Fabric 容量处于其限制状态时,不支持 Spark 作业的排队。 提交的所有新作业都将被拒绝。

Microsoft Fabric 中作业排队过程的动画图示。

将作业添加到队列后,其状态将在监控中心中更新为“未启动”。 当从队列中选取 Notebooks 和 Spark 作业定义并开始执行时,它们的状态将从“未开始”更新为“正在进行”。

注意

所有作业的队列有效期均为 24 小时,从它们被允许进入队列之日起算。 达到过期时间后,需要重新提交作业。

队列大小

Fabric Spark 根据附加到工作区的容量 SKU 大小强制执行队列大小,提供限制和排队机制,用户可以根据购买的 Fabric 容量 SKU 提交作业。

以下部分根据容量 SKU 列出了基于 Microsoft Fabric 的 Spark 工作负载的各种队列大小:

Fabric 容量 SKU 等效的 Power BI SKU 队列限制
F2 - 4
F4 - 4
F8 - 8
F16 - 16
F32 - 32
F64 P1 64
F128 P2 128
F256 P3 256
F512 P4 512
F1024 - 1024
F2048 - 2048
试用容量 P1 NA

注意

Fabric 试用容量不支持排队。 用户必须切换到付费 Fabric F 或 P SKU 才能对 Spark 作业使用排队。

达到 Fabric 容量的最大队列限制后,提交的新作业将受到限制,并显示错误消息 [TooManyRequestsForCapacity] 无法运行此 spark 作业,因为已达到 Spark 计算或 API 速率限制。若要运行此 Spark 作业,请通过监视中心取消活动的 Spark 作业,选择更大的容量 SKU,或稍后重试。HTTP 状态代码:430 {了解详细信息} HTTP 状态代码:430