使用数据管道将 1 TB Parquet 数据加载到具有暂存的数据仓库的定价方案

此方案在数据管道中使用复制活动将存储在 Azure Data Lake Storage (ADLS) Gen2 中的 1 TB Parquet 表数据通过暂存加载到 Microsoft Fabric 中的数据仓库。

以下示例中使用的价格是假设的,并不意味确切的实际定价。 这些只是为了演示如何在 Microsoft Fabric 中估算、规划和管理数据工厂项目的成本。 此外,由于 Fabric 容量在各个区域之间定价不同,因此我们使用美国西部 2(典型的 Azure 区域)的 Fabric 容量即用即付定价,即每小时每 CU 0.18 美元。 请参阅此处的 Microsoft Fabric - 定价,以了解其他 Fabric 容量定价选项。

配置

要完成此方案,需使用以下配置创建一个管道:

Screenshot showing the configuration of a pipeline copying Parquet data from ADLS Gen2 to a data warehouse with staging.

使用 Fabric 指标应用估算成本

Screenshot showing the duration and CU consumption of the job in the Fabric Metrics App.

数据移动操作使用 267,480 CU 秒,持续时间1504.42 秒(25.07 分钟),而活动运行操作为 null,因为管道运行中未发生任何非复制活动。

注意

尽管报告为指标,但在使用 Fabric 指标应用计算有效 CU 小时数时,运行的实际持续时间并不相关,因为它同时报告的 CU 秒指标已考虑到其持续时间。

指标 数据移动操作
CU 秒 267,480 CU 秒
有效 CU 小时数 (267,480) / (60*60) CU 小时 = 74.3 CU 小时

按 0.18 美元/CU 小时计算的总运行成本 =(74.3 CU 小时)*(0.18 美元/CU 小时)~= 13.37 美元