本教程概述了使用具体化湖视图实现奖牌体系结构的步骤和注意事项。 本教程结束时,你将了解具体化湖视图的主要特性和功能,并能够创建自动化数据转换工作流。 本教程不是参考体系结构、特性和功能的详尽列表或具体最佳做法的建议。
先决条件
作为本教程的先决条件,请完成以下步骤:
- 登录到 Power BI 帐户,或者如果还没有帐户,请注册免费试用版。
- 在租户中启用 Microsoft Fabric。 选择屏幕左下角的默认 Power BI 图标,然后选择 Fabric。
- 创建已启用 Microsoft Fabric 的工作区。
- 从“工作区”选项卡中选择工作区,然后选择“ + 新建 项”,然后选择 “数据管道”。 提供管道的名称,然后选择“ 创建”。
- 创建启用了架构的 Lakehouse 。 将其命名为 SalesLakehouse ,并将示例数据文件加载到 Lakehouse 中。 有关详细信息,请参阅 Lakehouse 教程。
场景概述
在本教程中,你将以虚构零售组织 Contoso 为例,该组织使用奖牌体系结构进行数据分析,以获取对其零售销售运营的可作见解。 它旨在简化分析过程,通过将数据组织到三个层(青铜(原始数据)、白银(清理和扩充的数据)和黄金(聚合和分析的数据)来简化分析过程,并生成对业务绩效的更深入的见解。
下图表示 SalesLakehouse 中每层奖牌体系结构中的不同实体:
实体
订单:此实体包括有关每个客户订单的详细信息,例如订单日期、发货详细信息、产品类别和子类别。 可以绘制见解来优化发货策略、识别热门产品类别和改进订单管理。
销售:通过分析销售数据,Contoso 可以评估关键指标,例如总收入、利润率、订单优先级和折扣。 这些因素之间的关联可以更清楚地了解客户购买行为和折扣策略的效率。
位置:这会捕获销售和订单的地理维度,包括城市、州、地区和客户细分市场。 它可帮助 Contoso 识别高性能区域、解决低性能区域以及针对特定客户细分的个性化策略。
代理性能:通过有关代理管理交易、其佣金和销售数据的详细信息,Contoso 可以评估单个代理性能、激励高性能者,以及设计有效的佣金结构。
代理佣金:合并佣金数据可确保透明度,并实现更好的成本管理。 了解佣金率与代理性能之间的关联有助于优化奖励系统。
示例数据集
Contoso 在 ADLS Gen2 中以 CSV 格式维护其零售作原始数据。 我们利用这些数据来创建铜层,然后使用铜层创建物化湖视图,形成奖牌架构的银层和金层。 首先从 Fabric 示例存储库下载示例 CSV 文件。
创建管道
高级步骤如下所示:
- 青铜层:将原始数据以 CSV 文件的形式引入湖仓。
- 银层:使用具体化湖视图清理数据。
- 黄金层:使用物化数据湖视图整理数据,以便进行分析和报告。
创建销售分析奖章体系结构的铜层
将对应于不同实体的 CSV 文件从下载的数据加载到 Lakehouse。 为此,请导航到您的 Lakehouse,并将下载的数据上传到 Lakehouse 的文件部分。 它创建名为 tutorial 的文件夹。
接下来,在 “表” 部分为其创建一个快捷方式。 选择“表”部分旁边的...,然后选择“新建架构快捷方式”,然后Microsoft OneLake。 从数据源类型中选择 SalesLakehouse 。 展开“ 文件” 部分,选择 教程 文件夹,然后选择“ 创建”。 还可以使用其他备用 选项将数据引入 Lakehouse。
在 “表” 部分中,将 教程 文件夹重命名为 青铜。
创建银层和金层的徽章结构
将下载的笔记本文件上传到工作区。
从 Lakehouse 打开笔记本。 有关详细信息,请参阅 使用笔记本探索湖仓数据。
使用 Spark SQL 运行笔记本中的所有单元格,以创建具有数据质量约束的物化湖视图。 成功执行所有单元格后,刷新 SalesLakehouse 源,以查看为 银 和 金 架构新建的物化湖泊视图。
安排管道
创建银层和金层的具体化湖视图后,导航到湖屋并选择 “托管具体化湖视图 ”以查看世系视图。 它根据依赖项自动生成,每个依赖的具体化湖视图构成了世系的节点。
从导航功能区中选择 “计划 ”。 启用刷新功能,并配置计划。
监视和故障排除
下拉菜单列出当前和历史的执行记录。
通过选择任一运行的实例,可以在右侧面板中找到实体化湖景的详细信息。 底部活动面板提供节点执行状态的高级概述。
选择世系中的任何节点以查看节点执行详细信息并链接到详细日志。 如果节点状态为 “失败”,则还会显示错误消息。
选择 “详细日志 ”链接会将你重定向到 Monitor Hub ,可从中访问 Spark 错误日志,以便进一步进行故障排除。
选择具体化湖视图页面功能区上的 “数据质量报表 ”按钮,以创建或查看自动生成的数据质量报表。