教程:适用于 Power BI 的 Fabric 用户

本教程介绍如何使用数据流 Gen2 和管道将数据引入湖屋并创建维度模型。 你还将了解如何自动生成美观的报表,以在短短 45 分钟内从头到尾显示最新的销售数据。

让我们开始吧。

  • 准备数据并将其加载到湖屋
  • 在湖屋中构建维度模型
  • 使用快速创建功能自动创建报表

先决条件

创建用于存储数据的湖屋

首先,我们将创建用于存储数据的湖屋、用于准备和转换列的数据流 Gen2,以及用于处理计划刷新和电子邮件活动的编排的管道。


  1. 导航到工作区并选择“新建”。 然后选择“更多选项”

    新项菜单中的“更多选项”的屏幕截图。

  2. 在“新建”项创建屏幕中,选择“数据工程”类别下的“湖屋”。

    “数据工程”项的屏幕截图。

  3. 将湖屋名称设置为 SalesLakehouse。 然后选择“创建”。

    命名湖屋的屏幕截图。

  4. 进入湖屋编辑器后,选择“新建数据流 Gen2”。

    备注

    还可以从功能区中选择“获取数据”,然后选择“新建数据流 Gen2”。

    湖屋编辑器中“获取数据”下拉列表的屏幕截图。

准备数据并将其加载到湖屋

请执行以下步骤以将数据加载到湖屋:

  1. 进入数据流 Gen2 的 Power Query 联机编辑器后,选择“从 Power Query 模板导入”,然后选择从先决条件下载的模板文件。

    数据流 Gen2 编辑器中的水印的屏幕截图。

  2. 在“数据加载”查询组下选择“DimDate”查询,然后选择“配置连接”。 如有必要,请在选择“连接”之前将身份验证类型设置为“匿名”。

    “配置连接”菜单的屏幕截图。

  3. 选择 DimDate 查询后,在数据预览窗口中,通过选择左上角的图标,将 DateKey 列的数据类型更改为“日期/时间”。

    显示在 Power Query 编辑器中更改数据类型的屏幕截图。

  4. 选择“更改列类型”窗口中的“替换当前”。

    “更改列类型”菜单的屏幕截图。

添加数据目标

请执行以下步骤以添加数据目标:

  1. 选择 DimDate 表后,从“开始”选项卡中选择“添加数据目标”,然后选择“湖屋”选项菜单项。

    获取数据目标湖屋选项的屏幕截图。

  2. 如有必要,请将身份验证设置为“组织帐户”,然后选择“下一步”。

    “连接到数据目标”菜单的屏幕截图。

  3. 在导航器中,选择用于本教程的工作区,然后展开以查看所有湖屋项。 选择“SalesLakehouse”并确认已选择默认的“新建表”,然后选择“下一步”继续。

    目标导航器项目的屏幕截图。

  4. 将“更新方法”设置为“替换”,然后选择“保存设置”。

    注意

    将更新方法设置为“替换”将删除所有现有数据,并在每次后续刷新时将其替换为新数据。

    目标设置菜单选项的屏幕截图。

    备注

    Power Query 联机编辑器的右下角,可以找到为查询配置的“数据目标”设置,可在其中进一步自定义或删除。

    已配置的数据目标的屏幕截图。

  5. 在进入本教程的下一节之前,请确保执行与本节前面相同的步骤,以将湖屋配置为以下每个查询的数据目标。

    查询
    DimCustomer
    DimEmployee
    DimProduct
    DimStore
  6. 选择“数据转换”查询组下的 FactOnlineSales 查询。 从“主页”选项卡中,选择“添加数据目标”。 选择“湖屋”选项

    数据目标湖屋目标选项的屏幕截图。

  7. 如有必要,请将身份验证设置为“组织帐户”,然后选择“下一步”。

    “连接到数据目标”菜单的屏幕截图。

  8. 在导航器中,选择用于本教程的工作区,然后展开以查看所有湖屋项。 选择“SalesLakehouse”并确认已选择默认的“新建表”,然后选择“下一步”继续。

    目标导航器窗口的屏幕截图。

  9. 将“更新方法”设置为“追加”,然后选择“保存设置”。

    备注

    此过程将插入数据,并在每次后续刷新时保留表中的现有行。

    目标设置菜单选择的屏幕截图。

  10. 选择“发布”以保存数据流并退出 Power Query 联机编辑器。

    Power Query 联机中的“发布”按钮的屏幕截图。

  11. 将鼠标悬停在工作区中创建的数据流上方,选择省略号 (...) 和“属性”选项。

    工作区中的数据流属性的屏幕截图。

  12. 将数据流的名称更改为 OnlineSalesDataflow,然后选择“保存”。

    “为数据流重命名”选项的屏幕截图。

协调数据管道

使用管道,我们首先将协调数据流的刷新。 如果发生错误,我们将发送包含重要详细信息的自定义 Outlook 电子邮件。

  1. 在工作区中选择名为“SalesLakehouse”的湖屋项。

    为现有数据流重命名的屏幕截图。

  2. 进入湖屋编辑器后,选择“新建数据流 Gen2”。

    备注

    还可以从功能区中选择“获取数据”,然后选择“新建数据管道”。

    湖屋编辑器中的水印的屏幕截图。

  3. 将管道名称设置为“SalesPipeline”。 然后选择“创建”。

    管道名称菜单选项的屏幕截图。

  4. 选择“取消”以关闭复制数据助手。 如果系统提示确认退出复制数据窗口,请选择“是,取消”。

    复制数据助手菜单的屏幕截图。

  5. 进入管道编辑器后,选择“添加管道活动”,然后选择“数据流”。

    备注

    还可以从功能区中选择“数据流”。

    管道水印画布和“添加活动”选项的屏幕截图。

  6. 在管道编辑器中选择数据流活动,然后在“常规”部分中将其“名称”值更改为“OnlineSalesActivity”。

    数据流名称值的屏幕截图。

  7. 在数据流活动仍处于选中状态的情况下,选择“设置”,然后从“数据流”列表中选择“OnlineSalesDataflow”。 如果需要更新列表,请选择“刷新”图标。

    数据流选择设置的屏幕截图。

  8. 选择“活动”选项卡,然后选择“Office365 Outlook 活动”。

    备注

    如果出现“授予同意”窗口,请选择“确定”,使用组织帐户登录,然后选择“允许访问”。

    Office365 Outlook 活动信息的屏幕截图。

  9. 在管道编辑器中选择“Office365 Outlook”活动,然后在“常规”部分中将其“名称”值更改为“失败时发送邮件”。

    Office365 Outlook 活动名称的屏幕截图。

  10. 在 Office365 Outlook 活动仍处于选中状态的情况下,选择“设置”。 将“收件人”字段更新为电子邮件地址,并将“主题”更改为“管道故障”。 为邮件正文选择“添加动态内容 [Alt+Shift+D]”。

    备注

    “高级”属性提供了更多电子邮件配置选项,例如“发件人(代理发送)”、“抄送”、“密件抄送”、“敏感度标签”等。

    Office365 Outlook 设置的屏幕截图。

  11. 在“管道表达式生成器”中,粘贴以下表达式代码块:

    @concat(
        'Pipeline: '
        , 
        , '<br>'
        , 'Workspace: '
        , 
        , '<br>'
        , 'Time: '
        , 
    )
    

    具有表达式生成器的 Office365 Outlook 活动的屏幕截图。

  12. 选择“系统变量”,然后通过从下表中选择相应的名称来插入以下变量。

    值名称 系统变量
    管道: 3 管道 ID
    工作区: 6 工作区 ID

    管道系统变量的屏幕截图。

  13. 选择“函数”,然后通过从下表中选择相应的名称来插入以下函数。 完成后选择“确定”。

    值名称 系统变量
    时间: 9 utcnow

    管道函数的屏幕截图。

  14. 选择 OnlineSalesActivity。 从可用路径选项中,选择“’X’ (失败时)”。 这会创建一个放置在“失败时发送邮件”活动上的箭头。 如果 OnlineSalesActivity 失败,则会立即调用此活动

    失败时路径的屏幕截图。

  15. 从“开始”选项卡中,选择“计划”。 更新以下配置后,请选择“应用”以保存更改

    名称
    计划的运行
    Repeat 每天
    时间 12:00:00 凌晨

    失败时分支的屏幕截图。

  16. 从“主页”选项卡中,选择“运行”。 如果显示对话框窗口,请选择“保存并运行”选项以继续。

    “主页”选项卡中的“运行”选项的屏幕截图。

    若要监视管道的当前状态,可以查看“输出”表,其中显示了当前活动进度。 该表将定期自行刷新,你也可以手动选择刷新图标进行更新。

    当前管道活动进度的屏幕截图。

  17. 当状态返回“成功”时,可以通过返回到工作区继续学习本教程的下一节内容。

    显示侧轨和工作区选择的屏幕截图。

在湖屋中创建语义模型

加载的数据基本已经可用于报表。 首先,让我们使用 SQL 终结点在湖屋中创建关系和 SQL 视图。 它使我们能够在语义模型中轻松访问数据,语义模型是一种元数据模型,其中包含被抽象化并修改为逻辑维度的物理数据库对象。 它旨在根据业务结构呈现数据以供分析。

创建关系

此模型是你可能会在数据仓库中看到的星型架构:它像一颗星星。 星星的中心是事实数据表。 周围的表称为维度表,它们通过关系与事实数据表关联。


  1. 在工作区视图中,选择名为“SalesLakehouse”的 SQL 终结点项。

    工作区中 SQL 终结点项的屏幕截图。

  2. 进入资源管理器后,选择屏幕底部的“模型”视图,以开始创建关系。

    显示模型视图选择的屏幕截图。

  3. 通过将列“CustomerKey”从 FactOnlineSales 表拖放到 DimCustomer 表上的“CustomerKey”来创建关系。

  4. 进入“创建关系”窗口后,请确保选择正确的表、列和设置,如下表所示。 选择“确认”以继续操作。

    激活此关系 发件人:表 1(列) 收件人:表 2(列) 基数 交叉筛选器方向
    FactOnlineSales (CustomerKey) DimCustomer (CustomerKey) 多对一(*:1) Single

    FactOnlineSales 和 DimCustomer 表之间的关系的屏幕截图。

  5. 对下表中列出的每个剩余表和列执行上述相同的步骤以创建关系。

    激活此关系 发件人:表 1(列) 收件人:表 2(列) 基数 交叉筛选器方向
    FactOnlineSales (ProductKey) DimProduct (ProductKey) 多对一(*:1) Single
    FactOnlineSales (StoreKey) DimStore (StoreKey) 多对一(*:1) Single
    FactOnlineSales (DateKey) DimDate (DateKey) 多对一(*:1) Single
    DimStore (StoreKey) DimEmployee (StoreKey) 多对一(*:1) 推送、请求和匿名

    下图显示了语义模型的已完成视图,其中包含所有已创建的关系。

    模型视图窗格中表关系的屏幕截图。

使用 DAX 编写度量值

我们来编写一个基本度量值,用于计算总销售额。

  1. 选择“”文件夹中的“FactOnlineSales”表。 在“主页”选项卡上,选择“新建度量值”。

    模型视图中表关系的屏幕截图。

  2. 在公式编辑器中,复制并粘贴或键入以下度量值以计算总销售额。 选中复选标记以提交。

    DAX
    Total Sales Amount = SUM(FactOnlineSales[SalesAmount])
    

    选中复选标记以提交 DAX 度量值的屏幕截图。

创建 SQL 视图

让我们编写一个按月计算总销售额的 SQL 语句。 然后,我们会将此语句另存为湖屋中的视图。 这样我们就能轻松访问将来按月计算的总销售额。

  1. 在“主页”选项卡上,选择“新建 SQL 查询”。

    “主页”选项卡中“新建 SQL 查询”的屏幕截图。

  2. 在查询编辑器中,复制并粘贴或键入此查询,以按月份降序计算总销售额。 输入后,选择“运行”以查看结果。

    SQL
    SELECT 
    MONTH(DateKey) as "MonthNumber",
    SUM(SalesAmount) as "TotalSalesAmount"
    FROM FactOnlineSales
    GROUP BY MONTH(DateKey)
    

    SQL 查询编辑器的屏幕截图。

  3. 突出显示完整的查询文本,然后选择“另存为视图”。

    “另存为视图”选项的屏幕截图。

  4. 在“另存为视图”窗口中,将“视图名称”设置为“TotalSalesByMonth”,然后选择“确定”。

    “另存为视图”窗口的屏幕截图。

  5. 在资源管理器中,展开“视图”部分,然后选择“TotalSalesByMonth”,以在“数据预览”中查看结果。

    湖屋资源管理器“视图”部分的屏幕截图。

    浏览完 SQL 终结点编辑器后,可以通过返回到工作区继续学习本教程的下一节内容。

    显示侧轨和工作区选择的屏幕截图。

自动创建报表

现在,你已对数据建模,接下来可以使用快速创建功能来可视化和浏览数据。


  1. 在工作区视图中,将鼠标悬停在项类型“数据集(默认)”和项名称“SalesLakehouse”上。 选择省略号 ( … ) 并选择“自动创建报表”。

    工作区中“自动创建报表”选项的屏幕截图。

    系统将自动生成一个报表,后者将根据“你的数据”窗格中的列选择进行动态更新。

    • 显示的报表可能与该图不同。

    已完成的自动创建报表的屏幕截图。

  2. 从功能区中选择“保存”以将副本保存到当前工作区

    • 若要进入完整的视觉对象创作体验,可以在功能区上选择“编辑”。

    可视化数据时“保存”按钮的屏幕截图。

  3. 在“保存报表”对话框中,在“为报表输入名称”字段中键入“销售汇总”。 完成后,选择“保存”。

    可视化数据时用于完成相关过程的“保存”按钮的屏幕截图。

你可以详细了解快速创建功能

恭喜你完成本教程。 如果为本教程创建了工作区,则可以选择立即将其删除。 或者,可以删除在本教程期间创建的各个项。

我们希望 Power BI 用户能够通过本教程了解如何使用 Microsoft Fabric 轻松提供对任何规模级别的数据的见解。