教程第 5 部分:使用 Power BI 报表可视化预测

在本教程中,你将根据第 4 部分:执行批处理评分并将预测保存到湖屋中生成的预测数据创建 Power BI 报表。

将了解如何执行以下操作:

  • 根据预测数据创建语义模型。
  • 向 Power BI 中的数据添加新度量值。
  • 创建 Power BI 报表。
  • 向报表添加可视化效果。

先决条件

这是系列教程的第 5 部分(共 5 部分)。 若要完成本教程,请先完成:

创建语义模型

创建链接到第 4 部分生成的预测数据的新语义模型:

  1. 在左侧选择你的工作区。

  2. 在左上角,选择湖屋作为筛选器。

  3. 选择在系列教程之前部分中使用的湖屋。

  4. 选择顶部功能区上的“新建语义模型”

    Screenshot of the lakehouse UI home, showing where to select the New semantic model option on the ribbon.

  5. 为语义模型命名,例如“bank churn predictions”。然后选择 customer_churn_test_predictions 数据集。

    Screenshot of the New semantic model dialog box, showing where to select the correct data and select Continue.

  6. 选择“确认”。

添加新度量值

现在,向语义模型添加一些度量值:

  1. 为流失添加新度量值。

    1. 在顶部功能区中选择新度量值。 此操作将名为 Measure 的新项添加到 customer_churn_test_predictions 数据集,并打开表上方的编辑栏。

      Screenshot show creating a new measure.

    2. 为确定平均预测的流失,请将公式栏中的 Measure = 替换为:

      Churn Rate = AVERAGE(customer_churn_test_predictions[predictions])
      
    3. 若要应用公式,请在公式栏中选择复选标记。 新度量值将出现在数据表中。 计算器图标显示它已创建为度量值。

    4. “属性”窗格中,将格式从“常规”更改为“百分比”

    5. “属性”面板中向下滚动,将“小数位数”更改为 1。

      Screenshot show the new Churn Rate measure with properties set.

  2. 新增用于计算银行客户总数的度量值。 对于其余的新度量值,需要用到它。

    1. 在顶部功能区中选择“新建度量值”,向 customer_churn_test_predictions 数据集添加名为“Measure”的新项。 此操作还会在表上方打开公式栏。

    2. 每个预测代表一个客户。 若要确定客户总数,请将公式栏中的 Measure = 替换为:

      Customers = COUNT(customer_churn_test_predictions[predictions])
      
    3. 在公式栏中选中复选标记以应用公式。

  3. 添加德国的流失。

    1. 在顶部功能区中选择“新建度量值”,向 customer_churn_test_predictions 数据集添加名为“Measure”的新项。 此操作还会在表上方打开公式栏。

    2. 为确定德国的流失,请将公式栏中的 Measure = 替换为:

      Germany Churn = CALCULATE(customer_churn_test_predictions[Churn Rate], customer_churn_test_predictions[Geography_Germany] = 1)
      

      这会将行筛选以德国作为其地理位置(Geography_Germany 等于 1) 的行。

    3. 若要应用公式,请在公式栏中选择复选标记。

  4. 重复上述步骤,添加法国和西班牙的流失。

    • 西班牙的流失:

      Spain Churn = CALCULATE(customer_churn_test_predictions[Churn Rate], customer_churn_test_predictions[Geography_Spain] = 1)
      
    • 法国的流失:

      France Churn = CALCULATE(customer_churn_test_predictions[Churn Rate], customer_churn_test_predictions[Geography_France] = 1)
      

新建报表

完成所有操作后,在顶部功能区上选择“创建报表”,转到 Power BI 报表创建页。

Screenshot shows how to create a report.

在报表页出现后,添加以下视觉对象:

  1. 选择顶部功能区中的文本框并输入报表的标题,例如 "Bank Customer Churn"。 更改“格式”面板中的字号和背景色。 选择文本并使用格式栏以调整字号和颜色。

  2. 在“可视化效果”面板中,选择“卡片”图标。 在“数据”窗格中,选择“流失”。 更改“格式”面板中的字号和背景色。 将此可视化效果拖到报表的右上角。

    Screenshot shows addition of Churn Rate card.

  3. 在“可视化效果”面板中,选择“折线图和堆积柱形图”图标。 为 x 轴选择“年龄”,为 列 y 轴选择“流失”,为行 y 轴选择“客户”

    Screenshot shows addition of a stacked column chart for Age.

  4. 在“可视化效果”面板中,选择“折线图和堆积柱形图”图标。 为 x 轴选择“产品数”,为 列 y 轴选择“流失”,为行 y 轴选择“客户”

    Screenshot shows addition of a stacked column chart of NumOfProducts.

  5. 在“可视化效果”窗格中,选择“堆积柱状图”图标。 为 x 轴选择 NewCreditsScore ,为 y 轴选择 流失

    Screenshot shows adding a stacked column chart of NewCreditScore.

    在“格式”面板中将标题“NewCreditsScore”更改为“Credit Score”。

    Screenshot shows changing the title for the chart.

  6. 在“可视化”面板中,选择“簇状柱形图”卡片。 依次为 y 轴选择“德国流失”“西班牙流失”“法国流失”

    Screenshot shows the clustered column chart.

注意

此报表举例说明了如何分析 Power BI 中保存的预测结果。 但是,对于真实的客户流失用例,你可能需要根据自己的主题专业知识以及贵公司与业务分析团队已标准化为指标的内容,对要创建的可视化对象进行更彻底的构思。

Power BI 报表显示:

  • 使用两个以上的银行产品的客户的流失率较高,尽管很少有客户拥有两个以上的产品。 银行应该收集更多的数据,但也要调查与更多产品相关的其他特征(见左下角面板中的绘图)。
  • 德国的银行客户流失率高于法国和西班牙(见右下角面板中的绘图),这表明对促成客户流失的原因进行调查可能是有益的。
  • 中年客户更多(25-45 岁之间),45-60 岁之间的客户往往更容易流失。
  • 最后,信用分数较低的客户很可能停止与该银行业务往来,而改投其他金融机构。 该银行应该研究如何鼓励信用评分和账户余额较低的客户留在银行。

后续步骤

到此已完成五部分教程系列。 请参阅其他端到端示例教程: