利润图(Analysis Services - 数据挖掘)

在数据挖掘设计器的**“挖掘准确性图表”选项卡的“提升图”选项卡中,可以查看两种类型的图表:提升图和利润图。配置完要使用的模型和数据源后,可以选择所需的图表类型。从列表中选择“利润图”后,会自动打开“利润图设置”对话框。如果设置了定义利润图的参数,则“挖掘准确性图表”**选项卡中显示的图表将自动更改为利润图。

应用场景

利润图显示与使用挖掘模型相关联的估计利润增长。例如,如果模型预测公司应在企业方案中联系哪些客户,则利润图将合并关于联系 x 客户数的目标邮递活动的执行成本的信息,然后计算估计的利润。典型的利润图将显示利润在到达峰值点之前的增长情况,到达该点之后利润将随着所联系总体的增多而减少。

例如,在数据挖掘基础教程中,创建决策树模型 TM_Decision Tree,该模型预测比较有可能购买自行车的 AdventureWorks 预期客户。若要生成表示仅向这些客户发送邮件的成本和收益的利润图,可以按照用于生成提升图的一般步骤进行操作,然后配置利润图特有的设置。完成设置图表参数后,图表将自动更改为利润图。以下关系图基于如下假设:

设置

应使用哪一模型?

TM_DecisionTree

应预测什么值?

[Bike Buyer] =1,表示可能购买自行车的客户

应将哪一数据集用于评估准确性?

若要评估准确性和潜在利润,应使用在创建挖掘结构时保存的测试集。

实际创建邮件时,应使用不同的数据集/

何为目标总体?

应仅向数据库所有客户中的 20,000 个客户发送目标邮件。

为 20,000 人设立目标邮递活动的一次性成本是多少?

500

目标邮递活动的单位成本是多少?

该成本将乘以一个小于或等于 20,000 的数,具体数字取决于模型预测的客户中有多少个是合适的候选者。

3

成功的结果中应该有多少利润或收入?

该数目将用于预计与高概率事例关联的总利润。

25

了解利润图

图表中的 Y 轴表示利润,而 X 轴表示公司所联系总体的百分比。

简单利润图的示例

利润图中包含一条灰色竖线,用于标记目标总体的百分比。可以通过单击图表中的某个位置来移动该线。每次移动该线时,**“挖掘图例”**都会更新以显示百分比值、利润得分和与灰色竖线上的总体百分比关联的预测概率。如果将灰线移到图表中的最大利润点,则可以使用预测概率值来确定联系客户的策略。

百分比事例

序列、模型

利润

预测概率

30

  

$103,000

67.23%

40

TM_Decision Tree

$128,500

60.90%

50

  

$149,500

50.70%

60

  

$168,000

44.05%

通过对此图进行试验,可以确定利润曲线的峰值位于总体的 55% 处,并且相关联的预测概率为 20%。这些结果指示,若要获取最大利润,应只联系其响应率被预测为 20% 或更大几率的客户。

创建利润图

若要创建利润图,请按照以下基本步骤进行操作:

  1. 在**“输入选择”**上,选择一个或多个模型。

  2. 选择一个可预测属性。

  3. 还可以选择指定要预测的值。

  4. 选择评估中要使用的数据源。

  5. 通过单击**“提升图”**更改为图表视图。

  6. 在**“提升图”选项卡中,通过单击“图表类型”**列表选择所需的图表类型。

  7. 配置特定于利润图的选项。

有关如何创建所有图表类型的分步说明,请参阅如何为挖掘模型创建准确性图表。数据挖掘基础教程还包含如何创建提升图的演练。有关详细信息,请参阅测试提升图的准确性(数据挖掘基础教程)

下面的列表介绍可以在**“利润图设置”**对话框中设置的参数。

  • 总体
    创建提升图时要使用的数据集中的事例数。

    该模型总是按概率降低的顺序选择事例,也就是说,如果正在评估潜在客户并且选择的数字仅表示客户数据库中记录数的一半,则该模型将在最适合于您的模型的事例子集上度量准确性。

    这是因为当使用该模型生成邮件或者创建活动时,将使用与每个事例关联的预测概率,以仅针对做出积极响应的概率最大的那些客户。

  • 固定成本
    与业务问题关联的固定成本。

    如果针对的是目标邮递解决方案,则固定成本可能表示打印机设置费用,其中包含准备促销邮件的初始成本。

    此成本一次性应用于整个目标总体。

  • 单项成本
    除固定成本之外的成本,可以与每次客户联系相关联。例如,可以输入促销邮件的邮费或者打电话的成本。

    此成本必须与整体目标总体相同。每个值与目标事例数相乘。

  • 单项收入
    与每次成功销售相关联的收入额。