第 2 课:向自行车购买者挖掘结构添加挖掘模型

在本课中,您将向在第 1 课:创建自行车购买者挖掘结构中创建的自行车购买者挖掘结构中添加两个挖掘模型。您可以使用其中的一个模型浏览数据,使用另一个模型创建预测。

为了研究如何能够将潜在客户按其特征分类,将根据 Microsoft 聚类分析算法创建一个挖掘模型。在下一课中,您将研究该算法如何查找具有类似特征的客户群。例如,您可能发现某些客户住得比较近,骑自行车上下班,并且具有类似的教育背景。可以使用这些客户群更好地了解不同客户之间的关系,并使用此信息创建面向特定客户的营销策略。

为了预测潜在客户是否可能购买自行车,将基于 Microsoft 决策树算法创建一个挖掘模型。该算法会通查与每位潜在客户关联的信息,并查找有助于预测客户是否会购买自行车的特征。然后将先前的自行车购买者的特征值与潜在的新客户的特征值进行比较,确定潜在的新客户是否可能购买自行车。

ALTER MINING STRUCTURE 语句

为了向挖掘结构中添加挖掘模型,可以使用 ALTER MINING STRUCTURE (DMX) 语句。可以将语句中的代码分为下列几部分:

  • 标识挖掘结构

  • 命名挖掘模型

  • 定义键列

  • 定义输入列和可预测列

  • 标识算法和参数更改

下面是 ALTER MINING MODEL 语句的一般示例:

ALTER MINING STRUCTURE [<mining structure name>]
ADD MINING MODEL [<mining model name>]
(
    [<key column>],
    <mining model columns>,
) USING <algorithm name>( <algorithm parameters> )
WITH FILTER (<expression>)

代码的第一行标识将向其添加挖掘模型的现有挖掘结构:

ALTER MINING STRUCTURE [<mining structure name>]

代码的第二行命名将添加到挖掘结构中的挖掘模型:

ADD MINING MODEL [<mining model name>]

有关在 DMX 中命名对象的信息,请参阅标识符 (DMX)

代码的接下来的各行定义挖掘结构中将由挖掘模型使用的各列:

[<key column>],
<mining model columns>

您只能使用挖掘结构中现有的各列,列表中的第一列必须是挖掘结构中的键列。

代码的下一行定义生成挖掘模型的挖掘算法以及可以对算法设置的算法参数:

) USING <algorithm name>( <algorithm parameters> )

有关可以调整的算法参数的详细信息,请参阅 Microsoft 决策树算法Microsoft 聚类分析算法

您可以使用以下语法指定将挖掘模型中的一列用于预测:

<mining model column> PREDICT

代码的最后一行是可选的,用于定义在定型和测试模型时应用的筛选器。有关如何向挖掘模型应用筛选器的详细信息,请参阅为挖掘模型创建筛选器(Analysis Services – 数据挖掘)

课程任务

在本课中,您将执行以下任务:

  • 使用 Microsoft 决策树算法向自行车购买者结构中添加决策树挖掘模型

  • 使用 Microsoft 聚类分析算法向自行车购买者结构中添加聚类分析挖掘模型

  • 因为您想查看所有事例的结果,所以不向任何一个模型中添加筛选器。

向结构中添加决策树挖掘模型

第一步是基于 Microsoft 决策树算法添加挖掘模型。

添加决策树挖掘模型

  1. 对象资源管理器中,右键单击 Analysis Services 的实例,指向**“新建查询”**,然后单击 DMX,打开查询编辑器和一个新的空白查询。

  2. 将 ALTER MINING STRUCTURE 语句的一般示例复制到空白查询中。

  3. <mining structure name> 
    

    替换为

    [Bike Buyer]
    
  4. <mining model name> 
    

    替换为

    Decision Tree
    
  5. <mining model columns>,
    

    替换为

    (
       CustomerKey,
       [Age],
       [Bike Buyer] PREDICT,
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]
    

    在本例中,[Bike Buyer] 列被指定为 PREDICT 列。

  6. USING <algorithm name>( <algorithm parameters> ) 
    

    替换为

    Using Microsoft_Decision_Trees
    WITH DRILLTHROUGH
    

    通过 WITH DRILLTHROUGH 语句,您可以浏览用于生成挖掘模型的事例。

    现在,结果语句应该如下所示:

    ALTER MINING STRUCTURE [Bike Buyer]
    ADD MINING MODEL [Decision Tree]
    (
       CustomerKey,
       [Age],
       [Bike Buyer] PREDICT,
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]
    ) USING Microsoft_Decision_Trees
    WITH DRILLTHROUGH
    
  7. 在**“文件”菜单中,单击“DMXQuery1.dmx 另存为”**。

  8. 在**“另存为”**对话框中,浏览到适当的文件夹,并将文件命名为 DT_Model.dmx。

  9. 在工具栏中,单击**“执行”**按钮。

向结构中添加聚类分析挖掘模型

现在可以基于 Microsoft 聚类分析算法向自行车购买者挖掘结构添加挖掘模型。由于聚类分析挖掘模型将使用挖掘结构中定义的所有列,因此,可以省略定义挖掘列,使用快捷方式向结构中添加模型。

添加聚类分析挖掘模型

  1. 对象资源管理器中,右键单击 Analysis Services 的实例,指向**“新建查询”,然后单击“DMX”**,打开查询编辑器和一个新的空白查询。

  2. 将 ALTER MINING STRUCTURE 语句的一般示例复制到空白查询中。

  3. <mining structure name> 
    

    替换为

    [Bike Buyer]
    
  4. <mining model> 
    

    替换为

    Clustering Model
    
  5. 删除以下内容:

    (
        [<key column>],
        <mining model columns>,
    )
    
  6. USING <algorithm name>( <algorithm parameters> )
    

    替换为

    USING Microsoft_Clustering
    

    现在,完整的语句应该如下所示:

    ALTER MINING STRUCTURE [Bike Buyer]
    ADD MINING MODEL [Clustering]
    USING Microsoft_Clustering 
    
  7. 在**“文件”菜单中,单击“DMXQuery1.dmx 另存为”**。

  8. 在**“另存为”**对话框中,浏览到适当的文件夹,并将文件命名为 Clustering_Model.dmx。

  9. 在工具栏中,单击**“执行”**按钮。

在下一课中,您将处理模型和挖掘结构。