第 2 课:向市场篮挖掘结构中添加挖掘模型
在本课中,将在第 1 课:创建市场篮挖掘模型中创建的市场篮挖掘结构中添加两个挖掘模型。 您可以通过这些挖掘模型创建预测。
若要预测客户通常会同时购买的产品类型,您需要使用 Microsoft 关联算法 和 MINIMUM_PROBABILTY 参数的两个不同的值创建两个挖掘模型。
MINIMUM_PROBABILTY 是 Microsoft 关联算法参数,有助于通过指定某个规则必须具有的最小概率来确定挖掘模型包含的规则数。 例如,如果此值设置为 0.4,则表明仅当规则所描述的产品组合具有至少 40% 的发生概率时才可生成此规则。
您将在下一课中查看更改 MINIMUM_PROBABILTY 参数所产生的影响。
ALTER MINING STRUCTURE 语句
若要向挖掘结构中添加包含嵌套表的挖掘模型,您需要使用 ALTER MINING STRUCTURE (DMX) 语句。 可以将语句中的代码分为下列几部分:
标识挖掘结构
命名挖掘模型
定义键列
定义输入列和可预测列
定义嵌套表列
标识算法和参数更改
下面是 ALTER MINING STRUCTURE 语句的一般示例,它将包含嵌套表列的挖掘模型添加到结构中:
ALTER MINING STRUCTURE [<Mining Structure Name>]
ADD MINING MODEL [<Mining Model Name>]
(
[<key column>],
<mining model column> <usage>,
<table columns>
( [<nested key column>],
<nested mining model columns> )
) USING <algorithm>( <algorithm parameters> )
上述代码的第一行标识要向其添加挖掘模型的现有挖掘结构:
ALTER MINING STRUCTURE [<mining structure name>]
代码的第二行对将要添加到挖掘结构中的挖掘模型进行命名:
ADD MINING MODEL [<mining model name>]
有关在数据挖掘扩展插件 (DMX) 中命名对象的信息,请参阅标识符 (DMX)。
代码的接下来的各行对挖掘结构中将由挖掘模型使用的各列进行定义:
[<key column>],
<mining model columns> <usage>,
您可以只使用挖掘结构中已有的列。
挖掘模型列的列表中的第一列必须为挖掘结构中的键列。 但是,您不必在键列后键入 KEY 来指定用法。 这是因为您在创建挖掘结构时已将列定义为键。
其他行指定新挖掘模型中的列的用法。 您可以使用以下语法指定将挖掘模型中的一列用于预测:
<column name> PREDICT,
如果没有指定用法,则不必在列表中包含数据挖掘结构列。 由引用的数据挖掘结构所使用的所有列可自动用于基于该结构的挖掘模型中。 但是,除非您指定用法,否则模型不会将这些列用于定型。
代码的最后一行定义将用于生成挖掘模型的算法和算法参数。
) USING <algorithm>( <algorithm parameters> )
课程任务
在本课中,您将执行以下任务:
使用默认的概率向结构中添加关联挖掘模型
使用修改的概率向结构中添加关联挖掘模型
使用默认的 MINIMUM_PROBABILITY 向结构中添加关联挖掘模型
第一个任务是使用 MINIMUM_PROBABILITY 的默认值,根据 Microsoft 关联算法向市场篮挖掘结构中添加新的挖掘模型。
添加关联挖掘模型
在对象资源管理器中,右键单击 Analysis Services 实例,指向**“新建查询”**,再单击 DMX。
将打开查询编辑器,其中包含一个新的空白查询。
注意 若要对特定的 Analysis Services 数据库创建 DMX 查询,请右键单击该数据库而不是右键单击实例。
将 ALTER MINING STRUCTURE 语句的一般示例复制到空白查询中。
将
<mining structure name>
替换为
[Market Basket]
将
<mining model name>
替换为
[Default Association]
将
[<key column>], <mining model columns>, <table columns> ( [<nested key column>], <nested mining model columns> )
替换为
OrderNumber, [Products] PREDICT ( [Model] )
在本例中,[Products] 表已被指定为可预测列。此外,[Model] 列包含于嵌套表列的列表中,原因是它是嵌套表的键列。
注意 请注意,嵌套键不同于事例键。 事例键是事例的唯一标识符,而嵌套键是您想要建模的属性。
将
USING <algorithm>( <algorithm parameters> )
替换为
Using Microsoft_Association_Rules
现在,结果语句应该如下所示:
ALTER MINING STRUCTURE [Market Basket] ADD MINING MODEL [Default Association] ( OrderNumber, [Products] PREDICT ( [Model] ) ) Using Microsoft_Association_Rules
在**“文件”菜单中,单击“DMXQuery1.dmx 另存为”**。
在**“另存为”**对话框中,浏览到相应的文件夹,并将文件命名为 Default_Association_Model.dmx。
在工具栏中,单击**“执行”**按钮。
向结构中添加关联挖掘模型并更改默认的 MINIMUM_PROBABILITY
下一个任务是根据 Microsoft 关联算法,向市场篮挖掘结构中添加新的挖掘模型,并将 MINIMUM_PROBABILITY 的默认值改为 0.01。 更改参数会导致 Microsoft 关联算法创建更多的规则。
添加关联挖掘模型
在对象资源管理器中,右键单击 Analysis Services 实例,指向**“新建查询”**,再单击 DMX。
将打开查询编辑器,其中包含一个新的空白查询。
将 ALTER MINING STRUCTURE 语句的一般示例复制到空白查询中。
将
<mining structure name>
替换为
Market Basket
将
<mining model name>
替换为
[Modified Association]
将
<mining model columns>, <table columns> ( [<nested key column>], <nested mining model columns> )
替换为
OrderNumber, [Products] PREDICT ( [Model] )
在本例中,[Products] 表已被指定为可预测列。 此外,[MODEL] 列包含于列表中,原因在于它是嵌套表的键列。
将
USING <algorithm>( <algorithm parameters> )
替换为
USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
现在,结果语句应该如下所示:
ALTER MINING STRUCTURE [Market Basket] ADD MINING MODEL [Modified Assocation] ( OrderNumber, [Products] PREDICT ( [Model] ) ) USING Microsoft_Association_Rules (Minimum_Probability = 0.1)
在**“文件”菜单中,单击“DMXQuery1.dmx 另存为”**。
在**“另存为”**对话框中,浏览到相应的文件夹,并将文件命名为 Modified Association_Model.dmx。
在工具栏中,单击**“执行”**按钮。
在下一课中,您将处理市场篮挖掘结构及其关联的挖掘模型。