为呼叫中心模型创建预测(中间数据挖掘教程)

现在,你已经了解了一些有关班次、作员数、调用和服务等级之间的交互的内容,接下来可以创建一些预测查询,这些查询可用于业务分析和规划。 首先对探索模型创建一些预测,以测试一些假设。 接下来,你将使用逻辑回归模型创建批量预测。

本课程假定你已熟悉预测查询的概念。

使用神经网络模型创建预测

以下示例演示如何使用用于探究的神经网络模型进行单例预测。 单一实例预测是尝试不同值以查看模型中效果的好方法。 在这个场景中,如果有六名经验丰富的操作员值班,你将预测午夜班次(未指定一周的具体日期)的服务等级。

使用神经网络模型创建单例查询

  1. 在 SQL Server Data Tools (SSDT)中,打开包含要使用的模型的解决方案。

  2. 在数据挖掘设计器中,单击“ 挖掘模型预测 ”选项卡。

  3. “挖掘模型 ”窗格中,单击 “选择模型”。

  4. 选择挖掘模型 ”对话框显示挖掘结构的列表。 展开挖掘结构以查看与该结构关联的挖掘模型列表。

  5. 展开挖掘结构“呼叫中心默认值”,然后选择神经网络模型“呼叫中心 - LR”。

  6. “挖掘模型 ”菜单中,选择 “单一实例查询”。

    将显示 “单一查询输入” 对话框,其中的列被映射到挖掘模型中的列。

  7. “单例查询输入” 对话框中,单击 Shift 行,然后选择 午夜

  8. 单击 Lvl 2 运算符的行,然后键入 6

  9. “挖掘模型预测 ”选项卡的下半部分,单击网格中的第一行。

  10. “源 ”列中,单击向下箭头,然后选择“ 预测”函数。 在 “字段” 列中,选择 “PredictHistogram”

    可用于此预测函数的参数列表将自动显示在 “条件/参数 ”框中。

  11. 将 ServiceGrade 列从 “挖掘模型 ”窗格中的列列表拖到 “条件/参数 ”框中。

    列的名称将自动插入为参数。 可以选择任何可预测的属性列以拖到此文本框中。

  12. 单击“ 切换到查询结果”视图的按钮,位于预测查询生成器的右上角。

预期结果包含给定这些输入的每个服务等级的可能预测值,以及每个预测的支持值和概率值。 可以随时返回设计视图并更改输入,或添加更多输入。

使用逻辑回归模型创建预测

如果已经知道与业务问题相关的属性,则可以使用逻辑回归模型来预测某些属性中进行更改的效果。 逻辑回归是一种统计方法,通常用于根据独立变量的变化进行预测:例如,它用于财务评分,用于根据客户人口统计预测客户行为。

在此任务中,你将了解如何创建将用于预测的数据源,然后进行预测以帮助回答多个业务问题。

生成用于批量预测的数据

可通过多种方式提供输入数据:例如,可以从电子表格导入人员配备级别,并通过模型运行该数据,以预测下个月的服务质量。

在本课中,你将使用数据源视图设计器创建命名查询。 此命名查询是一个自定义 Transact-SQL 语句,用于计算计划中每个班次的员工中最大操作员人数、接收的最少呼叫数以及产生的平均问题数。 然后将该数据联接到挖掘模型,以便对一系列即将发生的日期进行预测。

为批量预测查询生成输入数据
  1. 在解决方案资源管理器中,右键单击 “数据源视图”,然后选择“ 新建数据源视图”。

  2. 在“数据源视图”向导中,选择 Adventure Works DW 多维 2012 作为数据源,然后单击“ 下一步”。

  3. “选择表和视图 ”页上,单击“ 下一步 ”,不选择任何表。

  4. “完成向导”页上,键入名称。 Shifts

    此名称将作为数据源视图的名称显示在解决方案资源管理器中。

  5. 右键单击空设计窗格,然后选择“ 新建命名查询”。

  6. 在“ 创建命名查询 ”对话框中,对于 “名称”,请键入 Shifts for Call Center

    此名称将仅作为命名查询的名称显示在数据源视图设计器中。

  7. 将以下查询语句粘贴到对话框下半部分的 SQL 文本窗格中。

    SELECT DISTINCT WageType, Shift,   
    AVG(Orders) as AvgOrders, MIN(Orders) as MinOrders, MAX(Orders) as MaxOrders,  
    AVG(Calls) as AvgCalls, MIN(Calls) as MinCalls, MAX(Calls) as MaxCalls,  
    AVG(LevelTwoOperators) as AvgOperators, MIN(LevelTwoOperators) as MinOperators, MAX(LevelTwoOperators) as MaxOperators,  
    AVG(IssuesRaised) as AvgIssues, MIN(IssuesRaised) as MinIssues, MAX(IssuesRaised) as MaxIssues  
    FROM dbo.FactCallCenter  
    GROUP BY Shift, WageType  
    
  8. 在设计窗格中,右键单击表、呼叫中心的班次,然后选择 “浏览数据 ”以预览 T-SQL 查询返回的数据。

  9. 右键单击选项卡 Shifts.dsv(设计), 然后单击“ 保存 ”以保存新的数据源视图定义。

预测每个班次的服务指标

现在,你已经为每个班次生成了一些值,你将使用这些值作为所生成的逻辑回归模型的输入,以生成一些可用于业务规划的预测。

使用新的 DSV 作为预测查询的输入
  1. 在数据挖掘设计器中,单击“ 挖掘模型预测 ”选项卡。

  2. “挖掘模型 ”窗格中,单击 “选择模型”,然后从可用模型列表中选择“呼叫中心 - LR”。

  3. “挖掘模型 ”菜单中,清除选项 “单一实例查询”。 警告告知单例查询输入将被丢失。 单击 “确定”

    “单例查询输入”对话框将替换为“选择输入表”对话框。

  4. 单击 “选择事例表”。

  5. “选择表”对话框中,从数据源列表中选择SelectShifts。 在 “表/视图名称 ”列表中,选择“呼叫中心的班次”(可能会自动选择),然后单击“ 确定”。

    挖掘模型预测设计图面已更新,以显示基于输入数据和模型中列的名称和数据类型创建的映射。

  6. 右键单击其中一个联接行,然后选择“ 修改连接”。

    在此对话框中,可以看到确切地映射了哪些列,哪些列未映射。 挖掘模型包含呼叫、订单、已提出的问题和二级操作员的列,可映射至基于源数据中这些列创建的任何聚合。 在这种情况下,你将映射到平均值。

  7. 单击 LevelTwoOperators 旁边的空单元格,然后选择 Shifts for Call Center.AvgOperators

  8. 单击“呼叫”旁边的空单元格,选择 呼叫中心.AvgCalls 的班次。 然后单击 “确定”

为每个班次生成预测结果
  1. 预测查询生成器下半部分的网格中,单击 “源 ”下的空单元格,然后选择“呼叫中心的班次”。

  2. 字段下的空单元格中,选择 Shift。

  3. 单击网格中的下一个空行,并重复上述过程,为 WageType 添加另一行。

  4. 点击网格中下一行的空白处。 在 “源 ”列中,选择“ 预测函数”。 在 “字段” 列中,选择“ 预测”。

  5. 将“ 挖掘模型 ”窗格中的“ServiceGrade”列向下拖动到网格中,然后拖动到 “条件/参数 ”单元格中。 在 “别名 ”字段中,键入 “预测服务等级”。

  6. 单击网格中的下一个空行。 在 “源 ”列中,选择“ 预测函数”。 在 “字段” 列中,选择 PredictProbability

  7. 将“ 挖掘模型 ”窗格中的“ServiceGrade”列向下拖动到网格中,然后拖动到 “条件/参数 ”单元格中。 在 “别名” 字段中,键入 Probability

  8. 单击切换到查询结果视图以查看预测。

下表显示了每个班次的示例结果。

转变 工资类型 预测服务等级 概率
上午 假期 0.165 0.377520666
午夜 假期 0.105 0.364105573
PM1 假期 0.165 0.40056055
PM2 假期 0.165 0.338532973
上午 工作日 0.165 0.370847617
午夜 工作日 0.08 0.352999173
PM1 工作日 0.165 0.317419177
PM2 工作日 0.105 0.311672027

预测缩短响应时间对服务等级的影响

你为每个班次生成了一些平均值,并将这些值用作逻辑回归模型的输入。 但是,鉴于业务目标是将放弃率保持在 0.00-0.05 范围内,结果并不令人鼓舞。

因此,根据原始模型,该模型显示了对服务等级响应时间的强烈影响,运营团队决定运行一些预测来评估响应呼叫的平均时间是否会提高服务质量。 例如,如果将呼叫响应时间缩短到 90%, 甚至缩短到当前呼叫响应时间的 80%,服务等级值会发生什么情况?

可以轻松创建数据源视图(DSV),以计算每个班次的平均响应时间,然后添加计算平均响应时间为 80% 或 90% 的列。 然后,可以使用 DSV 作为模型的输入。

虽然此处未显示确切的步骤,但下表比较了在将响应时间减少到 80% 或当前响应时间的 90% 时对服务等级的影响。

从这些结果中,你可能会得出结论,在有针对性的班次上,应将响应时间降低到当前速率的 90%,以提高服务质量。

班次、工资和工作日 当前平均响应时间下的服务质量预测 预测服务质量,响应时间减少 90% 预测服务质量,响应时间减少 80%
假日AM 0.165 0.05 0.05
假日 PM1 0.05 0.05 0.05
节日午夜 0.165 0.05 0.05

可以在此模型上创建各种其他预测查询。 例如,可以预测满足特定服务级别或响应特定数量的传入呼叫所需的作员数。 由于可以在逻辑回归模型中包括多个输出,因此可以轻松试验不同的独立变量和结果,而无需创建许多单独的模型。

注解

Excel 2007 的数据挖掘 Add-Ins 提供逻辑回归助手,帮您轻松解决复杂问题,例如,需要多少二级运维人员才能将服务质量提高到特定班次的目标等级。 数据挖掘加载项是免费提供下载的,包括基于神经网络或逻辑回归算法的向导。 有关详细信息,请参阅以下链接:

结论

你已了解如何创建、自定义和解释基于Microsoft神经网络算法和Microsoft逻辑回归算法的挖掘模型。 这些模型类型非常复杂,允许在分析中几乎无限多样化,因此可能很复杂且难以掌握。

但是,这些算法可以遍历多种因素的组合,并自动识别出最强大的相关性,为难以通过手动使用 Transact-SQL 或 PowerPivot 浏览数据而发现的见解提供统计支持。

另请参阅

逻辑回归模型查询示例
Microsoft逻辑回归算法
Microsoft神经网络算法
神经网络模型查询示例