转换和映射数据

选择要使用的数据源后,您将进入 Power Query 编辑器。 查询编辑器是转换数据的强大工具。 要了解详细信息,请转到 Power Query 用户界面

以下是您可能想要转换数据的一些原因:

  • 您可能对记录的所有活动名称不感兴趣,因此您希望筛选对您尝试挖掘的流程很重要的特定活动名称。

  • 您可能希望重命名一些活动名称以使其更具描述性和更易于理解。 数据库中的名称通常不是这种情况。

  • 您可能只对特定的日期范围感兴趣,而不是对数据的整个历史记录感兴趣。

  • 您可能希望组合多个 ID 列来组成一个案例 ID。 当您要用于流程挖掘的 ID 不存在或者是应用程序中多个 ID 的组合时,通常会执行此操作。 例如,当客户提交支持票证时,支持票证可能会分配给多个客户服务代理。 如果要分析每个代理如何处理每个票证,您需要将代理 ID 和票证 ID 组合为案例 ID。

筛选活动名称

  1. 选择活动名称列旁边的符号调出排序和筛选菜单。

  2. 如果有消息指出列表可能不完整,选择加载更多

  3. 然后只选择要分析的活动名称。 取消选择要排除的任何名称。

    筛选活动名称的屏幕截图。

  4. 或者,您可以使用文本筛选器菜单进行更高级的筛选。 有关按值筛选的详细信息,请转到按列中的值筛选

重命名活动

  1. 确保选择了活动名称列。
  2. 在工具栏上方,选择转换选项卡。
  3. 在工具栏上,选择替换值
  4. 要查找的值下,键入数据源中显示的要替换的活动名称。
  5. 替换为下,键入要在流程图中显示的活动名称。
  6. 对要替换的所有值重复此过程。

减少记录总数

减少记录总数的一个策略是仅使用最新记录。 为此,您需要首先按时间对数据进行排序。

  1. 选择 startTimestamp 列旁边的符号打开排序和筛选菜单。

    减少记录总数的屏幕截图。

  2. 要首先显示最近的记录,选择降序排序

  3. 选择确定,然后选择工具栏上的保留行

  4. 行数下输入 150000

  5. 选择确定筛选前 150,000 行。

合并多个 ID

您可以使用 Ctrl + 单击选择要合并的多个列。

  1. 在“转换”选项卡工具栏上,选择合并列
  2. (可选)从下拉列表中选择一个分隔符。 或者,您可以选择
  3. 更改名称(或记下生成的默认名称),以可以在映射到案例 ID 时选择它。

映射数据

映射可告知流程挖掘功能哪个列映射到哪个属性类型(例如,案例 ID、活动名称或时间戳)。

  1. 要导航至映射屏幕,请选择下一步
  2. 使用相应列旁边的下拉菜单选择其属性类型。 有关更多信息,请遵循属性类型描述
  3. 当使用 CSV 文件格式从 Azure Data Lake Gen2 获取数据时,您可以使用数据类型列中的下拉菜单来更改导入的数据类型。 对于具有数值的列,考虑其属性是连续值(例如,发票金额设置为数字)还是分类值(例如,物料代码设置为文本)。
  4. 案例 ID、活动和开始时间戳是继续分析的强制属性。
  5. 要开始流程分析,请选择保存并分析