任务 10:添加模糊分组转换以确定重复项

在本任务中,您向数据流添加模糊分组转换。 模糊分组转换可有助于标识源数据中的重复项。 有关详细信息,请参阅模糊分组转换

  1. 将“SSIS 工具箱”上“其他转换”中的“模糊分组”转换拖放到“数据流”选项卡上的“合并正确和已更正的记录”之下。

  2. 右键单击“数据流”选项卡中的“模糊分组”转换,然后单击“重命名”。 键入“分组具有匹配 ID 的供应商”,然后按 Enter

  3. 使用蓝色连接线将“合并正确和已更正的记录”连接到“分组具有匹配 ID 的供应商”。

    连接到具有匹配 ID 的组供应商

  4. 双击“分组具有匹配 ID 的供应商”。

  5. 在“模糊分组转换编辑器”中单击“OLE DB 连接管理器”下拉列表旁的“新建”,以便启动“配置 OLE DB 连接管理器”对话框。

  6. 在该对话框中,单击“新建”以便启动“连接管理器”对话框。

  7. 为服务器名称键入 (local).(句点)。

  8. 为“选择或输入数据库名称”字段选择 MDS。 您将使用该 MDS 数据库作为“模糊分组转换”的临时存储。 “模糊分组”转换要求与 SQL Server 的实例建立连接,以创建该转换算法完成其工作所需的临时 SQL Server 表。 您可以为此目的创建一个数据库或使用其他现有数据库。

  9. 单击“测试连接”以测试连接,然后在消息框上单击“确定”。

  10. 在“连接管理器”对话框中,单击“确定”。

  11. 从“数据连接”列表中选择 (local).MDS(或 localhost.MDS),然后单击“确定”。

  12. 在“模糊分组转换编辑器”中,确认已为“OLE DB 连接管理器”选择了 (local).MDSlocalhost.MDS

  13. 切换到“列”选项卡。

  14. 从“可用输入列”的列表中选择 SupplierID_Output(复选框)。 为了配置该转换,请选择在标识重复项时要使用的输入列。 为简单易懂,您在此步骤中仅使用 SupplierID。

    模糊分组转换编辑器

  15. 单击“确定”以关闭“模糊分组转换编辑器”。

下一步

任务 11:添加有条件拆分转换以筛选重复项