在本任务中,您向数据流添加模糊分组转换。 模糊分组转换可有助于标识源数据中的重复项。 有关详细信息,请参阅模糊分组转换。
将“SSIS 工具箱”上“其他转换”中的“模糊分组”转换拖放到“数据流”选项卡上的“合并正确和已更正的记录”之下。
右键单击“数据流”选项卡中的“模糊分组”转换,然后单击“重命名”。 键入“分组具有匹配 ID 的供应商”,然后按 Enter。
使用蓝色连接线将“合并正确和已更正的记录”连接到“分组具有匹配 ID 的供应商”。
.jpg)
双击“分组具有匹配 ID 的供应商”。
在“模糊分组转换编辑器”中单击“OLE DB 连接管理器”下拉列表旁的“新建”,以便启动“配置 OLE DB 连接管理器”对话框。
在该对话框中,单击“新建”以便启动“连接管理器”对话框。
为服务器名称键入 (local) 或 .(句点)。
为“选择或输入数据库名称”字段选择 MDS。 您将使用该 MDS 数据库作为“模糊分组转换”的临时存储。 “模糊分组”转换要求与 SQL Server 的实例建立连接,以创建该转换算法完成其工作所需的临时 SQL Server 表。 您可以为此目的创建一个数据库或使用其他现有数据库。
单击“测试连接”以测试连接,然后在消息框上单击“确定”。
在“连接管理器”对话框中,单击“确定”。
从“数据连接”列表中选择 (local).MDS(或 localhost.MDS),然后单击“确定”。
在“模糊分组转换编辑器”中,确认已为“OLE DB 连接管理器”选择了 (local).MDS 或 localhost.MDS。
切换到“列”选项卡。
从“可用输入列”的列表中选择 SupplierID_Output(复选框)。 为了配置该转换,请选择在标识重复项时要使用的输入列。 为简单易懂,您在此步骤中仅使用 SupplierID。
.jpg)
单击“确定”以关闭“模糊分组转换编辑器”。