模糊分组转换编辑器(“列”选项卡)

可以使用**“模糊分组转换编辑器”对话框的“列”**选项卡,指定用于对带有重复值的行进行分组的列。

若要了解有关模糊分组转换的详细信息,请参阅模糊分组转换

选项

  • 可用输入列
    从此列表中选择用于对带有重复值的行进行分组的输入列。

  • 名称
    查看可用输入列的名称。

  • 传递
    选择是否在转换的输出中包含输入列。 用于分组的所有列将自动复制到输出中。 通过选中此列可以包含其他列。

  • 输入列
    选择先前在**“可用输入列”**列表中选中的一个输入列。

  • 输出别名
    为相应的输出列输入一个描述性名称。 默认情况下,输出列名称与输入列名称相同。

  • 组输出别名
    为包含分组重复项的规范值的列输入一个描述性名称。 此输出列的默认名称是在输入列名称后面追加 _clean。

  • 匹配类型
    选择模糊匹配或完全匹配。 在指定了模糊匹配类型的所有列中,如果某些行足够相似,则会将这些行视为重复。 如果还对某些列指定了完全匹配,则只会将在完全匹配列中包含相同值的行视为可能重复。 因此,如果知道特定列中没有错误或不存在不一致的情况,则可以对该列指定完全匹配以提高其他列模糊匹配的准确性。

  • 最低相似性
    使用滑块在联接级别设置相似性阈值。 该值越接近 1,查找值与源值的相似性必须越接近,才能视为匹配。 由于需要考虑的候选记录更少,因此增加阈值可以提高匹配的速度。

  • 相似性输出别名
    为包含所选联接相似性得分的新输出列指定名称。 如果将该值保留为空,将不会创建输出列。

  • 数字
    指定比较列数据时前导数字和尾随数字的重要性。 例如,如果前导数字重要,则“123 Main Street”将不会与“456 Main Street”分组在一起。

    说明

    Neither

    前导数字和尾随数字都不重要。

    Leading

    只有前导数字重要。

    Trailing

    只有尾随数字重要。

    LeadingAndTrailing

    前导数字和尾随数字都重要。

  • 比较标志
    有关字符串比较选项的信息,请参阅比较字符串数据

请参阅

任务

使用模糊分组转换标识相似数据行

概念

Integration Services 错误和消息引用