Поделиться через


Редактор преобразования «Нечеткое группирование» (вкладка «Столбцы»)

Используйте вкладку Столбцы диалогового окна Редактор преобразования «Нечеткое группирование» для задания столбцов, используемых при группировке строк с повторяющимися значениями.

Дополнительные сведения о преобразовании «Нечеткое группирование» см. в разделе Преобразование «Нечеткое группирование».

Параметры

  • Доступные входные столбцы
    Выберите из списка входные столбцы, используемые для группировки строк с повторяющимися значениями.

  • Имя
    Просмотрите имена доступных входных столбцов.

  • Передать
    Выберите, следует ли включить входной столбец в вывод преобразования. Все используемые для группирования столбцы автоматически копируются в выход. Дополнительные столбцы можно включать с помощью установки флажка.

  • Входной столбец
    Выберите один из входных столбцов, указанных ранее в списке Доступные входные столбцы.

  • Псевдоним выхода
    Введите описательное имя соответствующего выходного столбца. По умолчанию имя выходного столбца совпадает с именем входного столбца.

  • Псевдоним группы выхода
    Введите описательное имя столбца, содержащего каноническое значение сгруппированных повторяющихся значений. По умолчанию именем этого выходного столбца является имя входного столбца с добавлением в конце _clean.

  • Тип соответствия
    Выберите нечеткое или четкое соответствие. Строки считаются повторяющимися, если они подобны по всем столбцам в случае нечеткого соответствия. Если также задано четкое соответствие по определенным столбцам в качестве вероятно повторяющихся, рассматриваются только строки, которые содержат одинаковые значения в столбцах четкого соответствия. Таким образом, если известно, что определенный столбец не содержит ошибок или несоответствий, по нему можно задать четкое соответствие для повышения точности нечеткого соответствия по другим столбцам.

  • Минимальное подобие
    Задайте порог подобия на уровне соединения с помощью ползунка. Чем ближе значение к 1, тем ближе к искомому должно быть значение строки уточняющего запроса. Увеличение порогового значения может увеличить скорость соответствия, так как при этом будет рассматриваться меньшее количество предполагаемых совпадений.

  • Псевдоним выхода подобия
    Задайте имя нового выходного столбца, который содержит метки подобия для выбранного соединения. Если оставить это значение пустым, выходной столбец не создается.

  • Цифры
    Задайте значимость начальных и конечных цифр при сравнении данных столбцов. Например, если начальные цифры являются значимыми, группировка строк «123 Main Street» и «456 Main Street» не выполняется.

    Значение

    Описание

    Нет

    Начальные и конечные цифры не являются значимыми.

    Начальные

    Значимыми являются только начальные цифры.

    Конечные

    Значимыми являются только конечные цифры.

    Начальные и конечные

    Значимыми являются и начальные, и конечные цифры.

  • Флаги сравнения
    Сведения о параметрах сравнения строк см. в разделе Сравнение строковых данных.