Compartir a través de


Editor de transformación Agrupación aproximada (ficha Avanzadas)

Use la ficha Avanzadas del cuadro de diálogo Editor de transformación Agrupación aproximada para especificar las columnas de entrada y salida, configurar umbrales de similitud y definir delimitadores.

[!NOTA]

Las propiedades Exhaustive y MaxMemoryUsage de la transformación Agrupación aproximada no están disponibles en el Editor de transformación Agrupación aproximada, pero se pueden establecer con el Editor avanzado. Para obtener más información acerca de estas propiedades, vea la sección sobre la transformación Agrupación aproximada en Propiedades personalizadas de transformación.

Para obtener más información acerca de la transformación Agrupación aproximada, vea Transformación Agrupación aproximada.

Opciones

  • Nombre de la columna de claves de entrada
    Especifique el nombre de una columna de salida que contenga el identificador único para cada fila de entrada. La columna _key_in tiene un valor que identifica de forma exclusiva cada fila.

  • Nombre de la columna de claves de salida
    Especifique el nombre de una columna de salida que contenga el identificador único para la fila canónica de un grupo de filas duplicadas. La columna _key_out se corresponde con el valor _key_in de la fila de datos canónica.

  • Nombre de la columna de resultados de similitud
    Especifique un nombre para la columna que contiene los resultados de similitud. Los resultados de similitud tienen un valor entre 0 y 1 que indica la similitud de la fila de entrada con la fila canónica. Cuanto más se acerque el resultado a 1, mayor será la coincidencia entre la fila y la fila canónica.

  • Umbral de similitud
    Defina el umbral de similitud utilizando el control deslizante. Cuanto más se acerque el umbral a 1, más deberán parecerse las filas entre sí para ser consideradas duplicados. Aumentar el umbral puede mejorar la velocidad de coincidencia, ya que tendrán que tenerse en cuenta menos registros candidatos.

  • Delimitadores de token
    La transformación proporciona un conjunto predeterminado de delimitadores para crear testigos de datos, pero se pueden agregar o quitar los delimitadores que sea necesario editando la lista.