Compartir a través de


Editor de transformación Extracción de términos (ficha Avanzadas)

Use la ficha Avanzadas del cuadro de diálogo Editor de transformación Extracción de términos para especificar las propiedades de la extracción, tales como la frecuencia, la longitud y si deben extraerse palabras o frases.

Para obtener más información acerca de la transformación Extracción de términos, vea Transformación Extracción de términos.

Opciones

  • Nombre
    Especifica que la transformación extrae únicamente nombres individuales.

  • Frase
    Especifica que la transformación extrae únicamente frases.

  • Nombre y frase
    Especifica que la transformación extrae nombres y frases.

  • Frecuencia
    Especifica que la puntuación está determinada por la frecuencia del término.

  • TFIDF
    Mediante esta opción se indica que la puntuación está determinada por el valor TFIDF del término. La puntuación TFIDF es el producto de la frecuencia del término y la frecuencia inversa del documento, tal y como se define a continuación: TFIDF de un término T = (frecuencia de T) * log ( (nº de filas de la entrada) / (nº de filas en que aparece T) )

  • Umbral de frecuencia
    Permite especificar el número de veces que una palabra o frase debe aparecer antes de extraerla. El valor predeterminado es 2.

  • Longitud máxima del término
    Permite especificar la longitud máxima de una frase en palabras. Esta opción afecta únicamente a frases. El valor predeterminado es 12.

  • Utilizar extracción de términos con distinción de mayúsculas y minúsculas
    Permite especificar si la extracción distinguirá mayúsculas de minúsculas. El valor predeterminado es False.

  • Configurar la salida de errores
    Use el cuadro de diálogo Configurar la salida de errores para especificar las opciones de control de errores para las filas que provocan errores.