Editor de transformación Extracción de términos (ficha Avanzadas)
Use la ficha Avanzadas del cuadro de diálogo Editor de transformación Extracción de términos para especificar las propiedades de la extracción, tales como la frecuencia, la longitud y si deben extraerse palabras o frases.
Para obtener más información acerca de la transformación Extracción de términos, vea Transformación Extracción de términos.
Opciones
Nombre
Especifica que la transformación extrae únicamente nombres individuales.Frase
Especifica que la transformación extrae únicamente frases.Nombre y frase
Especifica que la transformación extrae nombres y frases.Frecuencia
Especifica que la puntuación está determinada por la frecuencia del término.TFIDF
Mediante esta opción se indica que la puntuación está determinada por el valor TFIDF del término. La puntuación TFIDF es el producto de la frecuencia del término y la frecuencia inversa del documento, tal y como se define a continuación: TFIDF de un término T = (frecuencia de T) * log ( (nº de filas de la entrada) / (nº de filas en que aparece T) )Umbral de frecuencia
Permite especificar el número de veces que una palabra o frase debe aparecer antes de extraerla. El valor predeterminado es 2.Longitud máxima del término
Permite especificar la longitud máxima de una frase en palabras. Esta opción afecta únicamente a frases. El valor predeterminado es 12.Utilizar extracción de términos con distinción de mayúsculas y minúsculas
Permite especificar si la extracción distinguirá mayúsculas de minúsculas. El valor predeterminado es False.Configurar la salida de errores
Use el cuadro de diálogo Configurar la salida de errores para especificar las opciones de control de errores para las filas que provocan errores.