Condividi tramite


Editor trasformazione Estrazione termini (Scheda Avanzate)

Utilizzare la scheda Avanzate della finestra di dialogo Editor trasformazione Estrazione termini per specificare le proprietà per l'estrazione, ad esempio la frequenza, la lunghezza e le eventuali parole o frasi da estrarre.

Per ulteriori informazioni sulla trasformazione Estrazione termini, vedere Trasformazione Estrazione termini.

Opzioni

  • Sostantivo
    Consente di specificare che la trasformazione estrarrà solo singoli sostantivi.

  • Sintagma nominale
    Consente di specificare che la trasformazione estrarrà solo sintagmi nominali.

  • Sostantivo e sintagma nominale
    Consente di specificare che la trasformazione estrarrà sia sostantivi che sintagmi nominali.

  • Frequenza
    Consente di specificare che il punteggio è rappresentato dalla frequenza del termine.

  • TFIDF
    Consente di specificare che il punteggio è rappresentato dal valore TFIDF del termine. Il punteggio TFIDF è il prodotto tra la frequenza del termine (TF) e l'inverso della frequenza nei documenti (IDF) espresso dalla ponderazione seguente: TFIDF di un termine T = (frequenza di T) * log( (numero di righe in input) / (numero di righe contenenti il termine T) )

  • Soglia di frequenza
    Consente di specificare il numero di volte in cui una parola o una frase deve ricorrere prima che venga estratta. Il valore predefinito è 2.

  • Lunghezza massima termine
    Consente di specificare la lunghezza massima in parole di una frase. Questa opzione ha effetto soltanto sui sintagmi nominali. Il valore predefinito è 12.

  • Estrazione con distinzione maiuscole/minuscole
    Consente di specificare se eseguire l'estrazione rilevando la distinzione tra maiuscole e minuscole. Il valore predefinito è False.

  • Configura output errori
    Consente di utilizzare la finestra di dialogo Configura output errori per specificare le opzioni di gestione degli errori per le righe che causano errori.