次の方法で共有


[用語抽出変換エディタ] ([詳細設定] タブ)

[用語抽出変換エディタ] ダイアログ ボックスの [詳細設定] タブを使用すると、頻度、長さ、語または句の抽出など、抽出に関するプロパティを指定できます。

用語抽出変換の詳細については、「用語抽出変換」を参照してください。

オプション

  • [名詞]
    変換によって個別の名詞のみを抽出するように指定します。

  • [名詞句]
    変換によって個別の名詞句のみを抽出するように指定します。

  • [名詞と名詞句]
    変換によって名詞と名詞句を両方とも抽出するように指定します。

  • [頻度]
    スコアが用語の頻度であることを指定します。

  • [TFIDF]
    スコアが用語の TFIDF 値であることを指定します。TFIDF スコアは、Term Frequency と Inverse Document Frequency の積です。用語 T の TFIDF = (T の使用頻度) * log( (入力された行数) / (T の含まれる行数) ) として定義されます。

  • [頻度のしきい値]
    語または句を抽出する前の語または句の出現回数を指定します。既定値は 2 です。

  • [用語の最大長]
    句の最大長を語数で指定します。このオプションは、名詞句のみに影響を与えます。既定値は 12 です。

  • [用語抽出で大文字と小文字を区別する]
    抽出で大文字と小文字を区別するかどうかを指定します。既定値は False です。

  • [エラー出力の構成]
    [エラー出力の構成] ダイアログ ボックスを使用すると、エラーが発生した行に対するエラー処理を指定できます。