다음을 통해 공유


용어 추출 변환 편집기(고급 탭)

용어 추출 변환 편집기 대화 상자의 고급 탭을 사용하여 빈도, 길이 및 단어 또는 구 추출 여부와 같은 추출에 대한 속성을 지정할 수 있습니다.

용어 추출 변환에 대한 자세한 내용은 용어 추출 변환을 참조하십시오.

옵션

  • 명사
    변환에서 개별 명사만 추출하도록 지정합니다.

  • 명사구
    변환에서 명사구만 추출하도록 지정합니다.

  • 명사 및 명사구
    변환에서 명사 및 명사구를 모두 추출하도록 지정합니다.

  • 빈도
    점수를 용어의 빈도로 지정합니다.

  • TFIDF
    점수를 용어의 TFIDF 값으로 지정합니다. TFIDF 점수는 TF(용어 빈도)와 IDF(역 문서 빈도)의 곱으로 다음과 같이 정의됩니다. 용어 T의 TFIDF = (T의 빈도) * log((입력의 행 수)/(T를 포함하는 행 수))

  • 빈도 임계값
    단어 또는 구를 추출할 때까지 발생해야 하는 횟수를 지정합니다. 기본값은 2입니다.

  • 최대 용어 길이
    단어 구의 최대 길이를 지정합니다. 이 옵션은 명사구에만 영향을 줍니다. 기본값은 12입니다.

  • 대/소문자 구분 용어 추출 사용
    추출 시 대/소문자 구분 여부를 지정합니다. 기본값은 False입니다.

  • 오류 출력 구성
    오류 출력 구성 대화 상자를 사용하여 오류 발생의 원인이 되는 행에 대해 오류 처리를 지정할 수 있습니다.