CountVectorizer.SetMinTF(Double) 메서드

정의

문서에서 드문 단어를 무시하도록 필터를 설정합니다. 각 문서에 대해 빈도/개수가 지정된 임계값보다 작은 용어는 무시됩니다. 1보다 크거나 같은 정수인 경우 이 값은 개수(문서에 용어가 표시되어야 하는 횟수)를 지정합니다. 이 값이 [0,1]의 이중인 경우 이 값은 분수(문서의 토큰 수 중)를 지정합니다.

매개 변수는 CountVectorizerModel의 변환에만 사용되며 맞춤에 영향을 주지 않습니다.

public Microsoft.Spark.ML.Feature.CountVectorizer SetMinTF (double value);
member this.SetMinTF : double -> Microsoft.Spark.ML.Feature.CountVectorizer
Public Function SetMinTF (value As Double) As CountVectorizer

매개 변수

value
Double

최소 기간 빈도

반환

최소 기간 빈도 집합을 사용하여 새로 CountVectorizer 만들기

적용 대상