다음을 통해 공유


HashingTF 클래스

정의

HashingTF 해싱 트릭을 사용하여 용어의 순서를 해당 용어 빈도에 매핑합니다. 현재 오스틴 Appleby의 MurmurHash 3 알고리즘(MurmurHash3_x86_32)을 사용하여 개체라는 용어의 해시 코드 값을 계산합니다. 간단한 모듈로는 해시 함수를 열 인덱스로 변환하는 데 사용되므로 numFeatures 매개 변수로 2의 전원을 사용하는 것이 좋습니다. 그렇지 않으면 기능이 열에 균등하게 매핑되지 않습니다.

public class HashingTF : Microsoft.Spark.ML.Feature.FeatureBase<Microsoft.Spark.ML.Feature.HashingTF>
type HashingTF = class
    inherit FeatureBase<HashingTF>
Public Class HashingTF
Inherits FeatureBase(Of HashingTF)
상속

생성자

HashingTF()

매개 변수 없이 을 만듭니다.HashingTF

HashingTF(String)

HashingTF 고유 ID를 제공하는 데 사용되는 UID를 HashingTF 사용하여 을 만듭니다.

메서드

Clear(Param)

Microsoft.Spark.ML.Feature.Param에 대해 이전에 설정된 값을 지웁니다. 값이 기본값으로 다시 설정됩니다.

(다음에서 상속됨 FeatureBase<T>)
ExplainParam(Param)

특정 Microsoft.Spark.ML.Feature.Param 작동 방식에 대한 설명을 반환하며 현재 설정됩니다.

(다음에서 상속됨 FeatureBase<T>)
ExplainParams()

이 개체에 적용되는 모든 Microsoft.Spark.ML.Feature.Param의 작동 방식과 현재 설정된 방식에 대한 설명을 반환합니다.

(다음에서 상속됨 FeatureBase<T>)
GetBinary()

용어 빈도 수를 제어하는 이진 토글을 가져옵니다.

GetInputCol()

에서 읽어야 하는 HashingTF 열을 가져옵니다.

GetNumFeatures()

사용해야 하는 기능 수를 가져옵니다. 간단한 모듈로는 해시 함수를 열 인덱스로 변환하는 데 사용되므로 numFeatures 매개 변수로 2의 전원을 사용하는 것이 좋습니다. 그렇지 않으면 기능이 열에 균등하게 매핑되지 않습니다.

GetOutputCol()

HashingTFDataFrame새 열을 만듭니다. 이 열은 새 열의 이름입니다.

GetParam(String)

개체의 Microsoft.Spark.ML.Feature.Param 값을 설정하는 데 사용할 수 있도록 을 Microsoft.Spark.ML.Feature.Param 검색합니다.

(다음에서 상속됨 FeatureBase<T>)
Load(String)

저장을 HashingTF 사용하여 이전에 저장한 를 로드합니다.

Save(String)

나중에 Load를 사용하여 로드할 수 있도록 개체를 저장합니다. 이러한 개체는 Scala에서 로드 또는 저장을 통해 Scala와 공유할 수 있습니다.

(다음에서 상속됨 FeatureBase<T>)
Set(Param, Object)

특정 Microsoft.Spark.ML.Feature.Param의 값을 설정합니다.

(다음에서 상속됨 FeatureBase<T>)
SetBinary(Boolean)

항 빈도 수를 제어하는 이진 토글입니다. true이면 0이 아닌 모든 개수가 1로 설정됩니다. 정수 개수가 아닌 이진 이벤트를 모델링하는 불연속 확률적 모델에 유용합니다.

SetInputCol(String)

에서 읽어야 하는 HashingTF 열을 설정합니다.

SetNumFeatures(Int32)

사용해야 하는 기능 수를 설정합니다. 간단한 모듈로는 해시 함수를 열 인덱스로 변환하는 데 사용되므로 numFeatures 매개 변수로 2의 전원을 사용하는 것이 좋습니다. 그렇지 않으면 기능이 열에 균등하게 매핑되지 않습니다.

SetOutputCol(String)

HashingTFDataFrame새 열을 만듭니다. 이 열은 새 열의 이름입니다.

ToString()

.NET ToString 기본값이 아닌 JVM toString 값을 반환합니다.

(다음에서 상속됨 FeatureBase<T>)
Transform(DataFrame)

HashingTF 를 실행하고 DataFrame을 변환하여 토큰이 있는 새 열 또는 열을 포함합니다.

Uid()

개체를 만드는 데 사용된 UID입니다. 개체를 만들 때 UID가 전달되지 않으면 개체를 만들 때 임의의 UID가 만들어집니다.

(다음에서 상속됨 FeatureBase<T>)

적용 대상