HashingTF 클래스
정의
중요
일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.
는 HashingTF 해싱 트릭을 사용하여 용어의 순서를 해당 용어 빈도에 매핑합니다. 현재 오스틴 Appleby의 MurmurHash 3 알고리즘(MurmurHash3_x86_32)을 사용하여 개체라는 용어의 해시 코드 값을 계산합니다. 간단한 모듈로는 해시 함수를 열 인덱스로 변환하는 데 사용되므로 numFeatures 매개 변수로 2의 전원을 사용하는 것이 좋습니다. 그렇지 않으면 기능이 열에 균등하게 매핑되지 않습니다.
public class HashingTF : Microsoft.Spark.ML.Feature.FeatureBase<Microsoft.Spark.ML.Feature.HashingTF>
type HashingTF = class
inherit FeatureBase<HashingTF>
Public Class HashingTF
Inherits FeatureBase(Of HashingTF)
- 상속
생성자
HashingTF() |
매개 변수 없이 을 만듭니다.HashingTF |
HashingTF(String) |
메서드
Clear(Param) |
이 Microsoft.Spark.ML.Feature.Param에 대해 이전에 설정된 값을 지웁니다. 값이 기본값으로 다시 설정됩니다. (다음에서 상속됨 FeatureBase<T>) |
ExplainParam(Param) |
특정 Microsoft.Spark.ML.Feature.Param 작동 방식에 대한 설명을 반환하며 현재 설정됩니다. (다음에서 상속됨 FeatureBase<T>) |
ExplainParams() |
이 개체에 적용되는 모든 Microsoft.Spark.ML.Feature.Param의 작동 방식과 현재 설정된 방식에 대한 설명을 반환합니다. (다음에서 상속됨 FeatureBase<T>) |
GetBinary() |
용어 빈도 수를 제어하는 이진 토글을 가져옵니다. |
GetInputCol() |
에서 읽어야 하는 HashingTF 열을 가져옵니다. |
GetNumFeatures() |
사용해야 하는 기능 수를 가져옵니다. 간단한 모듈로는 해시 함수를 열 인덱스로 변환하는 데 사용되므로 numFeatures 매개 변수로 2의 전원을 사용하는 것이 좋습니다. 그렇지 않으면 기능이 열에 균등하게 매핑되지 않습니다. |
GetOutputCol() | |
GetParam(String) |
개체의 Microsoft.Spark.ML.Feature.Param 값을 설정하는 데 사용할 수 있도록 을 Microsoft.Spark.ML.Feature.Param 검색합니다. (다음에서 상속됨 FeatureBase<T>) |
Load(String) |
저장을 HashingTF 사용하여 이전에 저장한 를 로드합니다. |
Save(String) |
나중에 Load를 사용하여 로드할 수 있도록 개체를 저장합니다. 이러한 개체는 Scala에서 로드 또는 저장을 통해 Scala와 공유할 수 있습니다. (다음에서 상속됨 FeatureBase<T>) |
Set(Param, Object) |
특정 Microsoft.Spark.ML.Feature.Param의 값을 설정합니다. (다음에서 상속됨 FeatureBase<T>) |
SetBinary(Boolean) |
항 빈도 수를 제어하는 이진 토글입니다. true이면 0이 아닌 모든 개수가 1로 설정됩니다. 정수 개수가 아닌 이진 이벤트를 모델링하는 불연속 확률적 모델에 유용합니다. |
SetInputCol(String) |
에서 읽어야 하는 HashingTF 열을 설정합니다. |
SetNumFeatures(Int32) |
사용해야 하는 기능 수를 설정합니다. 간단한 모듈로는 해시 함수를 열 인덱스로 변환하는 데 사용되므로 numFeatures 매개 변수로 2의 전원을 사용하는 것이 좋습니다. 그렇지 않으면 기능이 열에 균등하게 매핑되지 않습니다. |
SetOutputCol(String) | |
ToString() |
.NET ToString 기본값이 아닌 JVM toString 값을 반환합니다. (다음에서 상속됨 FeatureBase<T>) |
Transform(DataFrame) |
HashingTF 를 실행하고 DataFrame을 변환하여 토큰이 있는 새 열 또는 열을 포함합니다. |
Uid() |
개체를 만드는 데 사용된 UID입니다. 개체를 만들 때 UID가 전달되지 않으면 개체를 만들 때 임의의 UID가 만들어집니다. (다음에서 상속됨 FeatureBase<T>) |