다음을 통해 공유


FeatureHasher 클래스

정의

public class FeatureHasher : Microsoft.Spark.ML.Feature.FeatureBase<Microsoft.Spark.ML.Feature.FeatureHasher>
type FeatureHasher = class
    inherit FeatureBase<FeatureHasher>
Public Class FeatureHasher
Inherits FeatureBase(Of FeatureHasher)
상속

메서드

Clear(Param)

Microsoft.Spark.ML.Feature.Param에 대해 이전에 설정된 값을 지웁니다. 값이 기본값으로 다시 설정됩니다.

(다음에서 상속됨 FeatureBase<T>)
ExplainParam(Param)

특정 Microsoft.Spark.ML.Feature.Param 작동 방식에 대한 설명을 반환하며 현재 설정됩니다.

(다음에서 상속됨 FeatureBase<T>)
ExplainParams()

이 개체에 적용되는 모든 Microsoft.Spark.ML.Feature.Param의 작동 방식과 현재 설정된 방식에 대한 설명을 반환합니다.

(다음에서 상속됨 FeatureBase<T>)
GetCategoricalCols()

범주 열로 지정된 열 목록을 가져옵니다.

GetInputCols()

에서 읽고 해시로 변환해야 하는 FeatureHasher 열을 가져옵니다. 이것은 SetInputCol에 의해 설정되었을 것입니다.

GetNumFeatures()

사용해야 하는 기능 수를 가져옵니다. 간단한 모듈로는 해시 함수를 열 인덱스로 변환하는 데 사용되므로 numFeatures 매개 변수로 2의 전원을 사용하는 것이 좋습니다. 그렇지 않으면 기능이 열에 균등하게 매핑되지 않습니다.

GetOutputCol()

출력 데이터를 쓸 열의 이름을 가져옵니다. SetInputCol에서 설정합니다.

GetParam(String)

개체의 Microsoft.Spark.ML.Feature.Param 값을 설정하는 데 사용할 수 있도록 을 Microsoft.Spark.ML.Feature.Param 검색합니다.

(다음에서 상속됨 FeatureBase<T>)
Load(String)

저장을 FeatureHasher 사용하여 이전에 저장한 를 로드합니다.

Save(String)

나중에 Load를 사용하여 로드할 수 있도록 개체를 저장합니다. 이러한 개체는 Scala에서 로드 또는 저장을 통해 Scala와 공유할 수 있습니다.

(다음에서 상속됨 FeatureBase<T>)
Set(Param, Object)

특정 Microsoft.Spark.ML.Feature.Param의 값을 설정합니다.

(다음에서 상속됨 FeatureBase<T>)
SetCategoricalCols(IEnumerable<String>)

열을 범주 열로 표시합니다.

SetInputCols(IEnumerable<String>)

에서 읽고 해시로 변환해야 하는 FeatureHasher 열을 설정합니다.

SetNumFeatures(Int32)

사용해야 하는 기능 수를 설정합니다. 간단한 모듈로는 해시 함수를 열 인덱스로 변환하는 데 사용되므로 numFeatures 매개 변수로 2의 전원을 사용하는 것이 좋습니다. 그렇지 않으면 기능이 열에 균등하게 매핑되지 않습니다.

SetOutputCol(String)

변환으로 만든 에서 DataFrame 새 열의 이름을 설정합니다.

ToString()

.NET ToString 기본값이 아닌 JVM toString 값을 반환합니다.

(다음에서 상속됨 FeatureBase<T>)
Transform(DataFrame)

입력 DataFrame을 변환합니다. TransformSchema를 호출하여 변환이 성공하는지 확인하는 것이 좋습니다.

TransformSchema(StructType)

변환 유효성을 확인하고 입력 스키마에서 출력 스키마를 파생시킵니다.

이렇게 하면 변환 중에 매개 변수 간의 상호 작용이 유효한지 확인하고 매개 변수 값이 잘못된 경우 예외가 발생합니다.

일반적인 구현은 먼저 복잡한 매개 변수 상호 작용 검사를 포함하여 스키마 변경 및 매개 변수 유효성에 대한 확인을 수행해야 합니다.

Uid()

개체를 만드는 데 사용된 UID입니다. 개체를 만들 때 UID가 전달되지 않으면 개체를 만들 때 임의의 UID가 만들어집니다.

(다음에서 상속됨 FeatureBase<T>)

적용 대상