다음을 통해 공유


CountFeatureSelectingEstimator 클래스

정의

기본이 아닌 값의 개수가 임계값보다 크거나 같은 슬롯을 선택합니다.

public sealed class CountFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type CountFeatureSelectingEstimator = class
    interface IEstimator<ITransformer>
Public NotInheritable Class CountFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
상속
CountFeatureSelectingEstimator
구현

설명

추정기 특성

이 예측 도구는 매개 변수를 학습하기 위해 데이터를 확인해야 합니까?
입력 열 데이터 형식 텍스트 데이터 형식의 SingleDouble 벡터 또는 스칼라
출력 열 데이터 형식 입력 열과 동일
ONNX로 내보낼 수 있습니다.

이 변환은 집계 집합을 사용하여 기본값이 아니고 누락되지 않은 각 슬롯(벡터 요소)의 값 수를 계산합니다(기본값 및 누락 정의의 경우 설명 섹션 DataKind참조). 개수 값이 제공된 count 매개 변수보다 작으면 해당 슬롯이 삭제됩니다. 이 변환은 .와 함께 적용할 OneHotHashEncodingTransformer때 유용합니다. 예제에 데이터가 없는 해시 변환에 의해 생성된 기능을 제거할 수 있습니다.

예를 들어 count 매개 변수를 3으로 설정하고 예측 도구에 맞으면 변환기를 다음 Features 열에 적용하면 두 번째 슬롯에 NaN(누락 값), 5, 5, 0(기본값) 값이 삭제되는 것을 볼 수 있습니다. 그 슬롯에는 기본값이 아닌 값과 누락되지 않은 값이 두 개뿐이므로 두 개의 값이 포함됩니다. 세 번째 슬롯은 값이 6, 6, 6, NaN이므로 유지됩니다. 기본값이 아닌 3개와 누락이 없는 3개입니다.

기능
4,NaN,6
4,5,6
4,5,6
4,0,NaN

변환 후에 위의 데이터 세트가 표시되는 방식입니다.

기능
4,6
4,6
4,6
4,NaN

사용 예제에 대한 링크는 참고 섹션을 확인하세요.

메서드

Fit(IDataView)

를 학습하고 반환합니다 ITransformer.

GetOutputSchema(SchemaShape)

변환기에서 SchemaShape 생성할 스키마를 반환합니다. 파이프라인에서 스키마 전파 및 확인에 사용됩니다.

확장 메서드

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

추정기 체인에 '캐싱 검사점'을 추가합니다. 이렇게 하면 다운스트림 추정기가 캐시된 데이터에 대해 학습됩니다. 여러 데이터 전달을 수행하는 트레이너 앞에 캐싱 검사점이 있는 것이 좋습니다.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

추정기가 지정된 경우 호출된 대리 Fit(IDataView) 자를 호출할 래핑 개체를 반환합니다. 예측 도구가 적합한 항목에 대한 정보를 반환하는 것이 중요한 경우가 많습니다. 따라서 Fit(IDataView) 메서드는 일반 ITransformer개체가 아닌 구체적으로 형식화된 개체를 반환합니다. 그러나 동시에 IEstimator<TTransformer> 개체가 많은 파이프라인으로 형성되는 경우가 많으므로 변환기를 가져올 추정기가 이 체인의 어딘가에 묻혀 있는 위치를 통해 EstimatorChain<TLastTransformer> 추정기 체인을 빌드해야 할 수 있습니다. 이 시나리오에서는 이 메서드를 통해 fit이 호출되면 호출될 대리자를 연결할 수 있습니다.

적용 대상

추가 정보