MutualInformationFeatureSelectingEstimator 클래스

정의

레이블 열(지정된 열의 값을 관찰하여 레이블에 대해 알아볼 수 있는 항목)을 사용하여 상호 정보로 정렬된 지정된 모든 열에서 상위 k 슬롯을 선택합니다.

public sealed class MutualInformationFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type MutualInformationFeatureSelectingEstimator = class
    interface IEstimator<ITransformer>
Public NotInheritable Class MutualInformationFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
상속
MutualInformationFeatureSelectingEstimator
구현

설명

예측 도구 특성

이 예측 도구는 매개 변수를 학습하기 위해 데이터를 확인해야 합니까? Yes
입력 열 데이터 형식 숫자, 텍스트 또는 데이터 형식의 벡터 또는 스칼라
출력 열 데이터 형식 입력 열과 동일
ONNX로 내보낼 수 있습니다. Yes

공식적으로 상호 정보는 다음과 같이 작성될 수 있습니다.

$\text{MI}(X,Y) = E_{x,y}[\log(P(x,y)) - \log(P(x)) - \log(P(y)]$ 여기서 $x$ 및 $y$는 임의 변수 $X$ 및 $Y$를 관찰합니다.

여기서 기대 E는 X와 Y의 공동 분포를 인수합니다. 여기서 P(x, y)는 X와 Y의 공동 확률 밀도 함수이며, P(x) 및 P(y)는 각각 X와 Y의 한계 확률 밀도 함수입니다. 일반적으로 종속 변수(또는 레이블)와 독립 변수(또는 기능) 간의 상호 정보가 높으면 레이블이 해당 기능에 대한 상호 의존도가 높아집니다. 레이블과 함께 가장 큰 상호 정보를 사용하여 출력 기능의 상위 슬롯을 유지합니다.

예를 들어 다음 기능 및 레이블 열의 경우 레이블 열과 상관 관계가 높은 상위 2개 슬롯(벡터 요소)을 지정하면 값이 Label 열의 값과 더 상관 관계가 있으므로 이 Estimator를 적용하는 출력은 첫 번째 슬롯과 세 번째 슬롯만 유지합니다.

레이블 기능
True 4,6,0
False 0,7,5
True 4,7,0
False 0,7,0

위의 데이터 세트는 예측 도구를 맞추고 결과 변환기를 사용하여 데이터를 변환한 후 다음과 같이 표시됩니다.

레이블 기능
True 4,0
False 0,5
True 4,0
False 0,0

사용 예제에 대한 링크는 참고 항목 섹션을 참조하세요.

메서드

Fit(IDataView)

를 학습하고 를 반환합니다 ITransformer.

GetOutputSchema(SchemaShape)

SchemaShape 변환기에서 생성할 스키마의 를 반환합니다. 파이프라인에서 스키마 전파 및 확인에 사용됩니다.

확장 메서드

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

추정기 체인에 '캐싱 검사점'을 추가합니다. 이렇게 하면 다운스트림 예측 도구가 캐시된 데이터에 대해 학습됩니다. 여러 데이터 전달을 수행하는 트레이너 앞에 캐싱 검사점이 있으면 도움이 됩니다.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

추정기가 지정된 경우 가 호출되면 Fit(IDataView) 대리자를 호출할 래핑 개체를 반환합니다. 예측 도구가 적합한 항목에 대한 정보를 반환하는 것이 중요하기 때문에 Fit(IDataView) 메서드는 일반 ITransformer가 아닌 특별히 형식화된 개체를 반환합니다. 그러나 동시에 IEstimator<TTransformer> 많은 개체가 있는 파이프라인으로 형성되는 경우가 많으므로 변환기를 가져오려는 추정기가 이 체인의 어딘가에 묻혀 있는 위치를 통해 EstimatorChain<TLastTransformer> 추정기 체인을 빌드해야 할 수 있습니다. 이 시나리오에서는 fit이 호출되면 호출될 대리자를 이 메서드를 통해 연결할 수 있습니다.

적용 대상

추가 정보