OneHotEncodingEstimator 클래스

정의

하나 이상의 범주 값 입력 열을 원 핫 인코딩된 벡터의 많은 출력 열로 변환합니다.

public sealed class OneHotEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotEncodingTransformer>
type OneHotEncodingEstimator = class
    interface IEstimator<OneHotEncodingTransformer>
Public NotInheritable Class OneHotEncodingEstimator
Implements IEstimator(Of OneHotEncodingTransformer)
상속
OneHotEncodingEstimator
구현

설명

추정기 특성

이 예측 도구는 매개 변수를 학습하기 위해 데이터를 확인해야 합니까?
입력 열 데이터 형식 숫자, 부울, 텍스트DateTime 또는 형식의 벡터 또는 스칼라입니다.
출력 열 데이터 형식 의 스칼라 또는 벡터 또는 형식의 Single 벡터입니다.
ONNX로 내보낼 수 있습니다.

입력 OneHotEncodingEstimator 열에 나타나는 고유 값의 사전을 빌드합니다. 그 결과 OneHotEncodingTransformer 하나 이상의 입력 열을 원 핫 인코딩된 벡터의 출력 열 수로 변환합니다.

OneHotEncodingEstimator 범주 데이터를 기계 학습 알고리즘에 제공할 수 있는 형식으로 변환하는 데 자주 사용됩니다.

이 변환의 출력은 다음으로 OneHotEncodingEstimator.OutputKind지정됩니다.

  • Indicator 는 표시기 벡터를 생성합니다. 이 벡터의 각 슬롯은 사전의 범주에 해당하므로 길이는 작성된 사전의 크기입니다. dictioray에서 값을 찾을 수 없는 경우 출력은 0 벡터입니다.

  • Bag 는 각 슬롯이 입력 벡터에 해당 값의 발생 횟수를 저장하기 위해 하나의 벡터를 생성합니다. 이 벡터의 각 슬롯은 사전의 값에 해당하므로 길이는 빌드된 사전의 크기입니다. Indicator 입력 Bag 열의 개별 슬롯에서 생성된 비트 벡터가 집계되는 방식과 다릅니다. 표시기가 연결되고 Bag에 대해 추가됩니다. 원본 열이 스칼라인 경우 표시기 및 모음 옵션은 동일합니다.

  • Key 는 열에 KeyDataViewType 키를 생성합니다. 입력 열이 벡터인 경우 출력에는 벡터의 각 슬롯이 입력 벡터의 해당 슬롯에 해당하는 벡터 형식이 포함됩니다. bulit 사전에서 범주를 찾을 수 없는 경우 값 0이 할당됩니다.

  • Binary 는 입력 열에 있는 사전에 있는 값을 나타내는 이진 인코딩된 벡터를 생성합니다. 입력 열의 값을 사전에 찾을 수 없는 경우 출력은 0 벡터입니다.

OneHotEncodingTransformer는 하나 이상의 열에 적용할 수 있습니다. 이 경우 적용되는 각 열에 대해 별도의 사전을 빌드하고 사용합니다.

사용 예제에 대한 링크는 참고 섹션을 확인하세요.

메서드

Fit(IDataView)

를 학습하고 반환합니다 OneHotEncodingTransformer.

GetOutputSchema(SchemaShape)

변환기에서 SchemaShape 생성할 스키마를 반환합니다. 파이프라인에서 스키마 전파 및 확인에 사용됩니다.

확장 메서드

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

추정기 체인에 '캐싱 검사점'을 추가합니다. 이렇게 하면 다운스트림 추정기가 캐시된 데이터에 대해 학습됩니다. 여러 데이터 전달을 수행하는 트레이너 앞에 캐싱 검사점이 있는 것이 좋습니다.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

추정기가 지정된 경우 호출된 대리 Fit(IDataView) 자를 호출할 래핑 개체를 반환합니다. 예측 도구가 적합한 항목에 대한 정보를 반환하는 것이 중요한 경우가 많습니다. 따라서 Fit(IDataView) 메서드는 일반 ITransformer개체가 아닌 구체적으로 형식화된 개체를 반환합니다. 그러나 동시에 IEstimator<TTransformer> 개체가 많은 파이프라인으로 형성되는 경우가 많으므로 변환기를 가져올 추정기가 이 체인의 어딘가에 묻혀 있는 위치를 통해 EstimatorChain<TLastTransformer> 추정기 체인을 빌드해야 할 수 있습니다. 이 시나리오에서는 이 메서드를 통해 fit이 호출되면 호출될 대리자를 연결할 수 있습니다.

적용 대상

추가 정보