다음을 통해 공유


FastTreeBinaryFeaturizationEstimator 클래스

정의

IEstimator<TTransformer> 입력 기능 벡터를 트리 기반 기능으로 변환하는 입니다.

public sealed class FastTreeBinaryFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastTreeBinaryFeaturizationEstimator = class
    inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastTreeBinaryFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
상속
FastTreeBinaryFeaturizationEstimator

설명

입력 및 출력 열

입력 레이블 열 데이터는 Boolean이어야 합니다. 입력 기능 열 데이터는 의 Single알려진 크기의 벡터여야 합니다.

이 예측 도구는 다음 열을 출력합니다.

출력 열 이름 열 유형 Description
Trees 의 알려진 크기 벡터 Single 모든 트리의 출력 값입니다. 크기는 트리 앙상블 모델의 총 트리 수와 동일합니다.
Leaves 의 알려진 크기 벡터 Single 입력 기능 벡터가 있는 모든 잎의 ID에 대한 0-1 벡터 표현입니다. 크기는 트리 앙상블 모델의 총 잎 수입니다.
Paths 의 알려진 크기 벡터 Single 입력 기능 벡터가 나뭇잎에 도달하기 위해 통과한 경로에 대한 0-1 벡터 표현입니다. 크기는 트리 앙상블 모델의 리프가 아닌 노드 수입니다.

이러한 출력 열은 모두 선택 사항이며 사용자는 이름을 변경할 수 있습니다. 건너뛴 열의 이름이 생성되지 않도록 null로 설정하세요.

예측 세부 정보

이 예측 도구는 트리 앙상블 모델에서 여러 출력 열을 생성합니다. 모델에 의사 결정 트리가 하나만 포함되어 있다고 가정합니다.

               Node 0
               /    \
             /        \
           /            \
         /                \
       Node 1            Node 2
       /    \            /    \
     /        \        /        \
   /            \     Leaf -3  Node 3
  Leaf -1      Leaf -2         /    \
                             /        \
                            Leaf -4  Leaf -5

입력 기능 벡터가 에 속한다고 가정합니다 Leaf -1. 출력 Trees 은 1개 요소 벡터일 수 있습니다. 여기서 유일한 값은 가 수행하는 Leaf -1의사 결정 값입니다. 출력 Leaves 은 0-1 벡터입니다. 도달한 리프가 트리의 $i$-th($-(i+1)$로 인덱싱되어 첫 번째 리프가 Leaf -1) 리프인 경우 의 $i$-th 값 Leaves 은 1이고 다른 모든 값은 0이 됩니다. 출력 Paths 은 리프에 도달하기 전에 통과된 노드의 0-1 표현입니다. 의 $i$-th 요소는 Paths $i$-th 노드($i$로 인덱싱됨)가 터치되는지를 나타냅니다. 예를 들어 $[1, 1, 0, 0]$에 도달 Leaf -1 하면 가 로 표시됩니다 Paths. 여러 개의 트리가 있는 경우 이 예측 도구는 모든 트리에서 의 LeavesPaths를 연결Trees합니다(첫 번째 트리의 정보는 연결된 벡터에서 먼저 제공됨).

사용 예제에 대한 링크는 참고 항목 섹션을 참조하세요.

메서드

Fit(IDataView)

TreeEnsembleModelParameters 에서 호출 InputColumnName 된 열을 세 개의 출력 열에 input 매핑하는 을 생성합니다.

(다음에서 상속됨 TreeEnsembleFeaturizationEstimatorBase)
GetOutputSchema(SchemaShape)

PretrainedTreeFeaturizationEstimator 는 3개의 부동 소수점 열을 에 inputSchema추가합니다. 기능 벡터 열이 지정된 경우 추가된 열은 모든 트리의 예측 값, 기능 벡터가 속하는 리프 ID 및 해당 리프에 대한 경로입니다.

(다음에서 상속됨 TreeEnsembleFeaturizationEstimatorBase)

확장 메서드

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

추정기 체인에 '캐싱 검사점'을 추가합니다. 이렇게 하면 다운스트림 예측 도구가 캐시된 데이터에 대해 학습됩니다. 여러 데이터 전달을 수행하는 트레이너 앞에 캐싱 검사점이 있으면 도움이 됩니다.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

추정기가 지정된 경우 가 호출되면 Fit(IDataView) 대리자를 호출할 래핑 개체를 반환합니다. 예측 도구가 적합한 항목에 대한 정보를 반환하는 것이 중요하기 때문에 Fit(IDataView) 메서드는 일반 ITransformer가 아닌 특별히 형식화된 개체를 반환합니다. 그러나 동시에 IEstimator<TTransformer> 많은 개체가 있는 파이프라인으로 형성되는 경우가 많으므로 변환기를 가져오려는 추정기가 이 체인의 어딘가에 묻혀 있는 위치를 통해 EstimatorChain<TLastTransformer> 추정기 체인을 빌드해야 할 수 있습니다. 이 시나리오에서는 fit이 호출되면 호출될 대리자를 이 메서드를 통해 연결할 수 있습니다.

적용 대상

추가 정보