TreeEnsembleFeaturizationEstimatorBase 类

定义

此类封装所有基于树的特征化器(例如 、、FastForestBinaryFeaturizationEstimatorFastForestRegressionFeaturizationEstimatorFastTreeRegressionFeaturizationEstimatorPretrainedTreeFeaturizationEstimatorFastTreeBinaryFeaturizationEstimator的常见行为。 所有基于树的特征化器共享由 计算的 GetOutputSchema(SchemaShape)相同输出架构。 所有基于树的特征化器都需要输入特征列名称和所有输出列的后缀。 ITransformer返回的 Fit(IDataView) 生成 3 列: (1) 所有树的预测值, (2) 输入特征向量的 ID, (3) 编码这些目标叶的路径的二进制向量。

public abstract class TreeEnsembleFeaturizationEstimatorBase : Microsoft.ML.IEstimator<Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationTransformer>
type TreeEnsembleFeaturizationEstimatorBase = class
    interface IEstimator<TreeEnsembleFeaturizationTransformer>
Public MustInherit Class TreeEnsembleFeaturizationEstimatorBase
Implements IEstimator(Of TreeEnsembleFeaturizationTransformer)
继承
TreeEnsembleFeaturizationEstimatorBase
派生
实现

方法

Fit(IDataView)

生成一个 , TreeEnsembleModelParameters 它将调用 InputColumnNameinput 列映射到三个输出列。

GetOutputSchema(SchemaShape)

PretrainedTreeFeaturizationEstimator 将三个浮向量列添加到 中 inputSchema。 给定特征向量列,添加的列是所有树的预测值、特征向量所属的叶 ID 以及这些树叶的路径。

扩展方法

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

将“缓存检查点”追加到估算器链。 这将确保针对缓存的数据训练下游估算器。 在采用多个数据传递的培训师之前设置缓存检查点会很有帮助。

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

给定估算器后,返回一个包装对象,该对象在调用委托后 Fit(IDataView) 将调用委托。 估算器通常必须返回有关适合的内容的信息,这就是方法返回特定类型对象(而不仅仅是常规 ITransformer对象)的原因Fit(IDataView)。 但是,同时, IEstimator<TTransformer> 通常会形成包含许多对象的管道,因此,我们可能需要通过 EstimatorChain<TLastTransformer> 生成一个估算器链,其中,要获取转换器的估算器埋在此链中的某个位置。 对于这种情况,我们可以通过此方法附加一个委托,该委托将在调用拟合后调用。

适用于