Share via


WordBagEstimator 类

定义

public sealed class WordBagEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type WordBagEstimator = class
    interface IEstimator<ITransformer>
Public NotInheritable Class WordBagEstimator
Implements IEstimator(Of ITransformer)
继承
WordBagEstimator
实现

注解

估算器特征

此估算器是否需要查看数据来训练其参数?
输入列数据类型 文本向量
输出列数据类型 已知大小的矢量 Single
可导出到 ONNX

生成的 ITransformer 结果将创建一个新列,该列在输出列名称参数中指定,并从给定数据) 中生成 n 个连续单词的 (序列 (序列。 它通过生成 n 元语法字典并使用字典中的 ID 作为包中的索引来执行此操作。

WordBagEstimator 不同于 NgramExtractingEstimator 前者在内部采用标记化文本,而后者则采用标记化文本作为输入。

有关使用示例的链接,请查看“另请参阅”部分。

方法

Fit(IDataView)

火车并返回一个 ITransformer

GetOutputSchema(SchemaShape)

估算器的架构传播。 如果输入架构形状与提供的架构形状类似,则返回估算器的输出架构形状。

扩展方法

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

将“缓存检查点”追加到估算器链。 这将确保根据缓存的数据训练下游估算器。 在执行多个数据传递的训练器之前,拥有缓存检查点会很有帮助。

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

给定估算器后,返回一个包装对象,该对象将调用委托一次 Fit(IDataView) 。 估算器通常必须返回有关适合的内容的信息,这就是为什么 Fit(IDataView) 该方法返回特定类型化对象的原因,而不仅仅是常规 ITransformer对象。 但是,同时, IEstimator<TTransformer> 通常形成为包含许多对象的管道,因此,我们可能需要通过 EstimatorChain<TLastTransformer> 估算器链生成一个估算器链,以便将转换器埋在此链中的某个位置。 对于该方案,我们可以通过此方法附加一个委托,该委托将在调用拟合后调用。

适用于

另请参阅