IDataView.GetRowCursorSet 方法

定义

这会构造一组并行批处理游标。 n该值是基数的建议限制。 如果 n 为非正值,则表示调用方没有建议,并且实现应有一些默认行为来涵盖此情况。 请注意,这是一项严格建议:实现可以返回不同数量的游标是完全可能的。

游标应返回的数据与返回 GetRowCursor(IEnumerable<DataViewSchema.Column>, Random)的数据相同,但分区除外:没有两个游标应返回的“相同”行,就像通过常规串行游标返回的行一样,但所有行都应由此游标返回的游标之一返回。 游标可以通过使用 Batch 属性让其值在下游协调。

典型的使用模式是请求一组游标,然后每个游标都提供给一组独立使用的工作线程,最终通过利用 Batch 上述属性的顺序最终整理结果。 更典型的方案是从单个串行游标 GetRowCursor(IEnumerable<DataViewSchema.Column>, Random)拉取的内容。

public Microsoft.ML.DataViewRowCursor[] GetRowCursorSet (System.Collections.Generic.IEnumerable<Microsoft.ML.DataViewSchema.Column> columnsNeeded, int n, Random rand = default);
abstract member GetRowCursorSet : seq<Microsoft.ML.DataViewSchema.Column> * int * Random -> Microsoft.ML.DataViewRowCursor[]
Public Function GetRowCursorSet (columnsNeeded As IEnumerable(Of DataViewSchema.Column), n As Integer, Optional rand As Random = Nothing) As DataViewRowCursor()

参数

columnsNeeded
IEnumerable<DataViewSchema.Column>

所需的活动列。 如果传递了空 IEnumerable 的列,则不请求任何列。

n
Int32

建议的并行度。

rand
Random

要对访问进行随机化的实例 Random 进行种子设定。

返回

适用于