DataOperationsCatalog 類別

定義

用來建立對資料運作但不是模型定型管線一部分的元件類別。 包含要載入、儲存、快取、篩選、隨機處理和分割資料的元件。

public sealed class DataOperationsCatalog
type DataOperationsCatalog = class
Public NotInheritable Class DataOperationsCatalog
繼承
DataOperationsCatalog

方法

BootstrapSample(IDataView, Nullable<Int32>, Boolean)

取得 的 input 近似啟動程式範例。

Cache(IDataView, String[])

建立 的 input 延遲記憶體內部快取。

CreateEnumerable<TRow>(IDataView, Boolean, Boolean, SchemaDefinition)

IDataView將 轉換成強型別 IEnumerable<T>

CrossValidationSplit(IDataView, Int32, String, Nullable<Int32>)

將資料集分割成定型集和測試集的交叉驗證折迭。 如果提供, samplingKeyColumnName 則遵守 。

FilterRowsByColumn(IDataView, String, Double, Double)

依數值資料行的值篩選資料集。

FilterRowsByKeyColumnFraction(IDataView, String, Double, Double)

依資料行的值 KeyDataViewType 篩選資料集。

FilterRowsByMissingValues(IDataView, String[])

卸載中 columns 任何資料行包含遺漏值的資料列。

LoadFromEnumerable<TRow>(IEnumerable<TRow>, DataViewSchema)

使用提供的 DataViewSchema ,在使用者定義型別專案的可列舉上建立新的 IDataView ,這可能包含架構的詳細資訊,而不是類型可以擷取。

LoadFromEnumerable<TRow>(IEnumerable<TRow>, SchemaDefinition)

在使用者定義型別專案的可列舉上建立新的 IDataView 。 使用者會維護 的 data 擁有權,而產生的資料檢視永遠不會改變 的內容 data 。 由於 IDataView 假設為不可變,因此使用者預期支援會傳回相同結果之 的 data 多個列舉,除非使用者知道資料只會游標一次。

串流資料檢視的一個典型用法可能是:建立資料檢視,以視需要延遲載入資料,然後將預先定型的轉換套用至該檢視,並透過資料指標取得轉換結果。

ShuffleRows(IDataView, Nullable<Int32>, Int32, Boolean)

隨機顯示 的資料 input 列。

SkipRows(IDataView, Int64)

略過 count 中的資料 input 列。

TakeRows(IDataView, Int64)

input 取得 count 資料列。

TrainTestSplit(IDataView, Double, String, Nullable<Int32>)

根據指定的分數,將資料集分割成定型集和測試集。 如果提供, samplingKeyColumnName 則遵守 。

擴充方法

LoadFromBinary(DataOperationsCatalog, IMultiStreamSource)

IDataViewIMultiStreamSource 二進位檔案載入 。 請注意, IDataView 's 是延遲的,因此此處不會發生任何實際的載入,只是架構驗證。

LoadFromBinary(DataOperationsCatalog, String)

IDataView從二進位檔案載入 。 請注意, IDataView 's 是延遲的,因此此處不會發生任何實際的載入,只是架構驗證。

SaveAsBinary(DataOperationsCatalog, IDataView, Stream, Boolean)

IDataView 儲存至二進位資料流程。

FilterByCustomPredicate<TSrc>(DataOperationsCatalog, IDataView, Func<TSrc,Boolean>)

卸載指定述詞傳回 true 的資料列。

FilterByStatefulCustomPredicate<TSrc,TState>(DataOperationsCatalog, IDataView, Func<TSrc,TState,Boolean>, Action<TState>)

卸載指定述詞傳回 true 的資料列。 此篩選準則允許維護每個資料指標狀態。

CreateSvmLightLoader(DataOperationsCatalog, Nullable<Int64>, Int32, Boolean, IMultiStreamSource)

建立載入器,以載入 SVM 光格式檔案。 SvmLightLoader.

CreateSvmLightLoaderWithFeatureNames(DataOperationsCatalog, Nullable<Int64>, IMultiStreamSource)

建立載入器,以載入 SVM 輕量型檔案,其中功能是由其名稱所指定。

LoadFromSvmLightFile(DataOperationsCatalog, String, Nullable<Int64>, Int32, Boolean)

IDataView使用 SvmLightLoader 從文字檔載入 。

LoadFromSvmLightFileWithFeatureNames(DataOperationsCatalog, String, Nullable<Int64>)

IDataView使用 SvmLightLoader 從包含功能名稱所指定功能的文字檔載入 。

SaveInSvmLightFormat(DataOperationsCatalog, IDataView, Stream, Boolean, Boolean, String, String, String, String)

IDataView以 SVM 光線格式儲存 。 可以儲存四個數據行:標籤和功能資料行,以及選擇性地儲存群組識別碼資料行和範例加權資料行。

CreateDatabaseLoader(DataOperationsCatalog, DatabaseLoader+Column[])

建立資料庫載入器 DatabaseLoader

CreateDatabaseLoader(DataOperationsCatalog, DatabaseLoader+Options)

建立資料庫載入器 DatabaseLoader

CreateDatabaseLoader<TInput>(DataOperationsCatalog)

建立資料庫載入器 DatabaseLoader

CreateTextLoader(DataOperationsCatalog, TextLoader+Column[], Char, Boolean, IMultiStreamSource, Boolean, Boolean, Boolean)

建立文字載入器 TextLoader

CreateTextLoader(DataOperationsCatalog, TextLoader+Options, IMultiStreamSource)

建立文字載入器 TextLoader

CreateTextLoader<TInput>(DataOperationsCatalog, TextLoader+Options, IMultiStreamSource)

從資料模型類型推斷資料集架構,以建立文字載入器 TextLoader

CreateTextLoader<TInput>(DataOperationsCatalog, Char, Boolean, IMultiStreamSource, Boolean, Boolean, Boolean)

從資料模型類型推斷資料集架構,以建立文字載入器 TextLoader

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

IDataView使用 TextLoader 從文字檔載入 。 請注意, IDataView 's 是延遲的,因此此處不會發生任何實際的載入,只是架構驗證。

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

IDataView使用 TextLoader 從文字檔載入 。 請注意, IDataView 's 是延遲的,因此此處不會發生任何實際的載入,只是架構驗證。

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

IDataView使用 TextLoader 從文字檔載入 。 請注意, IDataView 's 是延遲的,因此此處不會發生任何實際的載入,只是架構驗證。

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

IDataView使用 TextLoader 從文字檔載入 。 請注意, IDataView 's 是延遲的,因此此處不會發生任何實際的載入,只是架構驗證。

SaveAsText(DataOperationsCatalog, IDataView, Stream, Char, Boolean, Boolean, Boolean, Boolean)

IDataView 存成文字。

適用於