Sdílet prostřednictvím


DataOperationsCatalog Třída

Definice

Třída použitá k vytváření komponent, které pracují s daty, ale nejsou součástí trénovacího kanálu modelu. Zahrnuje komponenty pro načtení, ukládání, ukládání, filtrování, shuffle a rozdělení dat.

public sealed class DataOperationsCatalog
type DataOperationsCatalog = class
Public NotInheritable Class DataOperationsCatalog
Dědičnost
DataOperationsCatalog

Metody

BootstrapSample(IDataView, Nullable<Int32>, Boolean)

Vezměte přibližnou ukázku bootstrap .input

Cache(IDataView, String[])

Vytvoří opožděnou mezipaměť inputv paměti .

CreateEnumerable<TRow>(IDataView, Boolean, Boolean, SchemaDefinition)

Převeďte ho IDataView na silně napsaný IEnumerable<T>.

CrossValidationSplit(IDataView, Int32, String, Nullable<Int32>)

Rozdělte datovou sadu na křížové ověřování překládání trénovací sady a testovací sady. samplingKeyColumnName Respektuje, jestli je k dispozici.

FilterRowsByColumn(IDataView, String, Double, Double)

Vyfiltrujte datovou sadu podle hodnot číselného sloupce.

FilterRowsByKeyColumnFraction(IDataView, String, Double, Double)

Vyfiltrujte datovou sadu podle hodnot KeyDataViewType sloupce.

FilterRowsByMissingValues(IDataView, String[])

Vytáhněte řádky, ve columns kterých libovolný sloupec obsahuje chybějící hodnotu.

LoadFromEnumerable<TRow>(IEnumerable<TRow>, DataViewSchema)

Vytvořte nový IDataView výčet položek uživatelem definovaného typu pomocí zadaného DataViewSchematypu, který může obsahovat více informací o schématu, než může typ zachytit.

LoadFromEnumerable<TRow>(IEnumerable<TRow>, SchemaDefinition)

Vytvořte novou IDataView v výčtu položek uživatelem definovaného typu. Uživatel udržuje vlastnictví data a výsledné zobrazení dat nikdy nezmění obsah souboru data. Vzhledem k tomu IDataView , že se předpokládá, že je neměnný, očekává se, že uživatel bude podporovat více výčtů data , které by vrátily stejné výsledky, pokud uživatel neví, že data budou kurzorem pouze jednou.

Jedním z typických použití pro zobrazení streamovaných dat může být: vytvořte zobrazení dat, které podle potřeby lazily načítá data, a pak na ně použijte předem vytrénované transformace a kurzorem pro výsledky transformace.

ShuffleRows(IDataView, Nullable<Int32>, Int32, Boolean)

Shuffle řádky .input

SkipRows(IDataView, Int64)

Přeskočte count řádky v input.

TakeRows(IDataView, Int64)

Vezměte count řádky z input.

TrainTestSplit(IDataView, Double, String, Nullable<Int32>)

Datovou sadu rozdělte do trénovací sady a testovací sady podle daného zlomku. samplingKeyColumnName Respektuje, jestli je k dispozici.

Metody rozšíření

LoadFromBinary(DataOperationsCatalog, IMultiStreamSource)

IDataView Načtěte soubor z IMultiStreamSource binárního souboru. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

LoadFromBinary(DataOperationsCatalog, String)

IDataView Načtěte soubor z binárního souboru. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

SaveAsBinary(DataOperationsCatalog, IDataView, Stream, Boolean)

Uložte ho IDataView do binárního datového proudu.

FilterByCustomPredicate<TSrc>(DataOperationsCatalog, IDataView, Func<TSrc,Boolean>)

Zahoďte řádky, ve kterých zadaný predikát vrátí hodnotu true.

FilterByStatefulCustomPredicate<TSrc,TState>(DataOperationsCatalog, IDataView, Func<TSrc,TState,Boolean>, Action<TState>)

Zahoďte řádky, ve kterých zadaný predikát vrátí hodnotu true. Tento filtr umožňuje udržovat stav kurzoru.

CreateSvmLightLoader(DataOperationsCatalog, Nullable<Int64>, Int32, Boolean, IMultiStreamSource)

Vytvoří zavaděč, který načte soubory formátu SVM-light. SvmLightLoader.

CreateSvmLightLoaderWithFeatureNames(DataOperationsCatalog, Nullable<Int64>, IMultiStreamSource)

Vytvoří zavaděč, který načte svM-light jako soubory, kde jsou funkce určené jejich názvy.

LoadFromSvmLightFile(DataOperationsCatalog, String, Nullable<Int64>, Int32, Boolean)

IDataView Načtení z textového souboru pomocí SvmLightLoader.

LoadFromSvmLightFileWithFeatureNames(DataOperationsCatalog, String, Nullable<Int64>)

IDataView Načtěte z textového souboru obsahující funkce určené názvy funkcí pomocí SvmLightLoader.

SaveInSvmLightFormat(DataOperationsCatalog, IDataView, Stream, Boolean, Boolean, String, String, String, String)

IDataView Uložte soubor ve formátu SVM-light. Můžete uložit čtyři sloupce: popisek a sloupec funkcí a volitelně sloupec ID skupiny a ukázkový sloupec hmotnosti.

CreateDatabaseLoader(DataOperationsCatalog, DatabaseLoader+Column[])

Vytvořte zavaděč DatabaseLoaderdatabáze .

CreateDatabaseLoader(DataOperationsCatalog, DatabaseLoader+Options)

Vytvořte zavaděč DatabaseLoaderdatabáze .

CreateDatabaseLoader<TInput>(DataOperationsCatalog)

Vytvořte zavaděč DatabaseLoaderdatabáze .

CreateTextLoader(DataOperationsCatalog, TextLoader+Column[], Char, Boolean, IMultiStreamSource, Boolean, Boolean, Boolean)

Vytvořte zavaděč TextLoadertextu .

CreateTextLoader(DataOperationsCatalog, TextLoader+Options, IMultiStreamSource)

Vytvořte zavaděč TextLoadertextu .

CreateTextLoader<TInput>(DataOperationsCatalog, TextLoader+Options, IMultiStreamSource)

Vytvořte zavaděč TextLoader textu tak, že odvozíte schéma datové sady z datového modelu.

CreateTextLoader<TInput>(DataOperationsCatalog, Char, Boolean, IMultiStreamSource, Boolean, Boolean, Boolean)

Vytvořte zavaděč TextLoader textu tak, že odvozíte schéma datové sady z datového modelu.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.

SaveAsText(DataOperationsCatalog, IDataView, Stream, Char, Boolean, Boolean, Boolean, Boolean)

Uložte text IDataView jako text.

Platí pro