TextLoaderSaverCatalog.LoadFromTextFile Metoda
Definice
Důležité
Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.
Přetížení
LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options) |
IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu. |
LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean) |
IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu. |
LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options) |
IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu. |
LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean) |
IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu. |
LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)
IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.
public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options = default);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, Optional options As TextLoader.Options = Nothing) As IDataView
Parametry
- catalog
- DataOperationsCatalog
Katalog DataOperationsCatalog .
- path
- String
Určuje soubor nebo cestu k souborům, ze kterých se má načíst.
- options
- TextLoader.Options
Definuje nastavení operace načítání.
Návraty
Příklady
using System;
using System.Collections.Generic;
using System.IO;
using Microsoft.ML;
namespace Samples.Dynamic
{
public static class SaveAndLoadFromText
{
public static void Example()
{
// Create a new context for ML.NET operations. It can be used for
// exception tracking and logging, as a catalog of available operations
// and as the source of randomness. Setting the seed to a fixed number
// in this example to make outputs deterministic.
var mlContext = new MLContext(seed: 0);
// Create a list of training data points.
var dataPoints = new List<DataPoint>()
{
new DataPoint(){ Label = 0, Features = 4},
new DataPoint(){ Label = 0, Features = 5},
new DataPoint(){ Label = 0, Features = 6},
new DataPoint(){ Label = 1, Features = 8},
new DataPoint(){ Label = 1, Features = 9},
};
// Convert the list of data points to an IDataView object, which is
// consumable by ML.NET API.
IDataView data = mlContext.Data.LoadFromEnumerable(dataPoints);
// Create a FileStream object and write the IDataView to it as a text
// file.
using (FileStream stream = new FileStream("data.tsv", FileMode.Create))
mlContext.Data.SaveAsText(data, stream);
// Create an IDataView object by loading the text file.
IDataView loadedData = mlContext.Data.LoadFromTextFile("data.tsv");
// Inspect the data that is loaded from the previously saved text file.
var loadedDataEnumerable = mlContext.Data
.CreateEnumerable<DataPoint>(loadedData, reuseRowObject: false);
foreach (DataPoint row in loadedDataEnumerable)
Console.WriteLine($"{row.Label}, {row.Features}");
// Preview of the loaded data.
// 0, 4
// 0, 5
// 0, 6
// 1, 8
// 1, 9
}
// Example with label and feature values. A data set is a collection of such
// examples.
private class DataPoint
{
public float Label { get; set; }
public float Features { get; set; }
}
}
}
Platí pro
LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)
IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.
public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Column[] columns, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Column[] * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, columns As TextLoader.Column(), Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView
Parametry
- catalog
- DataOperationsCatalog
Katalog DataOperationsCatalog .
- path
- String
Cesta k souborům
- columns
- TextLoader.Column[]
Sloupce schématu.
- separatorChar
- Char
Znak použitý jako oddělovač mezi datovými body v řádku. Ve výchozím nastavení se znak tabulátoru používá jako oddělovač.
- hasHeader
- Boolean
Určuje, jestli soubor obsahuje záhlaví. Když true
zavaděč přeskočí první řádek při Load(IMultiStreamSource) zavolání.
- allowQuoting
- Boolean
Určuje, jestli vstup může obsahovat dvojité uvozové hodnoty. Tento parametr slouží k rozlišení znaků oddělovače ve vstupní hodnotě od skutečných oddělovačů. Pokud true
jsou oddělovače v uvozovkách považovány za součást vstupní hodnoty. Když false
se všechny oddělovače, i ty whitinové uvozovky, považují za oddělovač nového sloupce.
Používá se také k rozlišení prázdných hodnot od chybějících hodnot. Pokud true
jsou chybějící hodnoty označeny po sobě jdoucími oddělovači a prázdnými hodnotami podle "". Pokud false
jsou prázdné hodnoty označeny po sobě jdoucími oddělovači a chybějícími hodnotami ve výchozím nastavení chybí hodnota pro každý typ dokumentovaný v DataKind.
- trimWhitespace
- Boolean
Odeberte koncové prázdné znaky z čar.
- allowSparse
- Boolean
Zda vstup může obsahovat řídké reprezentace. Například řádek obsahující "5 2:6 4:3" znamená, že existují 5 sloupců a jediný nenulový je sloupec 2 a 4, který má hodnoty 6 a 3. Indexy sloupců jsou založené na nule, takže sloupce 2 a 4 představují třetí a 5. sloupce. Sloupec může mít také husté hodnoty následované řídkými hodnotami reprezentovanými tímto způsobem. Například řádek obsahující 1 2 5 5 2:6 4:3 představuje dva husté sloupce s hodnotami 1 a 2, následovanými 5 řídkými reprezentovanými sloupci s hodnotami 0, 0, 6, 0 a 3. Indexy řídkých sloupců začínají od 0, i když 0 představuje třetí sloupec.
Návraty
Zobrazení dat.
Platí pro
LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)
IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.
public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, options As TextLoader.Options) As IDataView
Parametry typu
- TInput
Parametry
- catalog
- DataOperationsCatalog
Katalog DataOperationsCatalog .
- path
- String
Určuje soubor nebo cestu k souborům, ze kterých se má načíst.
- options
- TextLoader.Options
Definuje nastavení operace načítání. Není nutné zadat pole Sloupce, protože sloupce budou odvozeny touto metodou.
Návraty
Zobrazení dat.
Platí pro
LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)
IDataView Načtení z textového souboru pomocí TextLoader. Mějte na paměti, že IDataViewje opožděné, takže se tady nestane žádné skutečné načítání, jen ověření schématu.
public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView
Parametry typu
- TInput
Parametry
- catalog
- DataOperationsCatalog
Katalog DataOperationsCatalog .
- path
- String
Cesta k souborům
- separatorChar
- Char
Znak oddělovače sloupců Výchozí hodnota je \t.
- hasHeader
- Boolean
Určuje, jestli soubor obsahuje záhlaví. Když true
zavaděč přeskočí první řádek při Load(IMultiStreamSource) zavolání.
- allowQuoting
- Boolean
Určuje, jestli vstup může obsahovat dvojité uvozové hodnoty. Tento parametr slouží k rozlišení znaků oddělovače ve vstupní hodnotě od skutečných oddělovačů. Pokud true
jsou oddělovače v uvozovkách považovány za součást vstupní hodnoty. Když false
se všechny oddělovače, i ty whitinové uvozovky, považují za oddělovač nového sloupce.
Používá se také k rozlišení prázdných hodnot od chybějících hodnot. Pokud true
jsou chybějící hodnoty označeny po sobě jdoucími oddělovači a prázdnými hodnotami podle "". Pokud false
jsou prázdné hodnoty označeny po sobě jdoucími oddělovači a chybějícími hodnotami ve výchozím nastavení chybí hodnota pro každý typ dokumentovaný v DataKind.
- trimWhitespace
- Boolean
Odeberte koncové prázdné znaky z čar.
- allowSparse
- Boolean
Zda vstup může obsahovat řídké reprezentace. Například řádek obsahující "5 2:6 4:3" znamená, že existují 5 sloupců a jediný nenulový je sloupec 2 a 4, který má hodnoty 6 a 3. Indexy sloupců jsou založené na nule, takže sloupce 2 a 4 představují třetí a 5. sloupce. Sloupec může mít také husté hodnoty následované řídkými hodnotami reprezentovanými tímto způsobem. Například řádek obsahující 1 2 5 5 2:6 4:3 představuje dva husté sloupce s hodnotami 1 a 2, následovanými 5 řídkými reprezentovanými sloupci s hodnotami 0, 0, 6, 0 a 3. Indexy řídkých sloupců začínají od 0, i když 0 představuje třetí sloupec.
Návraty
Zobrazení dat.