TextLoaderSaverCatalog.LoadFromTextFile 메서드

정의

오버로드

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

IDataView 사용하여 TextLoader텍스트 파일에서 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

IDataView 사용하여 TextLoader텍스트 파일에서 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

IDataView 사용하여 TextLoader텍스트 파일에서 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

IDataView 사용하여 TextLoader텍스트 파일에서 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

IDataView 사용하여 TextLoader텍스트 파일에서 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options = default);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, Optional options As TextLoader.Options = Nothing) As IDataView

매개 변수

catalog
DataOperationsCatalog

카탈로그입니다 DataOperationsCatalog .

path
String

로드할 파일 또는 파일의 경로를 지정합니다.

options
TextLoader.Options

로드 작업의 설정을 정의합니다.

반환

예제

using System;
using System.Collections.Generic;
using System.IO;
using Microsoft.ML;

namespace Samples.Dynamic
{
    public static class SaveAndLoadFromText
    {
        public static void Example()
        {
            // Create a new context for ML.NET operations. It can be used for
            // exception tracking and logging, as a catalog of available operations
            // and as the source of randomness. Setting the seed to a fixed number
            // in this example to make outputs deterministic.
            var mlContext = new MLContext(seed: 0);

            // Create a list of training data points.
            var dataPoints = new List<DataPoint>()
            {
                new DataPoint(){ Label = 0, Features = 4},
                new DataPoint(){ Label = 0, Features = 5},
                new DataPoint(){ Label = 0, Features = 6},
                new DataPoint(){ Label = 1, Features = 8},
                new DataPoint(){ Label = 1, Features = 9},
            };

            // Convert the list of data points to an IDataView object, which is
            // consumable by ML.NET API.
            IDataView data = mlContext.Data.LoadFromEnumerable(dataPoints);

            // Create a FileStream object and write the IDataView to it as a text
            // file.
            using (FileStream stream = new FileStream("data.tsv", FileMode.Create))
                mlContext.Data.SaveAsText(data, stream);

            // Create an IDataView object by loading the text file.
            IDataView loadedData = mlContext.Data.LoadFromTextFile("data.tsv");

            // Inspect the data that is loaded from the previously saved text file.
            var loadedDataEnumerable = mlContext.Data
                .CreateEnumerable<DataPoint>(loadedData, reuseRowObject: false);

            foreach (DataPoint row in loadedDataEnumerable)
                Console.WriteLine($"{row.Label}, {row.Features}");

            // Preview of the loaded data.
            // 0, 4
            // 0, 5
            // 0, 6
            // 1, 8
            // 1, 9
        }

        // Example with label and feature values. A data set is a collection of such
        // examples.
        private class DataPoint
        {
            public float Label { get; set; }

            public float Features { get; set; }
        }
    }
}

적용 대상

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

IDataView 사용하여 TextLoader텍스트 파일에서 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

public static Microsoft.ML.IDataView LoadFromTextFile (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Column[] columns, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Column[] * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile (catalog As DataOperationsCatalog, path As String, columns As TextLoader.Column(), Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

매개 변수

catalog
DataOperationsCatalog

카탈로그입니다 DataOperationsCatalog .

path
String

파일의 경로입니다.

columns
TextLoader.Column[]

스키마의 열입니다.

separatorChar
Char

행의 데이터 요소를 구분 기호로 사용하는 문자입니다. 기본적으로 탭 문자는 구분 기호로 사용됩니다.

hasHeader
Boolean

파일에 헤더가 있는지 여부입니다. 이때 true로더는 호출될 때 Load(IMultiStreamSource) 첫 번째 줄을 건너뜁니다.

allowQuoting
Boolean

입력에 큰따옴표가 붙은 값이 포함될 수 있는지 여부입니다. 이 매개 변수는 입력 값의 구분 기호 문자를 실제 구분 기호와 구분하는 데 사용됩니다. 이 경우 true큰따옴표 안의 구분 기호가 입력 값의 일부로 처리됩니다. false모든 구분 기호, 심지어 해당 휘틴 따옴표가 새 열을 구분하는 것으로 처리되는 경우. 빈 값과 누락된 값을 구분하는 데도 사용됩니다. 이 경우 true누락된 값은 연속 구분 기호로 표시되고 빈 값은 ""로 표시됩니다. 빈 false값은 연속 구분 기호로 표시되고 누락된 값은 문서화된 DataKind각 형식에 대한 기본 누락 값으로 표시됩니다.

trimWhitespace
Boolean

줄에서 후행 공백을 제거합니다.

allowSparse
Boolean

입력에 스파스 표현이 포함될 수 있는지 여부입니다. 예를 들어 "5 2:6 4:3"을 포함하는 행은 5개의 열이 있음을 의미하며, 0이 아닌 열은 각각 값 6과 3이 있는 열 2와 4입니다. 열 인덱스는 0부터 시작하는 것이므로 열 2와 4는 3번째 열과 5번째 열을 나타냅니다. 열에는 조밀한 값과 이 방식으로 표현된 스파스 값이 있을 수도 있습니다. 예를 들어 "1 2 5 2:6 4:3"이 포함된 행은 값이 1과 2인 두 개의 조밀한 열을 나타내고 그 뒤에 값이 0, 0, 6, 0 및 3인 5개의 드물게 표시되는 열을 나타냅니다. 스파스 열의 인덱스는 0부터 시작하지만 0은 세 번째 열을 나타냅니다.

반환

데이터 뷰입니다.

적용 대상

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

IDataView 사용하여 TextLoader텍스트 파일에서 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, Microsoft.ML.Data.TextLoader.Options options);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * Microsoft.ML.Data.TextLoader.Options -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, options As TextLoader.Options) As IDataView

형식 매개 변수

TInput

매개 변수

catalog
DataOperationsCatalog

카탈로그입니다 DataOperationsCatalog .

path
String

로드할 파일 또는 파일의 경로를 지정합니다.

options
TextLoader.Options

로드 작업의 설정을 정의합니다. 열은 이 메서드에 의해 유추되므로 열 필드를 지정할 필요가 없습니다.

반환

데이터 뷰입니다.

적용 대상

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

IDataView 사용하여 TextLoader텍스트 파일에서 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

public static Microsoft.ML.IDataView LoadFromTextFile<TInput> (this Microsoft.ML.DataOperationsCatalog catalog, string path, char separatorChar = '\t', bool hasHeader = false, bool allowQuoting = false, bool trimWhitespace = false, bool allowSparse = false);
static member LoadFromTextFile : Microsoft.ML.DataOperationsCatalog * string * char * bool * bool * bool * bool -> Microsoft.ML.IDataView
<Extension()>
Public Function LoadFromTextFile(Of TInput) (catalog As DataOperationsCatalog, path As String, Optional separatorChar As Char = '\t', Optional hasHeader As Boolean = false, Optional allowQuoting As Boolean = false, Optional trimWhitespace As Boolean = false, Optional allowSparse As Boolean = false) As IDataView

형식 매개 변수

TInput

매개 변수

catalog
DataOperationsCatalog

카탈로그입니다 DataOperationsCatalog .

path
String

파일의 경로입니다.

separatorChar
Char

열 구분 기호 문자입니다. 기본값은 '\t'입니다.

hasHeader
Boolean

파일에 헤더가 있는지 여부입니다. 이때 true로더는 호출될 때 Load(IMultiStreamSource) 첫 번째 줄을 건너뜁니다.

allowQuoting
Boolean

입력에 큰따옴표가 붙은 값이 포함될 수 있는지 여부입니다. 이 매개 변수는 입력 값의 구분 기호 문자를 실제 구분 기호와 구분하는 데 사용됩니다. 이 경우 true큰따옴표 안의 구분 기호가 입력 값의 일부로 처리됩니다. false모든 구분 기호, 심지어 해당 휘틴 따옴표가 새 열을 구분하는 것으로 처리되는 경우. 빈 값과 누락된 값을 구분하는 데도 사용됩니다. 이 경우 true누락된 값은 연속 구분 기호로 표시되고 빈 값은 ""로 표시됩니다. 빈 false값은 연속 구분 기호로 표시되고 누락된 값은 문서화된 DataKind각 형식에 대한 기본 누락 값으로 표시됩니다.

trimWhitespace
Boolean

줄에서 후행 공백을 제거합니다.

allowSparse
Boolean

입력에 스파스 표현이 포함될 수 있는지 여부입니다. 예를 들어 "5 2:6 4:3"을 포함하는 행은 5개의 열이 있음을 의미하며, 0이 아닌 열은 각각 값 6과 3이 있는 열 2와 4입니다. 열 인덱스는 0부터 시작하는 것이므로 열 2와 4는 3번째 열과 5번째 열을 나타냅니다. 열에는 조밀한 값과 이 방식으로 표현된 스파스 값이 있을 수도 있습니다. 예를 들어 "1 2 5 2:6 4:3"이 포함된 행은 값이 1과 2인 두 개의 조밀한 열을 나타내고 그 뒤에 값이 0, 0, 6, 0 및 3인 5개의 드물게 표시되는 열을 나타냅니다. 스파스 열의 인덱스는 0부터 시작하지만 0은 세 번째 열을 나타냅니다.

반환

데이터 뷰입니다.

적용 대상