다음을 통해 공유


DataOperationsCatalog 클래스

정의

데이터에서 작동하지만 모델 학습 파이프라인의 일부가 아닌 구성 요소를 만드는 데 사용되는 클래스입니다. 데이터를 로드, 저장, 캐시, 필터링, 순서 섞기 및 분할하는 구성 요소를 포함합니다.

public sealed class DataOperationsCatalog
type DataOperationsCatalog = class
Public NotInheritable Class DataOperationsCatalog
상속
DataOperationsCatalog

메서드

BootstrapSample(IDataView, Nullable<Int32>, Boolean)

대략적인 부트스트랩 샘플을 input사용합니다.

Cache(IDataView, String[])

의 지연 메모리 내 캐시를 input만듭니다.

CreateEnumerable<TRow>(IDataView, Boolean, Boolean, SchemaDefinition)

IDataView 강력한 형식IEnumerable<T>으로 변환합니다.

CrossValidationSplit(IDataView, Int32, String, Nullable<Int32>)

데이터 세트를 학습 집합 및 테스트 집합의 교차 유효성 검사 접기로 분할합니다. 제공된 경우를 samplingKeyColumnName 존중합니다.

FilterRowsByColumn(IDataView, String, Double, Double)

데이터 세트를 숫자 열의 값으로 필터링합니다.

FilterRowsByKeyColumnFraction(IDataView, String, Double, Double)

데이터 세트를 열 값으로 필터링합니다 KeyDataViewType .

FilterRowsByMissingValues(IDataView, String[])

열에 누락된 값이 columns 포함된 행을 삭제합니다.

LoadFromEnumerable<TRow>(IEnumerable<TRow>, DataViewSchema)

제공된 DataViewSchema형식을 사용하여 사용자 정의 형식의 항목 열거형을 통해 새로 IDataView 만듭니다. 이 항목에는 형식이 캡처할 수 있는 것보다 스키마에 대한 자세한 정보가 포함될 수 있습니다.

LoadFromEnumerable<TRow>(IEnumerable<TRow>, SchemaDefinition)

사용자 정의 형식의 항목 열거형을 통해 새로 IDataView 만듭니다. 사용자는 소유권 data 을 유지 관리하며 결과 데이터 뷰는 해당 data내용이 변경되지 않습니다. IDataView 변경할 수 없는 것으로 간주되므로 사용자는 데이터가 한 번만 커서로 처리된다는 것을 알지 못하면 동일한 결과를 반환하는 여러 열거 data 형을 지원해야 합니다.

스트리밍 데이터 뷰에 대한 일반적인 사용 방법 중 하나는 필요에 따라 데이터를 지연적으로 로드하는 데이터 뷰를 만든 다음 미리 학습된 변환을 적용하고 변환 결과를 위해 이를 통해 커서를 사용하는 것입니다.

ShuffleRows(IDataView, Nullable<Int32>, Int32, Boolean)

의 행을 섞습니다 input.

SkipRows(IDataView, Int64)

에서 input행 건너뛰 count

TakeRows(IDataView, Int64)

에서 input행을 가져옵니다count.

TrainTestSplit(IDataView, Double, String, Nullable<Int32>)

데이터 세트를 학습 집합으로 분할하고 지정된 분수에 따라 테스트 집합을 테스트합니다. 제공된 경우를 samplingKeyColumnName 존중합니다.

확장 메서드

LoadFromBinary(DataOperationsCatalog, IMultiStreamSource)

IDataView 이진 파일에서 IMultiStreamSource 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

LoadFromBinary(DataOperationsCatalog, String)

IDataView 이진 파일에서 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

SaveAsBinary(DataOperationsCatalog, IDataView, Stream, Boolean)

IDataView 진 스트림에 저장합니다.

FilterByCustomPredicate<TSrc>(DataOperationsCatalog, IDataView, Func<TSrc,Boolean>)

지정된 조건자가 true를 반환하는 행을 삭제합니다.

FilterByStatefulCustomPredicate<TSrc,TState>(DataOperationsCatalog, IDataView, Func<TSrc,TState,Boolean>, Action<TState>)

지정된 조건자가 true를 반환하는 행을 삭제합니다. 이 필터를 사용하면 커서당 상태를 유지할 수 있습니다.

CreateSvmLightLoader(DataOperationsCatalog, Nullable<Int64>, Int32, Boolean, IMultiStreamSource)

SVM 라이트 형식 파일을 로드하는 로더를 만듭니다. SvmLightLoader.

CreateSvmLightLoaderWithFeatureNames(DataOperationsCatalog, Nullable<Int64>, IMultiStreamSource)

SVM 라이트와 같은 파일을 로드하는 로더를 만듭니다. 여기서 기능은 해당 이름으로 지정됩니다.

LoadFromSvmLightFile(DataOperationsCatalog, String, Nullable<Int64>, Int32, Boolean)

IDataView 사용하여 SvmLightLoader텍스트 파일에서 로드합니다.

LoadFromSvmLightFileWithFeatureNames(DataOperationsCatalog, String, Nullable<Int64>)

IDataView 를 사용하여 SvmLightLoader기능 이름으로 지정된 기능을 포함하는 텍스트 파일에서 로드합니다.

SaveInSvmLightFormat(DataOperationsCatalog, IDataView, Stream, Boolean, Boolean, String, String, String, String)

IDataView SVM 조명 형식으로 저장합니다. 레이블과 기능 열, 선택적으로 그룹 ID 열 및 예제 가중치 열 등 네 개의 열을 저장할 수 있습니다.

CreateDatabaseLoader(DataOperationsCatalog, DatabaseLoader+Column[])

데이터베이스 로더를 만듭니다 DatabaseLoader.

CreateDatabaseLoader(DataOperationsCatalog, DatabaseLoader+Options)

데이터베이스 로더를 만듭니다 DatabaseLoader.

CreateDatabaseLoader<TInput>(DataOperationsCatalog)

데이터베이스 로더를 만듭니다 DatabaseLoader.

CreateTextLoader(DataOperationsCatalog, TextLoader+Column[], Char, Boolean, IMultiStreamSource, Boolean, Boolean, Boolean)

텍스트 로더를 만듭니다 TextLoader.

CreateTextLoader(DataOperationsCatalog, TextLoader+Options, IMultiStreamSource)

텍스트 로더를 만듭니다 TextLoader.

CreateTextLoader<TInput>(DataOperationsCatalog, TextLoader+Options, IMultiStreamSource)

데이터 모델 형식에서 데이터 세트 스키마를 유추하여 텍스트 로더 TextLoader 를 만듭니다.

CreateTextLoader<TInput>(DataOperationsCatalog, Char, Boolean, IMultiStreamSource, Boolean, Boolean, Boolean)

데이터 모델 형식에서 데이터 세트 스키마를 유추하여 텍스트 로더 TextLoader 를 만듭니다.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Column[], Char, Boolean, Boolean, Boolean, Boolean)

IDataView 사용하여 TextLoader텍스트 파일에서 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

LoadFromTextFile(DataOperationsCatalog, String, TextLoader+Options)

IDataView 사용하여 TextLoader텍스트 파일에서 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, TextLoader+Options)

IDataView 사용하여 TextLoader텍스트 파일에서 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

LoadFromTextFile<TInput>(DataOperationsCatalog, String, Char, Boolean, Boolean, Boolean, Boolean)

IDataView 사용하여 TextLoader텍스트 파일에서 로드합니다. IDataView'는 지연되므로 여기서는 실제 로드가 발생하지 않고 스키마 유효성 검사만 수행합니다.

SaveAsText(DataOperationsCatalog, IDataView, Stream, Char, Boolean, Boolean, Boolean, Boolean)

텍스트로 IDataView 저장합니다.

적용 대상