TextCatalog.ProduceWordBags 메서드

참조

정의

네임스페이스:: Microsoft.ML

어셈블리:: Microsoft.ML.Transforms.dll

패키지:: Microsoft.ML v3.0.1

패키지:: Microsoft.ML v1.0.0

패키지:: Microsoft.ML v1.1.0

패키지:: Microsoft.ML v1.2.0

패키지:: Microsoft.ML v1.3.1

패키지:: Microsoft.ML v1.4.0

패키지:: Microsoft.ML v1.5.5

패키지:: Microsoft.ML v1.6.0

패키지:: Microsoft.ML v1.7.0

패키지:: Microsoft.ML v2.0.0

중요

일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.

오버로드

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)	WordBagEstimator에 지정된 `inputColumnName` 열을 라는 `outputColumnName`새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	WordBagEstimator에 지정된 `inputColumnName` 열을 라는 `outputColumnName`새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	WordBagEstimator에 지정된 `inputColumnNames` 여러 열을 라는 `outputColumnName`새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

WordBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);

static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator

<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator

매개 변수

catalog: TransformsCatalog.TextTransforms

변환의 카탈로그입니다.

outputColumnName: String

의 변환에서 생성된 열의 이름입니다 inputColumnName. 이 열의 데이터 형식은 의 알려진 크기 벡터입니다 Single.

termSeparator: Char

freqSeparator: Char

inputColumnName: String

데이터를 받을 열의 이름입니다. 사전에 저장할 최대 n그램 수입니다.용어/빈도 쌍을 구분하는 데 사용되는 구분 기호입니다.항을 빈도와 구분하는 데 사용되는 구분 기호입니다. 이 예측 도구는 텍스트 벡터에서 작동합니다.

maximumNgramsCount: Int32

반환

WordBagEstimator

설명

WordBagEstimator NgramExtractingEstimator 는 전자가 내부적으로 텍스트를 토큰화하고 후자는 토큰화된 텍스트를 입력으로 사용합니다.

적용 대상

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);

static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator

<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

매개 변수

catalog: TransformsCatalog.TextTransforms

변환의 카탈로그입니다.

outputColumnName: String

의 변환에서 생성된 열의 이름입니다 inputColumnName. 이 열의 데이터 형식은 의 알려진 크기 벡터입니다 Single.

inputColumnName: String

데이터를 받을 열의 이름입니다. 이 예측 도구는 텍스트 벡터에서 작동합니다.

ngramLength: Int32

Ngram 길이입니다.

skipLength: Int32

n-gram을 생성할 때 건너뛸 최대 토큰 수입니다.

useAllLengths: Boolean

모든 n-gram 길이를 포함할지 아니면 만 ngramLengthngramLength포함할지 여부입니다.

maximumNgramsCount: Int32

사전에 저장할 최대 n그램 수입니다.

weighting: NgramExtractingEstimator.WeightingCriteria

단어가 모음의 문서에 얼마나 중요한지 평가하는 데 사용되는 통계 측정값입니다.

반환

WordBagEstimator

설명

WordBagEstimator NgramExtractingEstimator 는 전자가 내부적으로 텍스트를 토큰화하고 후자는 토큰화된 텍스트를 입력으로 사용합니다.

적용 대상

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator에 지정된 inputColumnNames 여러 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);

static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator

<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

매개 변수

catalog: TransformsCatalog.TextTransforms

변환의 카탈로그입니다.

outputColumnName: String

의 변환에서 생성된 열의 이름입니다 inputColumnNames. 이 열의 데이터 형식은 의 알려진 크기 벡터입니다 Single.

inputColumnNames: String[]

데이터를 가져와야 하는 여러 열의 이름입니다. 이 예측 도구는 텍스트 벡터에서 작동합니다.

ngramLength: Int32

Ngram 길이입니다.

skipLength: Int32

n-gram을 생성할 때 건너뛸 최대 토큰 수입니다.

useAllLengths: Boolean

모든 n-gram 길이를 포함할지 아니면 만 ngramLengthngramLength포함할지 여부입니다.

maximumNgramsCount: Int32

사전에 저장할 최대 n그램 수입니다.

weighting: NgramExtractingEstimator.WeightingCriteria

단어가 모음의 문서에 얼마나 중요한지 평가하는 데 사용되는 통계 측정값입니다.

반환

WordBagEstimator

설명

WordBagEstimator NgramExtractingEstimator 는 전자가 내부적으로 텍스트를 토큰화하고 후자는 토큰화된 텍스트를 입력으로 사용합니다.

적용 대상

다음을 통해 공유

TextCatalog.ProduceWordBags 메서드

정의

오버로드

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

매개 변수

반환

설명

적용 대상

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

매개 변수

반환

설명

적용 대상

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

매개 변수

반환

설명

적용 대상

피드백

추가 리소스