TextCatalog.ProduceWordBags 메서드

정의

오버로드

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

WordBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator에 지정된 inputColumnNames 여러 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

WordBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator

매개 변수

catalog
TransformsCatalog.TextTransforms

변환의 카탈로그입니다.

outputColumnName
String

의 변환에서 생성된 열의 이름입니다 inputColumnName. 이 열의 데이터 형식은 의 알려진 크기 벡터입니다 Single.

termSeparator
Char
freqSeparator
Char
inputColumnName
String

데이터를 받을 열의 이름입니다. 사전에 저장할 최대 n그램 수입니다.용어/빈도 쌍을 구분하는 데 사용되는 구분 기호입니다.항을 빈도와 구분하는 데 사용되는 구분 기호입니다. 이 예측 도구는 텍스트 벡터에서 작동합니다.

maximumNgramsCount
Int32

반환

설명

WordBagEstimatorNgramExtractingEstimator 는 전자가 내부적으로 텍스트를 토큰화하고 후자는 토큰화된 텍스트를 입력으로 사용합니다.

적용 대상

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator에 지정된 inputColumnName 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

매개 변수

catalog
TransformsCatalog.TextTransforms

변환의 카탈로그입니다.

outputColumnName
String

의 변환에서 생성된 열의 이름입니다 inputColumnName. 이 열의 데이터 형식은 의 알려진 크기 벡터입니다 Single.

inputColumnName
String

데이터를 받을 열의 이름입니다. 이 예측 도구는 텍스트 벡터에서 작동합니다.

ngramLength
Int32

Ngram 길이입니다.

skipLength
Int32

n-gram을 생성할 때 건너뛸 최대 토큰 수입니다.

useAllLengths
Boolean

모든 n-gram 길이를 포함할지 아니면 만 ngramLengthngramLength포함할지 여부입니다.

maximumNgramsCount
Int32

사전에 저장할 최대 n그램 수입니다.

weighting
NgramExtractingEstimator.WeightingCriteria

단어가 모음의 문서에 얼마나 중요한지 평가하는 데 사용되는 통계 측정값입니다.

반환

설명

WordBagEstimatorNgramExtractingEstimator 는 전자가 내부적으로 텍스트를 토큰화하고 후자는 토큰화된 텍스트를 입력으로 사용합니다.

적용 대상

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator에 지정된 inputColumnNames 여러 열을 라는 outputColumnName새 열의 n-gram 개수 벡터에 매핑하는 를 만듭니다.

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

매개 변수

catalog
TransformsCatalog.TextTransforms

변환의 카탈로그입니다.

outputColumnName
String

의 변환에서 생성된 열의 이름입니다 inputColumnNames. 이 열의 데이터 형식은 의 알려진 크기 벡터입니다 Single.

inputColumnNames
String[]

데이터를 가져와야 하는 여러 열의 이름입니다. 이 예측 도구는 텍스트 벡터에서 작동합니다.

ngramLength
Int32

Ngram 길이입니다.

skipLength
Int32

n-gram을 생성할 때 건너뛸 최대 토큰 수입니다.

useAllLengths
Boolean

모든 n-gram 길이를 포함할지 아니면 만 ngramLengthngramLength포함할지 여부입니다.

maximumNgramsCount
Int32

사전에 저장할 최대 n그램 수입니다.

weighting
NgramExtractingEstimator.WeightingCriteria

단어가 모음의 문서에 얼마나 중요한지 평가하는 데 사용되는 통계 측정값입니다.

반환

설명

WordBagEstimatorNgramExtractingEstimator 는 전자가 내부적으로 텍스트를 토큰화하고 후자는 토큰화된 텍스트를 입력으로 사용합니다.

적용 대상