TextCatalog.ProduceWordBags メソッド

定義

オーバーロード

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

WordBagEstimator指定された inputColumnName 列を という名前 outputColumnNameの新しい列の n-gram カウントのベクターにマップする を作成します。

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator指定された inputColumnName 列を という名前 outputColumnNameの新しい列の n-gram カウントのベクターにマップする を作成します。

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator指定された inputColumnNames 複数の列を という名前 outputColumnNameの新しい列の n-gram カウントのベクターにマップする を作成します。

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

WordBagEstimator指定された inputColumnName 列を という名前 outputColumnNameの新しい列の n-gram カウントのベクターにマップする を作成します。

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, char termSeparator, char freqSeparator, string inputColumnName = default, int maximumNgramsCount = 10000000);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * char * char * string * int -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, termSeparator As Char, freqSeparator As Char, Optional inputColumnName As String = Nothing, Optional maximumNgramsCount As Integer = 10000000) As WordBagEstimator

パラメーター

catalog
TransformsCatalog.TextTransforms

変換のカタログ。

outputColumnName
String

の変換に起因する列の inputColumnName名前。 この列のデータ型は、 の既知の Singleサイズ ベクトルになります。

termSeparator
Char
freqSeparator
Char
inputColumnName
String

データの取得元となる列の名前。 ディクショナリに格納する n グラムの最大数。用語と頻度のペアを区切るために使用される区切り記号。用語を頻度から分離するために使用される区切り記号。 この推定器は、テキストのベクトル上で動作します。

maximumNgramsCount
Int32

戻り値

注釈

WordBagEstimator は、前者が内部的にテキストをトークン化し、後者がトークン化されたテキストを入力として受け取る点とは NgramExtractingEstimator 異なります。

適用対象

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator指定された inputColumnName 列を という名前 outputColumnNameの新しい列の n-gram カウントのベクターにマップする を作成します。

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

パラメーター

catalog
TransformsCatalog.TextTransforms

変換のカタログ。

outputColumnName
String

の変換に起因する列の inputColumnName名前。 この列のデータ型は、 の既知の Singleサイズ ベクトルになります。

inputColumnName
String

データの取得元となる列の名前。 この推定器は、テキストのベクトル上で動作します。

ngramLength
Int32

Ngram の長さ。

skipLength
Int32

n-gram を構築するときにスキップするトークンの最大数。

useAllLengths
Boolean

までのすべての n グラムの長さを含めるか、 ngramLength のみを ngramLength含めるか。

maximumNgramsCount
Int32

ディクショナリに格納する n グラムの最大数。

weighting
NgramExtractingEstimator.WeightingCriteria

コーパス内の文書に対する単語の重要度を評価するために使用される統計メジャー。

戻り値

注釈

WordBagEstimator は、前者が内部的にテキストをトークン化し、後者がトークン化されたテキストを入力として受け取る点とは NgramExtractingEstimator 異なります。

適用対象

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimator指定された inputColumnNames 複数の列を という名前 outputColumnNameの新しい列の n-gram カウントのベクターにマップする を作成します。

public static Microsoft.ML.Transforms.Text.WordBagEstimator ProduceWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int ngramLength = 2, int skipLength = 0, bool useAllLengths = true, int maximumNgramsCount = 10000000, Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria weighting = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf);
static member ProduceWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * bool * int * Microsoft.ML.Transforms.Text.NgramExtractingEstimator.WeightingCriteria -> Microsoft.ML.Transforms.Text.WordBagEstimator
<Extension()>
Public Function ProduceWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional ngramLength As Integer = 2, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional maximumNgramsCount As Integer = 10000000, Optional weighting As NgramExtractingEstimator.WeightingCriteria = Microsoft.ML.Transforms.Text.NgramExtractingEstimator+WeightingCriteria.Tf) As WordBagEstimator

パラメーター

catalog
TransformsCatalog.TextTransforms

変換のカタログ。

outputColumnName
String

の変換に起因する列の inputColumnNames名前。 この列のデータ型は、 の既知の Singleサイズ ベクトルになります。

inputColumnNames
String[]

データの取得元となる複数の列の名前。 この推定器は、テキストのベクトル上で動作します。

ngramLength
Int32

Ngram の長さ。

skipLength
Int32

n-gram を構築するときにスキップするトークンの最大数。

useAllLengths
Boolean

までのすべての n グラムの長さを含めるか、 ngramLength のみを ngramLength含めるか。

maximumNgramsCount
Int32

ディクショナリに格納する n グラムの最大数。

weighting
NgramExtractingEstimator.WeightingCriteria

コーパス内の文書に対する単語の重要度を評価するために使用される統計メジャー。

戻り値

注釈

WordBagEstimator は、前者が内部的にテキストをトークン化し、後者がトークン化されたテキストを入力として受け取る点とは NgramExtractingEstimator 異なります。

適用対象