TextCatalog.ProduceHashedWordBags メソッド

定義

オーバーロード

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimator指定されたinputColumnNames複数の列を、ハッシュされた n-gram の数のベクトルにマップする 、という名前outputColumnNameの新しい列を作成します。

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimator指定されたinputColumnName列を、ハッシュされた n-gram の数のベクトルにマップする 、という名前outputColumnNameの新しい列を作成します。

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimator指定されたinputColumnNames複数の列を、ハッシュされた n-gram の数のベクトルにマップする 、という名前outputColumnNameの新しい列を作成します。

public static Microsoft.ML.Transforms.Text.WordHashBagEstimator ProduceHashedWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int numberOfBits = 16, int ngramLength = 1, int skipLength = 0, bool useAllLengths = true, uint seed = 314489979, bool useOrderedHashing = true, int maximumNumberOfInverts = 0);
static member ProduceHashedWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * int * bool * uint32 * bool * int -> Microsoft.ML.Transforms.Text.WordHashBagEstimator
<Extension()>
Public Function ProduceHashedWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional numberOfBits As Integer = 16, Optional ngramLength As Integer = 1, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional seed As UInteger = 314489979, Optional useOrderedHashing As Boolean = true, Optional maximumNumberOfInverts As Integer = 0) As WordHashBagEstimator

パラメーター

catalog
TransformsCatalog.TextTransforms

変換のカタログ。

outputColumnName
String

の変換によって生成される列の inputColumnNames名前。 この列のデータ型は既知のサイズの Singleベクターです。

inputColumnNames
String[]

データを取得する複数の列の名前。 この推定機能は、テキストのベクトルに対して動作します。

numberOfBits
Int32

ハッシュ後のビット数。 1 から 30 までの数にする必要があります (1 と 30 も含まれます)。

ngramLength
Int32

Ngram の長さ。

skipLength
Int32

n-gram を構築するときにスキップするトークンの最大数。

useAllLengths
Boolean

すべての n グラムの長さを最大 ngramLength に含めるか、または長さだけを ngramLength含めるかを指定します。

seed
UInt32

ハッシュ シード。

useOrderedHashing
Boolean

各ソース列の位置をハッシュに含めるかどうか (複数のソース列があるとき)。

maximumNumberOfInverts
Int32

ハッシュ中に、元の値と生成されたハッシュ値の間のマッピングを構築します。 元の値のテキスト表現は、新しい列の注釈のスロット名に格納されます。そのため、ハッシュは多くの初期値を 1 つにマップできます。 maximumNumberOfInverts は、保持する必要があるハッシュに対応する個別の入力値の数の上限を指定します。 0 は入力値を保持しません。 -1 は 、各ハッシュにマッピングされたすべての入力値を保持します。

戻り値

注釈

WordHashBagEstimator は、前者が内部的にテキストをトークン化し、後者がトークン化されたテキストを入力として受け取る点とは異なります NgramHashingEstimator

適用対象

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimator指定されたinputColumnName列を、ハッシュされた n-gram の数のベクトルにマップする 、という名前outputColumnNameの新しい列を作成します。

public static Microsoft.ML.Transforms.Text.WordHashBagEstimator ProduceHashedWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int numberOfBits = 16, int ngramLength = 1, int skipLength = 0, bool useAllLengths = true, uint seed = 314489979, bool useOrderedHashing = true, int maximumNumberOfInverts = 0);
static member ProduceHashedWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * int * bool * uint32 * bool * int -> Microsoft.ML.Transforms.Text.WordHashBagEstimator
<Extension()>
Public Function ProduceHashedWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional numberOfBits As Integer = 16, Optional ngramLength As Integer = 1, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional seed As UInteger = 314489979, Optional useOrderedHashing As Boolean = true, Optional maximumNumberOfInverts As Integer = 0) As WordHashBagEstimator

パラメーター

catalog
TransformsCatalog.TextTransforms

変換のカタログ。

outputColumnName
String

の変換によって生成される列の inputColumnName名前。 この列のデータ型は既知のサイズの Singleベクターです。

inputColumnName
String

データを取得する列の名前。 この推定機能は、テキストのベクトルに対して動作します。

numberOfBits
Int32

ハッシュ後のビット数。 1 から 30 までの数にする必要があります (1 と 30 も含まれます)。

ngramLength
Int32

Ngram の長さ。

skipLength
Int32

n-gram を構築するときにスキップするトークンの最大数。

useAllLengths
Boolean

すべての n グラムの長さを最大 ngramLength に含めるか、または長さだけを ngramLength含めるかを指定します。

seed
UInt32

ハッシュ シード。

useOrderedHashing
Boolean

各ソース列の位置をハッシュに含めるかどうか (複数のソース列があるとき)。

maximumNumberOfInverts
Int32

ハッシュ中に、元の値と生成されたハッシュ値の間のマッピングを構築します。 元の値のテキスト表現は、新しい列の注釈のスロット名に格納されます。 そのため、ハッシュは多くの初期値を 1 つにマップできます。 maximumNumberOfInverts は、保持する必要があるハッシュに対応する個別の入力値の数の上限を指定します。 0 は入力値を保持しません。 -1 は 、各ハッシュにマッピングされたすべての入力値を保持します。

戻り値

注釈

WordHashBagEstimator は、前者が内部的にテキストをトークン化し、後者がトークン化されたテキストを入力として受け取る点とは異なります NgramHashingEstimator

適用対象