次の方法で共有


microsoftml.n_gram_hash: ハッシュされた N-gram を使用してテキストを特徴に変換する

使用法

microsoftml.n_gram_hash(hash_bits: numbers.Real = 16,
    ngram_length: numbers.Real = 1, skip_length: numbers.Real = 0,
    all_lengths: bool = True, seed: numbers.Real = 314489979,
    ordered: bool = True, invert_hash: numbers.Real = 0)

説明

テキストから NGrams を抽出し、ハッシュ トリックを使用してベクターに変換します。

引数

hash_bits

ハッシュ後のビット数。 1 から 30 までの数にする必要があります (1 と 30 も含まれます)。 (設定)。

ngram_length

Ngram 長 (設定)。

skip_length

ngram の構築時にスキップするトークンの最大数 (設定)。

all_lengths

すべての ngram 長を含めるか (最大 ngramLength)、ngramLength だけを含めます (設定)。

seed

ハッシュ シード (設定)。

ordered

各ソース列の位置をハッシュに含めるかどうか (複数のソース列があるとき)。 (設定)。

invert_hash

スロット名を生成するためのキー数をこの数までに制限します。 0 は逆ハッシュがないことを意味し、-1 は制限がないことを意味します。 (設定)。

関連項目

n_gram, featurize_text