microsoftml.n_gram_hash: Converts text into features using hashed n-grams
Usage
microsoftml.n_gram_hash(hash_bits: numbers.Real = 16,
ngram_length: numbers.Real = 1, skip_length: numbers.Real = 0,
all_lengths: bool = True, seed: numbers.Real = 314489979,
ordered: bool = True, invert_hash: numbers.Real = 0)
Description
Extracts NGrams from text and convert them to vector using hashing trick.
Arguments
hash_bits
Number of bits to hash into. Must be between 1 and 30, inclusive. (settings).
ngram_length
Ngram length (settings).
skip_length
Maximum number of tokens to skip when constructing an ngram (settings).
all_lengths
Whether to include all ngram lengths up to ngramLength or only ngramLength (settings).
seed
Hashing seed (settings).
ordered
Whether the position of each source column should be included in the hash (when there are multiple source columns). (settings).
invert_hash
Limit the number of keys used to generate the slot name to this many. 0 means no invert hashing, -1 means no limit. (settings).
See also
Phản hồi
https://aka.ms/ContentUserFeedback.
Sắp ra mắt: Trong năm 2024, chúng tôi sẽ dần gỡ bỏ Sự cố với GitHub dưới dạng cơ chế phản hồi cho nội dung và thay thế bằng hệ thống phản hồi mới. Để biết thêm thông tin, hãy xem:Gửi và xem ý kiến phản hồi dành cho