Bagikan melalui


microsoftml.n_gram: Mengonversi teks menjadi fitur menggunakan n-gram

Penggunaan

microsoftml.n_gram(ngram_length: numbers.Real = 1,
    skip_length: numbers.Real = 0, all_lengths: bool = True,
    max_num_terms: list = [10000000], weighting: str = 'Tf')

Deskripsi

Mengekstrak NGram dari teks dan mengonversinya menjadi vektor menggunakan kamus.

Argumen

ngram_length

Panjang Ngram (pengaturan).

skip_length

Jumlah maksimum token yang akan dilewati saat membuat ngram (pengaturan).

all_lengths

Apakah akan menyertakan semua panjang ngram hingga NgramLength atau hanya NgramLength (pengaturan).

max_num_terms

Jumlah maksimum ngram untuk disimpan dalam kamus (pengaturan).

Bobot

Kriteria pembobotan (pengaturan).

Lihat juga

n_gram_hash, featurize_text