Partilhar via


microsoftml.n_gram: converte o texto em recursos usando n-gramas

Uso

microsoftml.n_gram(ngram_length: numbers.Real = 1,
    skip_length: numbers.Real = 0, all_lengths: bool = True,
    max_num_terms: list = [10000000], weighting: str = 'Tf')

Descrição

Extrai NGrams do texto e converte-os em vetor usando o dicionário.

Argumentos

ngram_length

Comprimento do n-grama (configurações).

skip_length

Número máximo de tokens a serem ignorados ao construir um n-grama (configurações).

all_lengths

Especifica se é preciso incluir todos os tamanhos de n-gramas até o NgramLength ou somente o NgramLength (configurações).

max_num_terms

Número máximo de n-gramas a serem armazenados no dicionário (configurações).

weighting

Os critérios de ponderação (configurações).

Confira também

n_gram_hash, featurize_text