microsoftml.n_gram: converte o texto em recursos usando n-gramas
Uso
microsoftml.n_gram(ngram_length: numbers.Real = 1,
skip_length: numbers.Real = 0, all_lengths: bool = True,
max_num_terms: list = [10000000], weighting: str = 'Tf')
Descrição
Extrai NGrams do texto e converte-os em vetor usando o dicionário.
Argumentos
ngram_length
Comprimento do n-grama (configurações).
skip_length
Número máximo de tokens a serem ignorados ao construir um n-grama (configurações).
all_lengths
Especifica se é preciso incluir todos os tamanhos de n-gramas até o NgramLength ou somente o NgramLength (configurações).
max_num_terms
Número máximo de n-gramas a serem armazenados no dicionário (configurações).
weighting
Os critérios de ponderação (configurações).