Tokenizer Classe
Definição
Importante
Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.
Um Tokenizer funciona como um pipeline. Ele processa algum texto bruto como entrada e gera um objeto TokenizerResult.
public class Tokenizer
type Tokenizer = class
Public Class Tokenizer
- Herança
-
Tokenizer
Construtores
Tokenizer(Model, PreTokenizer, Normalizer) |
Crie um novo objeto Tokenizer. |
Propriedades
Decoder |
Obtém ou define o Decodificador em uso pelo Tokenizer. |
Model |
Obtém o Modelo em uso pelo Tokenizer. |
Normalizer |
Obtém ou define o Normalizador em uso pelo Tokenizer. |
PreTokenizer |
Obtém ou define o PreTokenizer usado pelo Tokenizer. |
Métodos
Decode(IEnumerable<Int32>, Boolean) |
Decodificar as IDs fornecidas, de volta para uma Cadeia de Caracteres. |
Decode(Int32, Boolean) |
Decodifica a ID para o token mapeado. |
Encode(String) |
Codifica o texto de entrada no objeto que tem a lista de tokens, IDs de tokens, mapeamento de deslocamento de tokens. |
IsValidChar(Char) |
Um Tokenizer funciona como um pipeline. Ele processa algum texto bruto como entrada e gera um objeto TokenizerResult. |
TrainFromFiles(Trainer, ReportProgress, String[]) |
Treine o modelo de tokenizer usando arquivos de entrada. |