Sdílet prostřednictvím


TokenizerResult Třída

Definice

Kódování představuje výstup tokenizátoru.

public sealed class TokenizerResult
type TokenizerResult = class
Public NotInheritable Class TokenizerResult
Dědičnost
TokenizerResult

Konstruktory

TokenizerResult(String, String, IReadOnlyList<Split>, Boolean)

Vytvořte nový objekt TokenizerResult objektu.

Vlastnosti

Ids

Získá seznam ID tokenů. ID jsou hlavním vstupem pro jazykový model. Jsou to indexy tokenů, číselné reprezentace, kterým LM rozumí.

NormalizedString

Získá normalizovanou formu původního řetězce.

Offsets

Získá seznam posunů. Tyto posuny umožňují rozdělit vstupní řetězec a načíst tak původní část, která vedla k vytvoření odpovídajícího tokenu.

OffsetsMappedToOriginalString

Získá normalizovanou formu původního řetězce.

OriginalString

Získá původní tokenizovaný řetězec.

Tokens

Získá vygenerované tokeny. Jedná se o řetězcovou reprezentaci ID.

Platí pro