Dela via


DocumentWord Klass

Ett ordobjekt som består av en sammanhängande sekvens med tecken. För icke-blankstegsavgränsade språk, till exempel kinesiska, japanska och koreanska, representeras varje tecken som sitt eget ord.

Arv
builtins.object
DocumentWord

Konstruktor

DocumentWord(**kwargs: Any)

Metoder

from_dict

Konverterar en diktamen i form av ett DocumentWord till själva modellen.

to_dict

Returnerar en diktamensrepresentation av DocumentWord.

from_dict

Konverterar en diktamen i form av ett DocumentWord till själva modellen.

from_dict(data: Dict) -> DocumentWord

Parametrar

Name Description
data
Obligatorisk

En ordlista i form av DocumentWord.

Returer

Typ Description

DocumentWord

to_dict

Returnerar en diktamensrepresentation av DocumentWord.

to_dict() -> Dict

Returer

Typ Description

dict

Attribut

confidence

Konfidens för att extrahera ordet korrekt.

confidence: float

content

Textinnehåll i ordet.

content: str

polygon

Avgränsning av ordets polygon.

polygon: Sequence[Point]

span

Platsen för ordet i läsordningen sammanfogat innehåll.

span: DocumentSpan