DocumentWord Klasse

Ein Wortobjekt, das aus einer zusammenhängenden Sequenz von Zeichen besteht. Für Sprachen ohne Leerzeichen, z. B. Chinesisch, Japanisch und Koreanisch, wird jedes Zeichen als eigenes Wort dargestellt.

Vererbung
builtins.object
DocumentWord

Konstruktor

DocumentWord(**kwargs: Any)

Methoden

from_dict

Konvertiert ein Dict in der Form eines DocumentWord in das Modell selbst.

to_dict

Gibt eine Dict-Darstellung von DocumentWord zurück.

from_dict

Konvertiert ein Dict in der Form eines DocumentWord in das Modell selbst.

from_dict(data: Dict) -> DocumentWord

Parameter

Name Beschreibung
data
Erforderlich

Ein Wörterbuch in der Form von DocumentWord.

Gibt zurück

Typ Beschreibung

DocumentWord

to_dict

Gibt eine Dict-Darstellung von DocumentWord zurück.

to_dict() -> Dict

Gibt zurück

Typ Beschreibung

dict

Attribute

confidence

Vertrauen beim korrekten Extrahieren des Worts.

confidence: float

content

Textinhalt des Worts.

content: str

polygon

Umgebendes Polygon des Worts.

polygon: Sequence[Point]

span

Position des Worts in der Lesereihenfolge verketteten Inhalt.

span: DocumentSpan