DocumentWord الفصل

كائن كلمة يتكون من تسلسل متجاورة من الأحرف. بالنسبة للغات المحددة غير الفضائية، مثل الصينية واليابانية والكورية، يتم تمثيل كل حرف ككلمة خاصة به.

توريث
builtins.object
DocumentWord

الدالمنشئ

DocumentWord(**kwargs: Any)

الأساليب

from_dict

تحويل إملاء في شكل DocumentWord إلى النموذج نفسه.

to_dict

إرجاع تمثيل إملاء ل DocumentWord.

from_dict

تحويل إملاء في شكل DocumentWord إلى النموذج نفسه.

from_dict(data: Dict) -> DocumentWord

المعلمات

الاسم الوصف
data
مطلوب

قاموس في شكل DocumentWord.

المرتجعات

النوع الوصف

كلمة مرور المستند

to_dict

إرجاع تمثيل إملاء ل DocumentWord.

to_dict() -> Dict

المرتجعات

النوع الوصف

Dict

السمات

confidence

الثقة في استخراج الكلمة بشكل صحيح.

confidence: float

content

محتوى النص للكلمة.

content: str

polygon

مضلع الإحاطة للكلمة.

polygon: Sequence[Point]

span

موقع الكلمة في محتوى تسلسل ترتيب القراءة.

span: DocumentSpan