你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

DocumentWord 类

由连续字符序列组成的单词对象。 对于非空格分隔语言(如中文、日语和朝鲜语),每个字符都表示为自己的单词。

继承
builtins.object
DocumentWord

构造函数

DocumentWord(**kwargs: Any)

方法

from_dict

将 DocumentWord 形状中的 dict 转换为模型本身。

to_dict

返回 DocumentWord 的 dict 表示形式。

from_dict

将 DocumentWord 形状中的 dict 转换为模型本身。

from_dict(data: Dict) -> DocumentWord

参数

名称 说明
data
必需

DocumentWord 形状的字典。

返回

类型 说明

DocumentWord

to_dict

返回 DocumentWord 的 dict 表示形式。

to_dict() -> Dict

返回

类型 说明

dict

属性

confidence

正确提取单词的置信度。

confidence: float

content

单词的文本内容。

content: str

polygon

单词的边界多边形。

polygon: Sequence[Point]

span

单词在阅读顺序串联内容中的位置。

span: DocumentSpan