你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
DocumentWord 类
由连续字符序列组成的单词对象。 对于非空格分隔语言(如中文、日语和朝鲜语),每个字符都表示为自己的单词。
- 继承
-
builtins.objectDocumentWord
构造函数
DocumentWord(**kwargs: Any)
方法
from_dict |
将 DocumentWord 形状中的 dict 转换为模型本身。 |
to_dict |
返回 DocumentWord 的 dict 表示形式。 |
from_dict
将 DocumentWord 形状中的 dict 转换为模型本身。
from_dict(data: Dict) -> DocumentWord
参数
名称 | 说明 |
---|---|
data
必需
|
DocumentWord 形状的字典。 |
返回
类型 | 说明 |
---|---|
DocumentWord |
to_dict
属性
confidence
正确提取单词的置信度。
confidence: float
content
单词的文本内容。
content: str
polygon
单词的边界多边形。
polygon: Sequence[Point]
span
单词在阅读顺序串联内容中的位置。
span: DocumentSpan
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈