使用读取 API
若要使用读取 OCR 功能,请调用 ImageAnalysis 函数(REST API 或等效的 SDK 方法),同时传递图像 URL 或二进制数据,并视需要指定性别中立字幕或文本编写语言(英语的默认值为 en)。
若要向 ImageAnalysis 发出 OCR 请求,请将视觉对象特征指定为 READ
。
C#
ImageAnalysisResult result = client.Analyze(
<image-to-analyze>,
VisualFeatures.Read);
Python
result = client.analyze(
image_url=<image_to_analyze>,
visual_features=[VisualFeatures.READ]
)
如果使用 REST API,请将该功能指定为 read
。
https://<endpoint>/computervision/imageanalysis:analyze?features=read&...
读取 OCR 函数的结果以 JSON 或类似结构的语言特定对象的形式同步返回。 这些结果将细分为块(当前服务仅使用一个块),然后细分为行,之后细分为单词。 此外,还同时包含行级别和字级别的文本值,因此如果不需要提取单个字级别的文本,则更容易阅读整行文本。
{
"metadata":
{
"width": 500,
"height": 430
},
"readResult":
{
"blocks":
[
{
"lines":
[
{
"text": "Hello World!",
"boundingPolygon":
[
{"x":251,"y":265},
{"x":673,"y":260},
{"x":674,"y":308},
{"x":252,"y":318}
],
"words":
[
{
"text":"Hello",
"boundingPolygon":
[
{"x":252,"y":267},
{"x":307,"y":265},
{"x":307,"y":318},
{"x":253,"y":318}
],
"confidence":0.996
},
{
"text":"World!",
"boundingPolygon":
[
{"x":318,"y":264},
{"x":386,"y":263},
{"x":387,"y":316},
{"x":319,"y":318}
],
"confidence":0.99
}
]
},
]
}
]
}
}