Recognize Printed Text - Recognize Printed Text
Optical Character Recognition (OCR) detecteert tekst in een afbeelding en extraheert de herkende tekens in een voor machines bruikbare tekenstroom. Wanneer dit lukt, worden de OCR-resultaten geretourneerd. Bij een fout wordt de foutcode samen met een foutbericht geretourneerd. De foutcode kan InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage of InternalServerError zijn.
POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}
POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}&language={language}
URI-parameters
Name | In | Vereist | Type | Description |
---|---|---|---|---|
Endpoint
|
path | True |
string |
Ondersteunde Cognitive Services-eindpunten. |
detect
|
query | True |
boolean |
Hiermee geeft u aan of de tekststand in de afbeelding wordt gedetecteerd. Met detectOrientation=true probeert de OCR-service de afdrukstand van de afbeelding te detecteren en te corrigeren voordat deze verder wordt verwerkt (bijvoorbeeld als deze ondersteboven is). |
language
|
query |
De BCP-47-taalcode van de tekst die in de afbeelding moet worden gedetecteerd. De standaardwaarde is 'unk'. |
Aanvraagkoptekst
Name | Vereist | Type | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Aanvraagbody
Name | Vereist | Type | Description |
---|---|---|---|
url | True |
string |
Openbaar bereikbare URL van een afbeelding. |
Antwoorden
Name | Type | Description |
---|---|---|
200 OK |
De OCR resulteert in de hiërarchie van regio/regel/woord. De resultaten bevatten tekst, een begrenzingsvak voor regio's, regels en woorden. De hoek, in radialen, van de gedetecteerde tekst ten opzichte van de dichtstbijzijnde horizontale of verticale richting. Nadat de invoerafbeelding met deze hoek rechtsom is gedraaid, worden de herkende tekstlijnen horizontaal of verticaal. In combinatie met de richtingseigenschap kan het worden gebruikt om herkenningsresultaten correct op de oorspronkelijke afbeelding te overlayen, door de oorspronkelijke afbeelding of de herkenningsresultaten te draaien met een geschikte hoek rond het midden van de oorspronkelijke afbeelding. Als de hoek niet met zekerheid kan worden gedetecteerd, is deze eigenschap niet aanwezig. Als de afbeelding tekst met verschillende hoeken bevat, wordt slechts een deel van de tekst correct herkend. |
|
Other Status Codes |
Foutreactie. |
Beveiliging
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Voorbeelden
Successful RecognizePrintedText request
Voorbeeldaanvraag
POST https://westus.api.cognitive.microsoft.com/vision/v2.1/ocr?detectOrientation=true&language=en
"{url}"
Voorbeeldrespons
{
"language": "en",
"textAngle": -2.0000000000000338,
"orientation": "Up",
"regions": [
{
"boundingBox": "462,379,497,258",
"lines": [
{
"boundingBox": "462,379,497,74",
"words": [
{
"boundingBox": "462,379,41,73",
"text": "A"
},
{
"boundingBox": "523,379,153,73",
"text": "GOAL"
},
{
"boundingBox": "694,379,265,74",
"text": "WITHOUT"
}
]
},
{
"boundingBox": "565,471,289,74",
"words": [
{
"boundingBox": "565,471,41,73",
"text": "A"
},
{
"boundingBox": "626,471,150,73",
"text": "PLAN"
},
{
"boundingBox": "801,472,53,73",
"text": "IS"
}
]
},
{
"boundingBox": "519,563,375,74",
"words": [
{
"boundingBox": "519,563,149,74",
"text": "JUST"
},
{
"boundingBox": "683,564,41,72",
"text": "A"
},
{
"boundingBox": "741,564,153,73",
"text": "WISH"
}
]
}
]
}
]
}
Definities
Name | Description |
---|---|
Computer |
Details over de api-aanvraagfout. |
Computer |
De foutcode. |
Image |
|
Ocr |
De BCP-47-taalcode van de tekst die in de afbeelding moet worden gedetecteerd. De standaardwaarde is 'unk'. |
Ocr |
Een object dat één herkende tekstregel beschrijft. |
Ocr |
Een gebied bestaat uit meerdere regels (bijvoorbeeld een kolom met tekst in een document met meerdere kolommen). |
Ocr |
|
Ocr |
Informatie over een herkend woord. |
ComputerVisionError
Details over de api-aanvraagfout.
Name | Type | Description |
---|---|---|
code |
De foutcode. |
|
message |
string |
Een bericht waarin de fout wordt uitgelegd die door de service is gerapporteerd. |
requestId |
string |
Een unieke aanvraag-id. |
ComputerVisionErrorCodes
De foutcode.
Name | Type | Description |
---|---|---|
BadArgument |
string |
|
CancelledRequest |
string |
|
DetectFaceError |
string |
|
FailedToProcess |
string |
|
InternalServerError |
string |
|
InvalidDetails |
string |
|
InvalidImageFormat |
string |
|
InvalidImageSize |
string |
|
InvalidImageUrl |
string |
|
InvalidModel |
string |
|
InvalidThumbnailSize |
string |
|
NotSupportedFeature |
string |
|
NotSupportedImage |
string |
|
NotSupportedLanguage |
string |
|
NotSupportedVisualFeature |
string |
|
StorageException |
string |
|
Timeout |
string |
|
Unspecified |
string |
|
UnsupportedMediaType |
string |
ImageUrl
Name | Type | Description |
---|---|---|
url |
string |
Openbaar bereikbare URL van een afbeelding. |
OcrLanguages
De BCP-47-taalcode van de tekst die in de afbeelding moet worden gedetecteerd. De standaardwaarde is 'unk'.
Name | Type | Description |
---|---|---|
ar |
string |
|
cs |
string |
|
da |
string |
|
de |
string |
|
el |
string |
|
en |
string |
|
es |
string |
|
fi |
string |
|
fr |
string |
|
hu |
string |
|
it |
string |
|
ja |
string |
|
ko |
string |
|
nb |
string |
|
nl |
string |
|
pl |
string |
|
pt |
string |
|
ro |
string |
|
ru |
string |
|
sk |
string |
|
sr-Cyrl |
string |
|
sr-Latn |
string |
|
sv |
string |
|
tr |
string |
|
unk |
string |
|
zh-Hans |
string |
|
zh-Hant |
string |
OcrLine
Een object dat één herkende tekstregel beschrijft.
Name | Type | Description |
---|---|---|
boundingBox |
string |
Begrenzingsvak van een herkende lijn. De vier gehele getallen vertegenwoordigen de x-coördinaat van de linkerrand, de y-coördinaat van de bovenrand, breedte en hoogte van het begrenzingsvak, in het coördinatensysteem van de invoerafbeelding, nadat deze is gedraaid rond het midden volgens de gedetecteerde teksthoek (zie de eigenschap textAngle), met de oorsprong in de linkerbovenhoek en de y-as naar beneden. |
words |
Ocr |
Een matrix met objecten, waarbij elk object een herkend woord vertegenwoordigt. |
OcrRegion
Een gebied bestaat uit meerdere regels (bijvoorbeeld een kolom met tekst in een document met meerdere kolommen).
Name | Type | Description |
---|---|---|
boundingBox |
string |
Begrenzingsvak van een herkend gebied. De vier gehele getallen vertegenwoordigen de x-coördinaat van de linkerrand, de y-coördinaat van de bovenrand, breedte en hoogte van het begrenzingsvak, in het coördinatensysteem van de invoerafbeelding, nadat deze is gedraaid rond het midden volgens de gedetecteerde teksthoek (zie de eigenschap textAngle), met de oorsprong in de linkerbovenhoek en de y-as naar beneden. |
lines |
Ocr |
Een matrix met herkende tekstregels. |
OcrResult
Name | Type | Description |
---|---|---|
language |
string |
De BCP-47-taalcode van de tekst in de afbeelding. |
orientation |
string |
Afdrukstand van de tekst die in de afbeelding wordt herkend, indien aangevraagd. De waarde (omhoog, omlaag, links of rechts) verwijst naar de richting waar de bovenkant van de herkende tekst zich bevindt, nadat de afbeelding rond het midden is gedraaid op basis van de gedetecteerde teksthoek (zie de eigenschap textAngle). Als detectie van de afdrukstand niet is aangevraagd of als er geen tekst wordt gedetecteerd, is de waarde 'NotDetected'. |
regions |
Een matrix met objecten, waarbij elk object een gebied met herkende tekst vertegenwoordigt. |
|
textAngle |
number |
De hoek, in radialen, van de gedetecteerde tekst ten opzichte van de dichtstbijzijnde horizontale of verticale richting. Nadat de invoerafbeelding met deze hoek rechtsom is gedraaid, worden de herkende tekstlijnen horizontaal of verticaal. In combinatie met de richtingseigenschap kan het worden gebruikt om herkenningsresultaten correct op de oorspronkelijke afbeelding te overlayen, door de oorspronkelijke afbeelding of de herkenningsresultaten te draaien met een geschikte hoek rond het midden van de oorspronkelijke afbeelding. Als de hoek niet met zekerheid kan worden gedetecteerd, is deze eigenschap niet aanwezig. Als de afbeelding tekst met verschillende hoeken bevat, wordt slechts een deel van de tekst correct herkend. |
OcrWord
Informatie over een herkend woord.
Name | Type | Description |
---|---|---|
boundingBox |
string |
Begrenzingsvak van een herkend woord. De vier gehele getallen vertegenwoordigen de x-coördinaat van de linkerrand, de y-coördinaat van de bovenrand, breedte en hoogte van het begrenzingsvak, in het coördinatensysteem van de invoerafbeelding, nadat deze is gedraaid rond het midden volgens de gedetecteerde teksthoek (zie de eigenschap textAngle), met de oorsprong in de linkerbovenhoek en de y-as naar beneden. |
text |
string |
Tekenreekswaarde van een herkend woord. |