Delen via


Recognize Printed Text - Recognize Printed Text

Optical Character Recognition (OCR) detecteert tekst in een afbeelding en extraheert de herkende tekens in een voor machines bruikbare tekenstroom. Wanneer dit lukt, worden de OCR-resultaten geretourneerd. Bij een fout wordt de foutcode samen met een foutbericht geretourneerd. De foutcode kan InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage of InternalServerError zijn.

POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}
POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}&language={language}

URI-parameters

Name In Vereist Type Description
Endpoint
path True

string

Ondersteunde Cognitive Services-eindpunten.

detectOrientation
query True

boolean

Hiermee geeft u aan of de tekststand in de afbeelding wordt gedetecteerd. Met detectOrientation=true probeert de OCR-service de afdrukstand van de afbeelding te detecteren en te corrigeren voordat deze verder wordt verwerkt (bijvoorbeeld als deze ondersteboven is).

language
query

OcrLanguages

De BCP-47-taalcode van de tekst die in de afbeelding moet worden gedetecteerd. De standaardwaarde is 'unk'.

Aanvraagkoptekst

Name Vereist Type Description
Ocp-Apim-Subscription-Key True

string

Aanvraagbody

Name Vereist Type Description
url True

string

Openbaar bereikbare URL van een afbeelding.

Antwoorden

Name Type Description
200 OK

OcrResult

De OCR resulteert in de hiërarchie van regio/regel/woord. De resultaten bevatten tekst, een begrenzingsvak voor regio's, regels en woorden. De hoek, in radialen, van de gedetecteerde tekst ten opzichte van de dichtstbijzijnde horizontale of verticale richting. Nadat de invoerafbeelding met deze hoek rechtsom is gedraaid, worden de herkende tekstlijnen horizontaal of verticaal. In combinatie met de richtingseigenschap kan het worden gebruikt om herkenningsresultaten correct op de oorspronkelijke afbeelding te overlayen, door de oorspronkelijke afbeelding of de herkenningsresultaten te draaien met een geschikte hoek rond het midden van de oorspronkelijke afbeelding. Als de hoek niet met zekerheid kan worden gedetecteerd, is deze eigenschap niet aanwezig. Als de afbeelding tekst met verschillende hoeken bevat, wordt slechts een deel van de tekst correct herkend.

Other Status Codes

ComputerVisionError

Foutreactie.

Beveiliging

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Voorbeelden

Successful RecognizePrintedText request

Voorbeeldaanvraag

POST https://westus.api.cognitive.microsoft.com/vision/v2.1/ocr?detectOrientation=true&language=en


"{url}"

Voorbeeldrespons

{
  "language": "en",
  "textAngle": -2.0000000000000338,
  "orientation": "Up",
  "regions": [
    {
      "boundingBox": "462,379,497,258",
      "lines": [
        {
          "boundingBox": "462,379,497,74",
          "words": [
            {
              "boundingBox": "462,379,41,73",
              "text": "A"
            },
            {
              "boundingBox": "523,379,153,73",
              "text": "GOAL"
            },
            {
              "boundingBox": "694,379,265,74",
              "text": "WITHOUT"
            }
          ]
        },
        {
          "boundingBox": "565,471,289,74",
          "words": [
            {
              "boundingBox": "565,471,41,73",
              "text": "A"
            },
            {
              "boundingBox": "626,471,150,73",
              "text": "PLAN"
            },
            {
              "boundingBox": "801,472,53,73",
              "text": "IS"
            }
          ]
        },
        {
          "boundingBox": "519,563,375,74",
          "words": [
            {
              "boundingBox": "519,563,149,74",
              "text": "JUST"
            },
            {
              "boundingBox": "683,564,41,72",
              "text": "A"
            },
            {
              "boundingBox": "741,564,153,73",
              "text": "WISH"
            }
          ]
        }
      ]
    }
  ]
}

Definities

Name Description
ComputerVisionError

Details over de api-aanvraagfout.

ComputerVisionErrorCodes

De foutcode.

ImageUrl
OcrLanguages

De BCP-47-taalcode van de tekst die in de afbeelding moet worden gedetecteerd. De standaardwaarde is 'unk'.

OcrLine

Een object dat één herkende tekstregel beschrijft.

OcrRegion

Een gebied bestaat uit meerdere regels (bijvoorbeeld een kolom met tekst in een document met meerdere kolommen).

OcrResult
OcrWord

Informatie over een herkend woord.

ComputerVisionError

Details over de api-aanvraagfout.

Name Type Description
code

ComputerVisionErrorCodes

De foutcode.

message

string

Een bericht waarin de fout wordt uitgelegd die door de service is gerapporteerd.

requestId

string

Een unieke aanvraag-id.

ComputerVisionErrorCodes

De foutcode.

Name Type Description
BadArgument

string

CancelledRequest

string

DetectFaceError

string

FailedToProcess

string

InternalServerError

string

InvalidDetails

string

InvalidImageFormat

string

InvalidImageSize

string

InvalidImageUrl

string

InvalidModel

string

InvalidThumbnailSize

string

NotSupportedFeature

string

NotSupportedImage

string

NotSupportedLanguage

string

NotSupportedVisualFeature

string

StorageException

string

Timeout

string

Unspecified

string

UnsupportedMediaType

string

ImageUrl

Name Type Description
url

string

Openbaar bereikbare URL van een afbeelding.

OcrLanguages

De BCP-47-taalcode van de tekst die in de afbeelding moet worden gedetecteerd. De standaardwaarde is 'unk'.

Name Type Description
ar

string

cs

string

da

string

de

string

el

string

en

string

es

string

fi

string

fr

string

hu

string

it

string

ja

string

ko

string

nb

string

nl

string

pl

string

pt

string

ro

string

ru

string

sk

string

sr-Cyrl

string

sr-Latn

string

sv

string

tr

string

unk

string

zh-Hans

string

zh-Hant

string

OcrLine

Een object dat één herkende tekstregel beschrijft.

Name Type Description
boundingBox

string

Begrenzingsvak van een herkende lijn. De vier gehele getallen vertegenwoordigen de x-coördinaat van de linkerrand, de y-coördinaat van de bovenrand, breedte en hoogte van het begrenzingsvak, in het coördinatensysteem van de invoerafbeelding, nadat deze is gedraaid rond het midden volgens de gedetecteerde teksthoek (zie de eigenschap textAngle), met de oorsprong in de linkerbovenhoek en de y-as naar beneden.

words

OcrWord[]

Een matrix met objecten, waarbij elk object een herkend woord vertegenwoordigt.

OcrRegion

Een gebied bestaat uit meerdere regels (bijvoorbeeld een kolom met tekst in een document met meerdere kolommen).

Name Type Description
boundingBox

string

Begrenzingsvak van een herkend gebied. De vier gehele getallen vertegenwoordigen de x-coördinaat van de linkerrand, de y-coördinaat van de bovenrand, breedte en hoogte van het begrenzingsvak, in het coördinatensysteem van de invoerafbeelding, nadat deze is gedraaid rond het midden volgens de gedetecteerde teksthoek (zie de eigenschap textAngle), met de oorsprong in de linkerbovenhoek en de y-as naar beneden.

lines

OcrLine[]

Een matrix met herkende tekstregels.

OcrResult

Name Type Description
language

string

De BCP-47-taalcode van de tekst in de afbeelding.

orientation

string

Afdrukstand van de tekst die in de afbeelding wordt herkend, indien aangevraagd. De waarde (omhoog, omlaag, links of rechts) verwijst naar de richting waar de bovenkant van de herkende tekst zich bevindt, nadat de afbeelding rond het midden is gedraaid op basis van de gedetecteerde teksthoek (zie de eigenschap textAngle). Als detectie van de afdrukstand niet is aangevraagd of als er geen tekst wordt gedetecteerd, is de waarde 'NotDetected'.

regions

OcrRegion[]

Een matrix met objecten, waarbij elk object een gebied met herkende tekst vertegenwoordigt.

textAngle

number

De hoek, in radialen, van de gedetecteerde tekst ten opzichte van de dichtstbijzijnde horizontale of verticale richting. Nadat de invoerafbeelding met deze hoek rechtsom is gedraaid, worden de herkende tekstlijnen horizontaal of verticaal. In combinatie met de richtingseigenschap kan het worden gebruikt om herkenningsresultaten correct op de oorspronkelijke afbeelding te overlayen, door de oorspronkelijke afbeelding of de herkenningsresultaten te draaien met een geschikte hoek rond het midden van de oorspronkelijke afbeelding. Als de hoek niet met zekerheid kan worden gedetecteerd, is deze eigenschap niet aanwezig. Als de afbeelding tekst met verschillende hoeken bevat, wordt slechts een deel van de tekst correct herkend.

OcrWord

Informatie over een herkend woord.

Name Type Description
boundingBox

string

Begrenzingsvak van een herkend woord. De vier gehele getallen vertegenwoordigen de x-coördinaat van de linkerrand, de y-coördinaat van de bovenrand, breedte en hoogte van het begrenzingsvak, in het coördinatensysteem van de invoerafbeelding, nadat deze is gedraaid rond het midden volgens de gedetecteerde teksthoek (zie de eigenschap textAngle), met de oorsprong in de linkerbovenhoek en de y-as naar beneden.

text

string

Tekenreekswaarde van een herkend woord.