Partager via


Recognize Printed Text - Recognize Printed Text

Avec la reconnaissance optique de caractères (OCR), détectez du texte dans une image et extrayez les caractères reconnus dans un flux de caractères exploitable automatiquement. En cas de réussite, les résultats OCR sont retournés. En cas d’échec, le code d’erreur ainsi qu’un message d’erreur sont retournés. Le code d’erreur peut être l’un des éléments InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage ou InternalServerError.

POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}
POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}&language={language}

Paramètres URI

Nom Dans Obligatoire Type Description
Endpoint
path True

string

Points de terminaison Cognitive Services pris en charge.

detectOrientation
query True

boolean

Détecter l’orientation du texte dans l’image. Avec detectOrientation=true, le service OCR tente de détecter l’orientation de l’image et de la corriger avant le traitement ultérieur (par exemple, si elle est à l’envers).

language
query

OcrLanguages

Code de langage BCP-47 du texte à détecter dans l’image. La valeur par défaut est « unk ».

En-tête de la demande

Nom Obligatoire Type Description
Ocp-Apim-Subscription-Key True

string

Corps de la demande

Nom Obligatoire Type Description
url True

string

URL accessible publiquement d’une image.

Réponses

Nom Type Description
200 OK

OcrResult

L’OCR aboutit à la hiérarchie de région/ligne/mot. Les résultats incluent du texte, un cadre englobant pour les régions, des lignes et des mots. Angle, en radians, du texte détecté par rapport à la direction horizontale ou verticale la plus proche. Après avoir fait pivoter l’image d’entrée dans le sens des aiguilles d’une montre de cet angle, les lignes de texte reconnues deviennent horizontales ou verticales. En combinaison avec la propriété d’orientation, il peut être utilisé pour superposer correctement les résultats de reconnaissance sur l’image d’origine, en faisant pivoter l’image d’origine ou les résultats de reconnaissance selon un angle approprié autour du centre de l’image d’origine. Si l’angle ne peut pas être détecté en toute confiance, cette propriété n’est pas présente. Si l’image contient du texte sous différents angles, seule une partie du texte est reconnue correctement.

Other Status Codes

ComputerVisionError

Réponse d’erreur.

Sécurité

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Exemples

Successful RecognizePrintedText request

Sample Request

POST https://westus.api.cognitive.microsoft.com/vision/v2.1/ocr?detectOrientation=true&language=en


"{url}"

Sample Response

{
  "language": "en",
  "textAngle": -2.0000000000000338,
  "orientation": "Up",
  "regions": [
    {
      "boundingBox": "462,379,497,258",
      "lines": [
        {
          "boundingBox": "462,379,497,74",
          "words": [
            {
              "boundingBox": "462,379,41,73",
              "text": "A"
            },
            {
              "boundingBox": "523,379,153,73",
              "text": "GOAL"
            },
            {
              "boundingBox": "694,379,265,74",
              "text": "WITHOUT"
            }
          ]
        },
        {
          "boundingBox": "565,471,289,74",
          "words": [
            {
              "boundingBox": "565,471,41,73",
              "text": "A"
            },
            {
              "boundingBox": "626,471,150,73",
              "text": "PLAN"
            },
            {
              "boundingBox": "801,472,53,73",
              "text": "IS"
            }
          ]
        },
        {
          "boundingBox": "519,563,375,74",
          "words": [
            {
              "boundingBox": "519,563,149,74",
              "text": "JUST"
            },
            {
              "boundingBox": "683,564,41,72",
              "text": "A"
            },
            {
              "boundingBox": "741,564,153,73",
              "text": "WISH"
            }
          ]
        }
      ]
    }
  ]
}

Définitions

Nom Description
ComputerVisionError

Détails sur l’erreur de requête d’API.

ComputerVisionErrorCodes

Code d'erreur.

ImageUrl
OcrLanguages

Code de langage BCP-47 du texte à détecter dans l’image. La valeur par défaut est « unk ».

OcrLine

Objet décrivant une seule ligne de texte reconnue.

OcrRegion

Une région se compose de plusieurs lignes (par exemple, une colonne de texte dans un document à plusieurs colonnes).

OcrResult
OcrWord

Informations sur un mot reconnu.

ComputerVisionError

Détails sur l’erreur de requête d’API.

Nom Type Description
code

ComputerVisionErrorCodes

Code d'erreur.

message

string

Message expliquant l’erreur signalée par le service.

requestId

string

Identificateur de requête unique.

ComputerVisionErrorCodes

Code d'erreur.

Nom Type Description
BadArgument

string

CancelledRequest

string

DetectFaceError

string

FailedToProcess

string

InternalServerError

string

InvalidDetails

string

InvalidImageFormat

string

InvalidImageSize

string

InvalidImageUrl

string

InvalidModel

string

InvalidThumbnailSize

string

NotSupportedFeature

string

NotSupportedImage

string

NotSupportedLanguage

string

NotSupportedVisualFeature

string

StorageException

string

Timeout

string

Unspecified

string

UnsupportedMediaType

string

ImageUrl

Nom Type Description
url

string

URL accessible publiquement d’une image.

OcrLanguages

Code de langage BCP-47 du texte à détecter dans l’image. La valeur par défaut est « unk ».

Nom Type Description
ar

string

cs

string

da

string

de

string

el

string

en

string

es

string

fi

string

fr

string

hu

string

it

string

ja

string

ko

string

nb

string

nl

string

pl

string

pt

string

ro

string

ru

string

sk

string

sr-Cyrl

string

sr-Latn

string

sv

string

tr

string

unk

string

zh-Hans

string

zh-Hant

string

OcrLine

Objet décrivant une seule ligne de texte reconnue.

Nom Type Description
boundingBox

string

Zone englobante d’une ligne reconnue. Les quatre entiers représentent la coordonnée x du bord gauche, la coordonnée y du bord supérieur, la largeur et la hauteur du cadre englobant, dans le système de coordonnées de l’image d’entrée, une fois qu’elle a été pivotée autour de son centre en fonction de l’angle de texte détecté (voir la propriété textAngle), avec l’origine en haut à gauche et l’axe y pointant vers le bas.

words

OcrWord[]

Tableau d’objets, où chaque objet représente un mot reconnu.

OcrRegion

Une région se compose de plusieurs lignes (par exemple, une colonne de texte dans un document à plusieurs colonnes).

Nom Type Description
boundingBox

string

Zone englobante d’une région reconnue. Les quatre entiers représentent la coordonnée x du bord gauche, la coordonnée y du bord supérieur, la largeur et la hauteur du cadre englobant, dans le système de coordonnées de l’image d’entrée, une fois qu’elle a été pivotée autour de son centre en fonction de l’angle de texte détecté (voir la propriété textAngle), avec l’origine en haut à gauche et l’axe y pointant vers le bas.

lines

OcrLine[]

Tableau de lignes de texte reconnues.

OcrResult

Nom Type Description
language

string

Code de langage BCP-47 du texte dans l’image.

orientation

string

Orientation du texte reconnu dans l’image, si demandé. La valeur (haut, bas, gauche ou droite) fait référence à la direction vers laquelle se trouve le haut du texte reconnu, une fois que l’image a été pivotée autour de son centre en fonction de l’angle de texte détecté (voir la propriété textAngle). Si la détection de l’orientation n’a pas été demandée ou si aucun texte n’est détecté, la valeur est « NotDetected ».

regions

OcrRegion[]

Tableau d’objets, où chaque objet représente une région de texte reconnu.

textAngle

number

Angle, en radians, du texte détecté par rapport à la direction horizontale ou verticale la plus proche. Après avoir fait pivoter l’image d’entrée dans le sens des aiguilles d’une montre de cet angle, les lignes de texte reconnues deviennent horizontales ou verticales. En combinaison avec la propriété d’orientation, il peut être utilisé pour superposer correctement les résultats de reconnaissance sur l’image d’origine, en faisant pivoter l’image d’origine ou les résultats de reconnaissance selon un angle approprié autour du centre de l’image d’origine. Si l’angle ne peut pas être détecté en toute confiance, cette propriété n’est pas présente. Si l’image contient du texte sous différents angles, seule une partie du texte est reconnue correctement.

OcrWord

Informations sur un mot reconnu.

Nom Type Description
boundingBox

string

Cadre englobant d’un mot reconnu. Les quatre entiers représentent la coordonnée x du bord gauche, la coordonnée y du bord supérieur, la largeur et la hauteur du cadre englobant, dans le système de coordonnées de l’image d’entrée, une fois qu’elle a été pivotée autour de son centre en fonction de l’angle de texte détecté (voir la propriété textAngle), avec l’origine en haut à gauche et l’axe y pointant vers le bas.

text

string

Valeur de chaîne d’un mot reconnu.