Recognize Printed Text - Recognize Printed Text

Référence

Service:: Cognitive Services - Computer Vision

API Version:: 2.1

Avec la reconnaissance optique de caractères (OCR), détectez du texte dans une image et extrayez les caractères reconnus dans un flux de caractères exploitable automatiquement. En cas de réussite, les résultats OCR sont retournés. En cas d’échec, le code d’erreur ainsi qu’un message d’erreur sont retournés. Le code d’erreur peut être l’un des éléments InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage ou InternalServerError.

POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}

With optional parameters:

POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}&language={language}

Paramètres URI

Nom	Dans	Obligatoire	Type	Description
Endpoint	path	True	string	Points de terminaison Cognitive Services pris en charge.
detectOrientation	query	True	boolean	Détecter l’orientation du texte dans l’image. Avec detectOrientation=true, le service OCR tente de détecter l’orientation de l’image et de la corriger avant le traitement ultérieur (par exemple, si elle est à l’envers).
language	query		OcrLanguages	Code de langage BCP-47 du texte à détecter dans l’image. La valeur par défaut est « unk ».

En-tête de la demande

Nom	Obligatoire	Type	Description
Ocp-Apim-Subscription-Key	True	string

Corps de la demande

Nom	Obligatoire	Type	Description
url	True	string	URL accessible publiquement d’une image.

Réponses

Nom	Type	Description
200 OK	OcrResult	L’OCR aboutit à la hiérarchie de région/ligne/mot. Les résultats incluent du texte, un cadre englobant pour les régions, des lignes et des mots. Angle, en radians, du texte détecté par rapport à la direction horizontale ou verticale la plus proche. Après avoir fait pivoter l’image d’entrée dans le sens des aiguilles d’une montre de cet angle, les lignes de texte reconnues deviennent horizontales ou verticales. En combinaison avec la propriété d’orientation, il peut être utilisé pour superposer correctement les résultats de reconnaissance sur l’image d’origine, en faisant pivoter l’image d’origine ou les résultats de reconnaissance selon un angle approprié autour du centre de l’image d’origine. Si l’angle ne peut pas être détecté en toute confiance, cette propriété n’est pas présente. Si l’image contient du texte sous différents angles, seule une partie du texte est reconnue correctement.
Other Status Codes	ComputerVisionError	Réponse d’erreur.

Sécurité

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Exemples

Successful RecognizePrintedText request

Sample Request

HTTP

POST https://westus.api.cognitive.microsoft.com/vision/v2.1/ocr?detectOrientation=true&language=en


"{url}"

Sample Response

Status code:: 200

{
  "language": "en",
  "textAngle": -2.0000000000000338,
  "orientation": "Up",
  "regions": [
    {
      "boundingBox": "462,379,497,258",
      "lines": [
        {
          "boundingBox": "462,379,497,74",
          "words": [
            {
              "boundingBox": "462,379,41,73",
              "text": "A"
            },
            {
              "boundingBox": "523,379,153,73",
              "text": "GOAL"
            },
            {
              "boundingBox": "694,379,265,74",
              "text": "WITHOUT"
            }
          ]
        },
        {
          "boundingBox": "565,471,289,74",
          "words": [
            {
              "boundingBox": "565,471,41,73",
              "text": "A"
            },
            {
              "boundingBox": "626,471,150,73",
              "text": "PLAN"
            },
            {
              "boundingBox": "801,472,53,73",
              "text": "IS"
            }
          ]
        },
        {
          "boundingBox": "519,563,375,74",
          "words": [
            {
              "boundingBox": "519,563,149,74",
              "text": "JUST"
            },
            {
              "boundingBox": "683,564,41,72",
              "text": "A"
            },
            {
              "boundingBox": "741,564,153,73",
              "text": "WISH"
            }
          ]
        }
      ]
    }
  ]
}

Définitions

Nom	Description
ComputerVisionError	Détails sur l’erreur de requête d’API.
ComputerVisionErrorCodes	Code d'erreur.
ImageUrl
OcrLanguages	Code de langage BCP-47 du texte à détecter dans l’image. La valeur par défaut est « unk ».
OcrLine	Objet décrivant une seule ligne de texte reconnue.
OcrRegion	Une région se compose de plusieurs lignes (par exemple, une colonne de texte dans un document à plusieurs colonnes).
OcrResult
OcrWord	Informations sur un mot reconnu.

ComputerVisionError

Détails sur l’erreur de requête d’API.

Nom	Type	Description
code	ComputerVisionErrorCodes	Code d'erreur.
message	string	Message expliquant l’erreur signalée par le service.
requestId	string	Identificateur de requête unique.

ComputerVisionErrorCodes

Code d'erreur.

Nom	Type	Description
BadArgument	string
CancelledRequest	string
DetectFaceError	string
FailedToProcess	string
InternalServerError	string
InvalidDetails	string
InvalidImageFormat	string
InvalidImageSize	string
InvalidImageUrl	string
InvalidModel	string
InvalidThumbnailSize	string
NotSupportedFeature	string
NotSupportedImage	string
NotSupportedLanguage	string
NotSupportedVisualFeature	string
StorageException	string
Timeout	string
Unspecified	string
UnsupportedMediaType	string

ImageUrl

Nom	Type	Description
url	string	URL accessible publiquement d’une image.

OcrLanguages

Code de langage BCP-47 du texte à détecter dans l’image. La valeur par défaut est « unk ».

Nom	Type	Description
ar	string
cs	string
da	string
de	string
el	string
en	string
es	string
fi	string
fr	string
hu	string
it	string
ja	string
ko	string
nb	string
nl	string
pl	string
pt	string
ro	string
ru	string
sk	string
sr-Cyrl	string
sr-Latn	string
sv	string
tr	string
unk	string
zh-Hans	string
zh-Hant	string

OcrLine

Objet décrivant une seule ligne de texte reconnue.

Nom	Type	Description
boundingBox	string	Zone englobante d’une ligne reconnue. Les quatre entiers représentent la coordonnée x du bord gauche, la coordonnée y du bord supérieur, la largeur et la hauteur du cadre englobant, dans le système de coordonnées de l’image d’entrée, une fois qu’elle a été pivotée autour de son centre en fonction de l’angle de texte détecté (voir la propriété textAngle), avec l’origine en haut à gauche et l’axe y pointant vers le bas.
words	OcrWord[]	Tableau d’objets, où chaque objet représente un mot reconnu.

OcrRegion

Une région se compose de plusieurs lignes (par exemple, une colonne de texte dans un document à plusieurs colonnes).

Nom	Type	Description
boundingBox	string	Zone englobante d’une région reconnue. Les quatre entiers représentent la coordonnée x du bord gauche, la coordonnée y du bord supérieur, la largeur et la hauteur du cadre englobant, dans le système de coordonnées de l’image d’entrée, une fois qu’elle a été pivotée autour de son centre en fonction de l’angle de texte détecté (voir la propriété textAngle), avec l’origine en haut à gauche et l’axe y pointant vers le bas.
lines	OcrLine[]	Tableau de lignes de texte reconnues.

OcrResult

Nom	Type	Description
language	string	Code de langage BCP-47 du texte dans l’image.
orientation	string	Orientation du texte reconnu dans l’image, si demandé. La valeur (haut, bas, gauche ou droite) fait référence à la direction vers laquelle se trouve le haut du texte reconnu, une fois que l’image a été pivotée autour de son centre en fonction de l’angle de texte détecté (voir la propriété textAngle). Si la détection de l’orientation n’a pas été demandée ou si aucun texte n’est détecté, la valeur est « NotDetected ».
regions	OcrRegion[]	Tableau d’objets, où chaque objet représente une région de texte reconnu.
textAngle	number	Angle, en radians, du texte détecté par rapport à la direction horizontale ou verticale la plus proche. Après avoir fait pivoter l’image d’entrée dans le sens des aiguilles d’une montre de cet angle, les lignes de texte reconnues deviennent horizontales ou verticales. En combinaison avec la propriété d’orientation, il peut être utilisé pour superposer correctement les résultats de reconnaissance sur l’image d’origine, en faisant pivoter l’image d’origine ou les résultats de reconnaissance selon un angle approprié autour du centre de l’image d’origine. Si l’angle ne peut pas être détecté en toute confiance, cette propriété n’est pas présente. Si l’image contient du texte sous différents angles, seule une partie du texte est reconnue correctement.

OcrWord

Informations sur un mot reconnu.

Nom	Type	Description
boundingBox	string	Cadre englobant d’un mot reconnu. Les quatre entiers représentent la coordonnée x du bord gauche, la coordonnée y du bord supérieur, la largeur et la hauteur du cadre englobant, dans le système de coordonnées de l’image d’entrée, une fois qu’elle a été pivotée autour de son centre en fonction de l’angle de texte détecté (voir la propriété textAngle), avec l’origine en haut à gauche et l’axe y pointant vers le bas.
text	string	Valeur de chaîne d’un mot reconnu.

Partager via