Recognize Printed Text - Recognize Printed Text
Avec la reconnaissance optique de caractères (OCR), détectez du texte dans une image et extrayez les caractères reconnus dans un flux de caractères exploitable automatiquement. En cas de réussite, les résultats OCR sont retournés. En cas d’échec, le code d’erreur ainsi qu’un message d’erreur sont retournés. Le code d’erreur peut être l’un des éléments InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage ou InternalServerError.
POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}
POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}&language={language}
Paramètres URI
Nom | Dans | Obligatoire | Type | Description |
---|---|---|---|---|
Endpoint
|
path | True |
string |
Points de terminaison Cognitive Services pris en charge. |
detect
|
query | True |
boolean |
Détecter l’orientation du texte dans l’image. Avec detectOrientation=true, le service OCR tente de détecter l’orientation de l’image et de la corriger avant le traitement ultérieur (par exemple, si elle est à l’envers). |
language
|
query |
Code de langage BCP-47 du texte à détecter dans l’image. La valeur par défaut est « unk ». |
En-tête de la demande
Nom | Obligatoire | Type | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Corps de la demande
Nom | Obligatoire | Type | Description |
---|---|---|---|
url | True |
string |
URL accessible publiquement d’une image. |
Réponses
Nom | Type | Description |
---|---|---|
200 OK |
L’OCR aboutit à la hiérarchie de région/ligne/mot. Les résultats incluent du texte, un cadre englobant pour les régions, des lignes et des mots. Angle, en radians, du texte détecté par rapport à la direction horizontale ou verticale la plus proche. Après avoir fait pivoter l’image d’entrée dans le sens des aiguilles d’une montre de cet angle, les lignes de texte reconnues deviennent horizontales ou verticales. En combinaison avec la propriété d’orientation, il peut être utilisé pour superposer correctement les résultats de reconnaissance sur l’image d’origine, en faisant pivoter l’image d’origine ou les résultats de reconnaissance selon un angle approprié autour du centre de l’image d’origine. Si l’angle ne peut pas être détecté en toute confiance, cette propriété n’est pas présente. Si l’image contient du texte sous différents angles, seule une partie du texte est reconnue correctement. |
|
Other Status Codes |
Réponse d’erreur. |
Sécurité
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Exemples
Successful RecognizePrintedText request
Sample Request
POST https://westus.api.cognitive.microsoft.com/vision/v2.1/ocr?detectOrientation=true&language=en
"{url}"
Sample Response
{
"language": "en",
"textAngle": -2.0000000000000338,
"orientation": "Up",
"regions": [
{
"boundingBox": "462,379,497,258",
"lines": [
{
"boundingBox": "462,379,497,74",
"words": [
{
"boundingBox": "462,379,41,73",
"text": "A"
},
{
"boundingBox": "523,379,153,73",
"text": "GOAL"
},
{
"boundingBox": "694,379,265,74",
"text": "WITHOUT"
}
]
},
{
"boundingBox": "565,471,289,74",
"words": [
{
"boundingBox": "565,471,41,73",
"text": "A"
},
{
"boundingBox": "626,471,150,73",
"text": "PLAN"
},
{
"boundingBox": "801,472,53,73",
"text": "IS"
}
]
},
{
"boundingBox": "519,563,375,74",
"words": [
{
"boundingBox": "519,563,149,74",
"text": "JUST"
},
{
"boundingBox": "683,564,41,72",
"text": "A"
},
{
"boundingBox": "741,564,153,73",
"text": "WISH"
}
]
}
]
}
]
}
Définitions
Nom | Description |
---|---|
Computer |
Détails sur l’erreur de requête d’API. |
Computer |
Code d'erreur. |
Image |
|
Ocr |
Code de langage BCP-47 du texte à détecter dans l’image. La valeur par défaut est « unk ». |
Ocr |
Objet décrivant une seule ligne de texte reconnue. |
Ocr |
Une région se compose de plusieurs lignes (par exemple, une colonne de texte dans un document à plusieurs colonnes). |
Ocr |
|
Ocr |
Informations sur un mot reconnu. |
ComputerVisionError
Détails sur l’erreur de requête d’API.
Nom | Type | Description |
---|---|---|
code |
Code d'erreur. |
|
message |
string |
Message expliquant l’erreur signalée par le service. |
requestId |
string |
Identificateur de requête unique. |
ComputerVisionErrorCodes
Code d'erreur.
Nom | Type | Description |
---|---|---|
BadArgument |
string |
|
CancelledRequest |
string |
|
DetectFaceError |
string |
|
FailedToProcess |
string |
|
InternalServerError |
string |
|
InvalidDetails |
string |
|
InvalidImageFormat |
string |
|
InvalidImageSize |
string |
|
InvalidImageUrl |
string |
|
InvalidModel |
string |
|
InvalidThumbnailSize |
string |
|
NotSupportedFeature |
string |
|
NotSupportedImage |
string |
|
NotSupportedLanguage |
string |
|
NotSupportedVisualFeature |
string |
|
StorageException |
string |
|
Timeout |
string |
|
Unspecified |
string |
|
UnsupportedMediaType |
string |
ImageUrl
Nom | Type | Description |
---|---|---|
url |
string |
URL accessible publiquement d’une image. |
OcrLanguages
Code de langage BCP-47 du texte à détecter dans l’image. La valeur par défaut est « unk ».
Nom | Type | Description |
---|---|---|
ar |
string |
|
cs |
string |
|
da |
string |
|
de |
string |
|
el |
string |
|
en |
string |
|
es |
string |
|
fi |
string |
|
fr |
string |
|
hu |
string |
|
it |
string |
|
ja |
string |
|
ko |
string |
|
nb |
string |
|
nl |
string |
|
pl |
string |
|
pt |
string |
|
ro |
string |
|
ru |
string |
|
sk |
string |
|
sr-Cyrl |
string |
|
sr-Latn |
string |
|
sv |
string |
|
tr |
string |
|
unk |
string |
|
zh-Hans |
string |
|
zh-Hant |
string |
OcrLine
Objet décrivant une seule ligne de texte reconnue.
Nom | Type | Description |
---|---|---|
boundingBox |
string |
Zone englobante d’une ligne reconnue. Les quatre entiers représentent la coordonnée x du bord gauche, la coordonnée y du bord supérieur, la largeur et la hauteur du cadre englobant, dans le système de coordonnées de l’image d’entrée, une fois qu’elle a été pivotée autour de son centre en fonction de l’angle de texte détecté (voir la propriété textAngle), avec l’origine en haut à gauche et l’axe y pointant vers le bas. |
words |
Ocr |
Tableau d’objets, où chaque objet représente un mot reconnu. |
OcrRegion
Une région se compose de plusieurs lignes (par exemple, une colonne de texte dans un document à plusieurs colonnes).
Nom | Type | Description |
---|---|---|
boundingBox |
string |
Zone englobante d’une région reconnue. Les quatre entiers représentent la coordonnée x du bord gauche, la coordonnée y du bord supérieur, la largeur et la hauteur du cadre englobant, dans le système de coordonnées de l’image d’entrée, une fois qu’elle a été pivotée autour de son centre en fonction de l’angle de texte détecté (voir la propriété textAngle), avec l’origine en haut à gauche et l’axe y pointant vers le bas. |
lines |
Ocr |
Tableau de lignes de texte reconnues. |
OcrResult
Nom | Type | Description |
---|---|---|
language |
string |
Code de langage BCP-47 du texte dans l’image. |
orientation |
string |
Orientation du texte reconnu dans l’image, si demandé. La valeur (haut, bas, gauche ou droite) fait référence à la direction vers laquelle se trouve le haut du texte reconnu, une fois que l’image a été pivotée autour de son centre en fonction de l’angle de texte détecté (voir la propriété textAngle). Si la détection de l’orientation n’a pas été demandée ou si aucun texte n’est détecté, la valeur est « NotDetected ». |
regions |
Tableau d’objets, où chaque objet représente une région de texte reconnu. |
|
textAngle |
number |
Angle, en radians, du texte détecté par rapport à la direction horizontale ou verticale la plus proche. Après avoir fait pivoter l’image d’entrée dans le sens des aiguilles d’une montre de cet angle, les lignes de texte reconnues deviennent horizontales ou verticales. En combinaison avec la propriété d’orientation, il peut être utilisé pour superposer correctement les résultats de reconnaissance sur l’image d’origine, en faisant pivoter l’image d’origine ou les résultats de reconnaissance selon un angle approprié autour du centre de l’image d’origine. Si l’angle ne peut pas être détecté en toute confiance, cette propriété n’est pas présente. Si l’image contient du texte sous différents angles, seule une partie du texte est reconnue correctement. |
OcrWord
Informations sur un mot reconnu.
Nom | Type | Description |
---|---|---|
boundingBox |
string |
Cadre englobant d’un mot reconnu. Les quatre entiers représentent la coordonnée x du bord gauche, la coordonnée y du bord supérieur, la largeur et la hauteur du cadre englobant, dans le système de coordonnées de l’image d’entrée, une fois qu’elle a été pivotée autour de son centre en fonction de l’angle de texte détecté (voir la propriété textAngle), avec l’origine en haut à gauche et l’axe y pointant vers le bas. |
text |
string |
Valeur de chaîne d’un mot reconnu. |