Recognize Printed Text - Recognize Printed Text
Pengenalan Karakter Optik (OCR) mendeteksi teks dalam gambar dan mengekstrak karakter yang dikenali ke dalam aliran karakter yang dapat digunakan komputer. Setelah berhasil, hasil OCR akan dikembalikan. Setelah kegagalan, kode kesalahan bersama dengan pesan kesalahan akan dikembalikan. Kode kesalahan dapat berupa salah satu dari InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage, atau InternalServerError.
POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}
POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}&language={language}
Parameter URI
Nama | Dalam | Diperlukan | Jenis | Deskripsi |
---|---|---|---|---|
Endpoint
|
path | True |
string |
Titik akhir Cognitive Services yang didukung. |
detect
|
query | True |
boolean |
Apakah mendeteksi orientasi teks dalam gambar. Dengan detectOrientation=true, layanan OCR mencoba mendeteksi orientasi gambar dan memperbaikinya sebelum diproses lebih lanjut (misalnya jika terbalik). |
language
|
query |
Kode bahasa BCP-47 dari teks yang akan terdeteksi dalam gambar. Nilai defaultnya adalah 'unk'. |
Header Permintaan
Nama | Diperlukan | Jenis | Deskripsi |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Isi Permintaan
Nama | Diperlukan | Jenis | Deskripsi |
---|---|---|---|
url | True |
string |
URL gambar yang dapat dijangkau secara publik. |
Respons
Nama | Jenis | Deskripsi |
---|---|---|
200 OK |
OCR menghasilkan hierarki wilayah/baris/kata. Hasilnya mencakup teks, kotak pembatas untuk wilayah, garis, dan kata. Sudut, dalam radian, dari teks yang terdeteksi sehubungan dengan arah horizontal atau vertikal terdekat. Setelah memutar gambar input searah jarum jam dengan sudut ini, garis teks yang dikenali menjadi horizontal atau vertikal. Dalam kombinasi dengan properti orientasi, properti ini dapat digunakan untuk melapisi hasil pengenalan dengan benar pada gambar asli, dengan memutar gambar asli atau hasil pengenalan dengan sudut yang sesuai di sekitar pusat gambar asli. Jika sudut tidak dapat dideteksi dengan percaya diri, properti ini tidak ada. Jika gambar berisi teks pada sudut yang berbeda, hanya sebagian teks yang akan dikenali dengan benar. |
|
Other Status Codes |
Respons kesalahan. |
Keamanan
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Contoh
Successful RecognizePrintedText request
Sample Request
POST https://westus.api.cognitive.microsoft.com/vision/v2.1/ocr?detectOrientation=true&language=en
"{url}"
Sample Response
{
"language": "en",
"textAngle": -2.0000000000000338,
"orientation": "Up",
"regions": [
{
"boundingBox": "462,379,497,258",
"lines": [
{
"boundingBox": "462,379,497,74",
"words": [
{
"boundingBox": "462,379,41,73",
"text": "A"
},
{
"boundingBox": "523,379,153,73",
"text": "GOAL"
},
{
"boundingBox": "694,379,265,74",
"text": "WITHOUT"
}
]
},
{
"boundingBox": "565,471,289,74",
"words": [
{
"boundingBox": "565,471,41,73",
"text": "A"
},
{
"boundingBox": "626,471,150,73",
"text": "PLAN"
},
{
"boundingBox": "801,472,53,73",
"text": "IS"
}
]
},
{
"boundingBox": "519,563,375,74",
"words": [
{
"boundingBox": "519,563,149,74",
"text": "JUST"
},
{
"boundingBox": "683,564,41,72",
"text": "A"
},
{
"boundingBox": "741,564,153,73",
"text": "WISH"
}
]
}
]
}
]
}
Definisi
Nama | Deskripsi |
---|---|
Computer |
Detail tentang kesalahan permintaan API. |
Computer |
Kode kesalahan. |
Image |
|
Ocr |
Kode bahasa BCP-47 dari teks yang akan terdeteksi dalam gambar. Nilai defaultnya adalah 'unk'. |
Ocr |
Objek yang menjelaskan satu baris teks yang dikenali. |
Ocr |
Wilayah terdiri dari beberapa baris (misalnya kolom teks dalam dokumen multi-kolom). |
Ocr |
|
Ocr |
Informasi tentang kata yang dikenali. |
ComputerVisionError
Detail tentang kesalahan permintaan API.
Nama | Jenis | Deskripsi |
---|---|---|
code |
Kode kesalahan. |
|
message |
string |
Pesan yang menjelaskan kesalahan yang dilaporkan oleh layanan. |
requestId |
string |
Pengidentifikasi permintaan unik. |
ComputerVisionErrorCodes
Kode kesalahan.
Nama | Jenis | Deskripsi |
---|---|---|
BadArgument |
string |
|
CancelledRequest |
string |
|
DetectFaceError |
string |
|
FailedToProcess |
string |
|
InternalServerError |
string |
|
InvalidDetails |
string |
|
InvalidImageFormat |
string |
|
InvalidImageSize |
string |
|
InvalidImageUrl |
string |
|
InvalidModel |
string |
|
InvalidThumbnailSize |
string |
|
NotSupportedFeature |
string |
|
NotSupportedImage |
string |
|
NotSupportedLanguage |
string |
|
NotSupportedVisualFeature |
string |
|
StorageException |
string |
|
Timeout |
string |
|
Unspecified |
string |
|
UnsupportedMediaType |
string |
ImageUrl
Nama | Jenis | Deskripsi |
---|---|---|
url |
string |
URL gambar yang dapat dijangkau secara publik. |
OcrLanguages
Kode bahasa BCP-47 dari teks yang akan terdeteksi dalam gambar. Nilai defaultnya adalah 'unk'.
Nama | Jenis | Deskripsi |
---|---|---|
ar |
string |
|
cs |
string |
|
da |
string |
|
de |
string |
|
el |
string |
|
en |
string |
|
es |
string |
|
fi |
string |
|
fr |
string |
|
hu |
string |
|
it |
string |
|
ja |
string |
|
ko |
string |
|
nb |
string |
|
nl |
string |
|
pl |
string |
|
pt |
string |
|
ro |
string |
|
ru |
string |
|
sk |
string |
|
sr-Cyrl |
string |
|
sr-Latn |
string |
|
sv |
string |
|
tr |
string |
|
unk |
string |
|
zh-Hans |
string |
|
zh-Hant |
string |
OcrLine
Objek yang menjelaskan satu baris teks yang dikenali.
Nama | Jenis | Deskripsi |
---|---|---|
boundingBox |
string |
Kotak pembatas dari garis yang dikenali. Empat bilangan bulat mewakili koordinat x tepi kiri, koordinat y tepi atas, lebar, dan tinggi kotak pembatas, dalam sistem koordinat gambar input, setelah diputar di sekitar tengahnya sesuai dengan sudut teks yang terdeteksi (lihat properti textAngle), dengan asal di sudut kiri atas, dan sumbu y menunjuk ke bawah. |
words |
Ocr |
Array objek, di mana setiap objek mewakili kata yang dikenali. |
OcrRegion
Wilayah terdiri dari beberapa baris (misalnya kolom teks dalam dokumen multi-kolom).
Nama | Jenis | Deskripsi |
---|---|---|
boundingBox |
string |
Kotak pembatas wilayah yang dikenali. Empat bilangan bulat mewakili koordinat x tepi kiri, koordinat y tepi atas, lebar, dan tinggi kotak pembatas, dalam sistem koordinat gambar input, setelah diputar di sekitar tengahnya sesuai dengan sudut teks yang terdeteksi (lihat properti textAngle), dengan asal di sudut kiri atas, dan sumbu y menunjuk ke bawah. |
lines |
Ocr |
Array baris teks yang dikenali. |
OcrResult
Nama | Jenis | Deskripsi |
---|---|---|
language |
string |
Kode bahasa BCP-47 dari teks dalam gambar. |
orientation |
string |
Orientasi teks yang dikenali dalam gambar, jika diminta. Nilai (atas, bawah, kiri, atau kanan) mengacu pada arah yang dihadapi bagian atas teks yang dikenali, setelah gambar diputar di sekitar tengahnya sesuai dengan sudut teks yang terdeteksi (lihat properti textAngle). Jika deteksi orientasi tidak diminta, atau tidak ada teks yang terdeteksi, nilainya adalah 'NotDetected'. |
regions |
Array objek, di mana setiap objek mewakili wilayah teks yang dikenali. |
|
textAngle |
number |
Sudut, dalam radian, dari teks yang terdeteksi sehubungan dengan arah horizontal atau vertikal terdekat. Setelah memutar gambar input searah jarum jam dengan sudut ini, garis teks yang dikenali menjadi horizontal atau vertikal. Dalam kombinasi dengan properti orientasi, properti ini dapat digunakan untuk melapisi hasil pengenalan dengan benar pada gambar asli, dengan memutar gambar asli atau hasil pengenalan dengan sudut yang sesuai di sekitar pusat gambar asli. Jika sudut tidak dapat dideteksi dengan percaya diri, properti ini tidak ada. Jika gambar berisi teks pada sudut yang berbeda, hanya sebagian teks yang akan dikenali dengan benar. |
OcrWord
Informasi tentang kata yang dikenali.
Nama | Jenis | Deskripsi |
---|---|---|
boundingBox |
string |
Kotak pembatas kata yang dikenali. Empat bilangan bulat mewakili koordinat x tepi kiri, koordinat y tepi atas, lebar, dan tinggi kotak pembatas, dalam sistem koordinat gambar input, setelah diputar di sekitar tengahnya sesuai dengan sudut teks yang terdeteksi (lihat properti textAngle), dengan asal di sudut kiri atas, dan sumbu y menunjuk ke bawah. |
text |
string |
Nilai string kata yang dikenali. |