Recognize Printed Text - Recognize Printed Text
Pengenalan Karakter Optik (OCR) mendeteksi teks dalam gambar dan mengekstrak karakter yang dikenali ke dalam aliran karakter yang dapat digunakan komputer. Setelah berhasil, hasil OCR akan dikembalikan. Setelah kegagalan, kode kesalahan bersama dengan pesan kesalahan akan dikembalikan. Kode kesalahan dapat berupa InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage, atau InternalServerError.
POST {Endpoint}/vision/v3.2/ocr?detectOrientation={detectOrientation}
POST {Endpoint}/vision/v3.2/ocr?detectOrientation={detectOrientation}&language={language}&model-version={model-version}
Parameter URI
Nama | Dalam | Diperlukan | Jenis | Deskripsi |
---|---|---|---|---|
Endpoint
|
path | True |
string |
Titik akhir Cognitive Services yang didukung. |
detect
|
query | True |
boolean |
Apakah mendeteksi orientasi teks dalam gambar. Dengan detectOrientation=true, layanan OCR mencoba mendeteksi orientasi gambar dan memperbaikinya sebelum diproses lebih lanjut (misalnya jika terbalik). |
language
|
query |
Kode bahasa BCP-47 dari teks yang akan terdeteksi dalam gambar. Nilai defaultnya adalah 'unk'. |
||
model-version
|
query |
string |
Parameter opsional untuk menentukan versi model AI. Nilai yang diterima adalah: "terbaru", "2021-04-01", "2021-05-01". Default ke "terbaru". Pola regex: |
Header Permintaan
Nama | Diperlukan | Jenis | Deskripsi |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Isi Permintaan
Nama | Diperlukan | Jenis | Deskripsi |
---|---|---|---|
url | True |
string |
URL gambar yang dapat dijangkau secara publik. |
Respons
Nama | Jenis | Deskripsi |
---|---|---|
200 OK |
OCR menghasilkan hierarki wilayah/baris/kata. Hasilnya mencakup teks, kotak pembatas untuk wilayah, garis, dan kata. Sudut, dalam radian, dari teks yang terdeteksi sehubungan dengan arah horizontal atau vertikal terdekat. Setelah memutar gambar input searah jarum jam oleh sudut ini, baris teks yang dikenali menjadi horizontal atau vertikal. Dalam kombinasi dengan properti orientasi, ini dapat digunakan untuk melapisi hasil pengenalan dengan benar pada gambar asli, dengan memutar gambar asli atau hasil pengenalan dengan sudut yang sesuai di sekitar pusat gambar asli. Jika sudut tidak dapat dideteksi dengan percaya diri, properti ini tidak ada. Jika gambar berisi teks pada sudut yang berbeda, hanya sebagian teks yang akan dikenali dengan benar. |
|
Other Status Codes |
Respons kesalahan. |
Keamanan
Ocp-Apim-Subscription-Key
Jenis:
apiKey
Dalam:
header
Contoh
Successful RecognizePrintedText request
Permintaan sampel
POST https://westus.api.cognitive.microsoft.com/vision/v3.2/ocr?detectOrientation=true&language=en
{
"url": "{url}"
}
Respon sampel
{
"language": "en",
"textAngle": -2.0000000000000338,
"orientation": "Up",
"regions": [
{
"boundingBox": "462,379,497,258",
"lines": [
{
"boundingBox": "462,379,497,74",
"words": [
{
"boundingBox": "462,379,41,73",
"text": "A"
},
{
"boundingBox": "523,379,153,73",
"text": "GOAL"
},
{
"boundingBox": "694,379,265,74",
"text": "WITHOUT"
}
]
},
{
"boundingBox": "565,471,289,74",
"words": [
{
"boundingBox": "565,471,41,73",
"text": "A"
},
{
"boundingBox": "626,471,150,73",
"text": "PLAN"
},
{
"boundingBox": "801,472,53,73",
"text": "IS"
}
]
},
{
"boundingBox": "519,563,375,74",
"words": [
{
"boundingBox": "519,563,149,74",
"text": "JUST"
},
{
"boundingBox": "683,564,41,72",
"text": "A"
},
{
"boundingBox": "741,564,153,73",
"text": "WISH"
}
]
}
]
}
],
"modelVersion": "2021-04-01"
}
Definisi
Nama | Deskripsi |
---|---|
Computer |
Kesalahan permintaan API. |
Computer |
Kode kesalahan. |
Computer |
Respons kesalahan API. |
Computer |
Detail tentang kesalahan permintaan API. |
Computer |
Kode kesalahan. |
Image |
|
Ocr |
Kode bahasa BCP-47 dari teks yang akan terdeteksi dalam gambar. Nilai defaultnya adalah 'unk'. |
Ocr |
Objek yang menjelaskan satu baris teks yang dikenali. |
Ocr |
Wilayah terdiri dari beberapa baris (misalnya kolom teks dalam dokumen multi-kolom). |
Ocr |
|
Ocr |
Informasi tentang kata yang dikenali. |
ComputerVisionError
Kesalahan permintaan API.
Nama | Jenis | Deskripsi |
---|---|---|
code |
Kode kesalahan. |
|
innererror |
Kesalahan dalam berisi informasi yang lebih spesifik. |
|
message |
string |
Pesan yang menjelaskan kesalahan yang dilaporkan oleh layanan. |
ComputerVisionErrorCodes
Kode kesalahan.
Nama | Jenis | Deskripsi |
---|---|---|
InternalServerError |
string |
|
InvalidArgument |
string |
|
InvalidRequest |
string |
|
ServiceUnavailable |
string |
ComputerVisionErrorResponse
Respons kesalahan API.
Nama | Jenis | Deskripsi |
---|---|---|
error |
Isi kesalahan. |
ComputerVisionInnerError
Detail tentang kesalahan permintaan API.
Nama | Jenis | Deskripsi |
---|---|---|
code |
Kode kesalahan. |
|
message |
string |
Pesan kesalahan. |
ComputerVisionInnerErrorCodeValue
Kode kesalahan.
Nama | Jenis | Deskripsi |
---|---|---|
BadArgument |
string |
|
CancelledRequest |
string |
|
DetectFaceError |
string |
|
FailedToProcess |
string |
|
InternalServerError |
string |
|
InvalidDetails |
string |
|
InvalidImageFormat |
string |
|
InvalidImageSize |
string |
|
InvalidImageUrl |
string |
|
InvalidModel |
string |
|
InvalidThumbnailSize |
string |
|
NotSupportedFeature |
string |
|
NotSupportedImage |
string |
|
NotSupportedLanguage |
string |
|
NotSupportedVisualFeature |
string |
|
StorageException |
string |
|
Timeout |
string |
|
Unspecified |
string |
|
UnsupportedMediaType |
string |
ImageUrl
Nama | Jenis | Deskripsi |
---|---|---|
url |
string |
URL gambar yang dapat dijangkau secara publik. |
OcrLanguages
Kode bahasa BCP-47 dari teks yang akan terdeteksi dalam gambar. Nilai defaultnya adalah 'unk'.
Nama | Jenis | Deskripsi |
---|---|---|
ar |
string |
|
cs |
string |
|
da |
string |
|
de |
string |
|
el |
string |
|
en |
string |
|
es |
string |
|
fi |
string |
|
fr |
string |
|
hu |
string |
|
it |
string |
|
ja |
string |
|
ko |
string |
|
nb |
string |
|
nl |
string |
|
pl |
string |
|
pt |
string |
|
ro |
string |
|
ru |
string |
|
sk |
string |
|
sr-Cyrl |
string |
|
sr-Latn |
string |
|
sv |
string |
|
tr |
string |
|
unk |
string |
|
zh-Hans |
string |
|
zh-Hant |
string |
OcrLine
Objek yang menjelaskan satu baris teks yang dikenali.
Nama | Jenis | Deskripsi |
---|---|---|
boundingBox |
string |
Kotak pembatas garis yang dikenali. Empat bilangan bulat mewakili koordinat x tepi kiri, koordinat y tepi atas, lebar, dan tinggi kotak pembatas, dalam sistem koordinat gambar input, setelah diputar di sekitar tengahnya sesuai dengan sudut teks yang terdeteksi (lihat properti textAngle), dengan asal di sudut kiri atas, dan sumbu y menunjuk ke bawah. |
words |
Ocr |
Array objek, di mana setiap objek mewakili kata yang dikenali. |
OcrRegion
Wilayah terdiri dari beberapa baris (misalnya kolom teks dalam dokumen multi-kolom).
Nama | Jenis | Deskripsi |
---|---|---|
boundingBox |
string |
Kotak pembatas dari wilayah yang dikenali. Empat bilangan bulat mewakili koordinat x tepi kiri, koordinat y tepi atas, lebar, dan tinggi kotak pembatas, dalam sistem koordinat gambar input, setelah diputar di sekitar tengahnya sesuai dengan sudut teks yang terdeteksi (lihat properti textAngle), dengan asal di sudut kiri atas, dan sumbu y menunjuk ke bawah. |
lines |
Ocr |
Array baris teks yang dikenali. |
OcrResult
Nama | Jenis | Deskripsi |
---|---|---|
language |
string |
Kode bahasa BCP-47 dari teks dalam gambar. |
modelVersion |
string |
Versi model AI. |
orientation |
string |
Orientasi teks yang dikenali dalam gambar, jika diminta. Nilai (atas, bawah, kiri, atau kanan) mengacu pada arah bagian atas teks yang dikenali, setelah gambar diputar di sekitar tengahnya sesuai dengan sudut teks yang terdeteksi (lihat properti textAngle). Jika deteksi orientasi tidak diminta, atau tidak ada teks yang terdeteksi, nilainya adalah 'NotDetected'. |
regions |
Array objek, di mana setiap objek mewakili wilayah teks yang dikenali. |
|
textAngle |
number |
Sudut, dalam radian, dari teks yang terdeteksi sehubungan dengan arah horizontal atau vertikal terdekat. Setelah memutar gambar input searah jarum jam oleh sudut ini, baris teks yang dikenali menjadi horizontal atau vertikal. Dalam kombinasi dengan properti orientasi, ini dapat digunakan untuk melapisi hasil pengenalan dengan benar pada gambar asli, dengan memutar gambar asli atau hasil pengenalan dengan sudut yang sesuai di sekitar pusat gambar asli. Jika sudut tidak dapat dideteksi dengan percaya diri, properti ini tidak ada. Jika gambar berisi teks pada sudut yang berbeda, hanya sebagian teks yang akan dikenali dengan benar. |
OcrWord
Informasi tentang kata yang dikenali.
Nama | Jenis | Deskripsi |
---|---|---|
boundingBox |
string |
Kotak pembatas kata yang dikenali. Empat bilangan bulat mewakili koordinat x tepi kiri, koordinat y tepi atas, lebar, dan tinggi kotak pembatas, dalam sistem koordinat gambar input, setelah diputar di sekitar tengahnya sesuai dengan sudut teks yang terdeteksi (lihat properti textAngle), dengan asal di sudut kiri atas, dan sumbu y menunjuk ke bawah. |
text |
string |
Nilai string kata yang dikenali. |