Bagikan melalui


Recognize Printed Text - Recognize Printed Text

Pengenalan Karakter Optik (OCR) mendeteksi teks dalam gambar dan mengekstrak karakter yang dikenali ke dalam aliran karakter yang dapat digunakan komputer. Setelah berhasil, hasil OCR akan dikembalikan. Setelah kegagalan, kode kesalahan bersama dengan pesan kesalahan akan dikembalikan. Kode kesalahan dapat berupa salah satu dari InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage, atau InternalServerError.

POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}
POST {Endpoint}/vision/v2.1/ocr?detectOrientation={detectOrientation}&language={language}

Parameter URI

Nama Dalam Diperlukan Jenis Deskripsi
Endpoint
path True

string

Titik akhir Cognitive Services yang didukung.

detectOrientation
query True

boolean

Apakah mendeteksi orientasi teks dalam gambar. Dengan detectOrientation=true, layanan OCR mencoba mendeteksi orientasi gambar dan memperbaikinya sebelum diproses lebih lanjut (misalnya jika terbalik).

language
query

OcrLanguages

Kode bahasa BCP-47 dari teks yang akan terdeteksi dalam gambar. Nilai defaultnya adalah 'unk'.

Header Permintaan

Nama Diperlukan Jenis Deskripsi
Ocp-Apim-Subscription-Key True

string

Isi Permintaan

Nama Diperlukan Jenis Deskripsi
url True

string

URL gambar yang dapat dijangkau secara publik.

Respons

Nama Jenis Deskripsi
200 OK

OcrResult

OCR menghasilkan hierarki wilayah/baris/kata. Hasilnya mencakup teks, kotak pembatas untuk wilayah, garis, dan kata. Sudut, dalam radian, dari teks yang terdeteksi sehubungan dengan arah horizontal atau vertikal terdekat. Setelah memutar gambar input searah jarum jam dengan sudut ini, garis teks yang dikenali menjadi horizontal atau vertikal. Dalam kombinasi dengan properti orientasi, properti ini dapat digunakan untuk melapisi hasil pengenalan dengan benar pada gambar asli, dengan memutar gambar asli atau hasil pengenalan dengan sudut yang sesuai di sekitar pusat gambar asli. Jika sudut tidak dapat dideteksi dengan percaya diri, properti ini tidak ada. Jika gambar berisi teks pada sudut yang berbeda, hanya sebagian teks yang akan dikenali dengan benar.

Other Status Codes

ComputerVisionError

Respons kesalahan.

Keamanan

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Contoh

Successful RecognizePrintedText request

Sample Request

POST https://westus.api.cognitive.microsoft.com/vision/v2.1/ocr?detectOrientation=true&language=en


"{url}"

Sample Response

{
  "language": "en",
  "textAngle": -2.0000000000000338,
  "orientation": "Up",
  "regions": [
    {
      "boundingBox": "462,379,497,258",
      "lines": [
        {
          "boundingBox": "462,379,497,74",
          "words": [
            {
              "boundingBox": "462,379,41,73",
              "text": "A"
            },
            {
              "boundingBox": "523,379,153,73",
              "text": "GOAL"
            },
            {
              "boundingBox": "694,379,265,74",
              "text": "WITHOUT"
            }
          ]
        },
        {
          "boundingBox": "565,471,289,74",
          "words": [
            {
              "boundingBox": "565,471,41,73",
              "text": "A"
            },
            {
              "boundingBox": "626,471,150,73",
              "text": "PLAN"
            },
            {
              "boundingBox": "801,472,53,73",
              "text": "IS"
            }
          ]
        },
        {
          "boundingBox": "519,563,375,74",
          "words": [
            {
              "boundingBox": "519,563,149,74",
              "text": "JUST"
            },
            {
              "boundingBox": "683,564,41,72",
              "text": "A"
            },
            {
              "boundingBox": "741,564,153,73",
              "text": "WISH"
            }
          ]
        }
      ]
    }
  ]
}

Definisi

Nama Deskripsi
ComputerVisionError

Detail tentang kesalahan permintaan API.

ComputerVisionErrorCodes

Kode kesalahan.

ImageUrl
OcrLanguages

Kode bahasa BCP-47 dari teks yang akan terdeteksi dalam gambar. Nilai defaultnya adalah 'unk'.

OcrLine

Objek yang menjelaskan satu baris teks yang dikenali.

OcrRegion

Wilayah terdiri dari beberapa baris (misalnya kolom teks dalam dokumen multi-kolom).

OcrResult
OcrWord

Informasi tentang kata yang dikenali.

ComputerVisionError

Detail tentang kesalahan permintaan API.

Nama Jenis Deskripsi
code

ComputerVisionErrorCodes

Kode kesalahan.

message

string

Pesan yang menjelaskan kesalahan yang dilaporkan oleh layanan.

requestId

string

Pengidentifikasi permintaan unik.

ComputerVisionErrorCodes

Kode kesalahan.

Nama Jenis Deskripsi
BadArgument

string

CancelledRequest

string

DetectFaceError

string

FailedToProcess

string

InternalServerError

string

InvalidDetails

string

InvalidImageFormat

string

InvalidImageSize

string

InvalidImageUrl

string

InvalidModel

string

InvalidThumbnailSize

string

NotSupportedFeature

string

NotSupportedImage

string

NotSupportedLanguage

string

NotSupportedVisualFeature

string

StorageException

string

Timeout

string

Unspecified

string

UnsupportedMediaType

string

ImageUrl

Nama Jenis Deskripsi
url

string

URL gambar yang dapat dijangkau secara publik.

OcrLanguages

Kode bahasa BCP-47 dari teks yang akan terdeteksi dalam gambar. Nilai defaultnya adalah 'unk'.

Nama Jenis Deskripsi
ar

string

cs

string

da

string

de

string

el

string

en

string

es

string

fi

string

fr

string

hu

string

it

string

ja

string

ko

string

nb

string

nl

string

pl

string

pt

string

ro

string

ru

string

sk

string

sr-Cyrl

string

sr-Latn

string

sv

string

tr

string

unk

string

zh-Hans

string

zh-Hant

string

OcrLine

Objek yang menjelaskan satu baris teks yang dikenali.

Nama Jenis Deskripsi
boundingBox

string

Kotak pembatas dari garis yang dikenali. Empat bilangan bulat mewakili koordinat x tepi kiri, koordinat y tepi atas, lebar, dan tinggi kotak pembatas, dalam sistem koordinat gambar input, setelah diputar di sekitar tengahnya sesuai dengan sudut teks yang terdeteksi (lihat properti textAngle), dengan asal di sudut kiri atas, dan sumbu y menunjuk ke bawah.

words

OcrWord[]

Array objek, di mana setiap objek mewakili kata yang dikenali.

OcrRegion

Wilayah terdiri dari beberapa baris (misalnya kolom teks dalam dokumen multi-kolom).

Nama Jenis Deskripsi
boundingBox

string

Kotak pembatas wilayah yang dikenali. Empat bilangan bulat mewakili koordinat x tepi kiri, koordinat y tepi atas, lebar, dan tinggi kotak pembatas, dalam sistem koordinat gambar input, setelah diputar di sekitar tengahnya sesuai dengan sudut teks yang terdeteksi (lihat properti textAngle), dengan asal di sudut kiri atas, dan sumbu y menunjuk ke bawah.

lines

OcrLine[]

Array baris teks yang dikenali.

OcrResult

Nama Jenis Deskripsi
language

string

Kode bahasa BCP-47 dari teks dalam gambar.

orientation

string

Orientasi teks yang dikenali dalam gambar, jika diminta. Nilai (atas, bawah, kiri, atau kanan) mengacu pada arah yang dihadapi bagian atas teks yang dikenali, setelah gambar diputar di sekitar tengahnya sesuai dengan sudut teks yang terdeteksi (lihat properti textAngle). Jika deteksi orientasi tidak diminta, atau tidak ada teks yang terdeteksi, nilainya adalah 'NotDetected'.

regions

OcrRegion[]

Array objek, di mana setiap objek mewakili wilayah teks yang dikenali.

textAngle

number

Sudut, dalam radian, dari teks yang terdeteksi sehubungan dengan arah horizontal atau vertikal terdekat. Setelah memutar gambar input searah jarum jam dengan sudut ini, garis teks yang dikenali menjadi horizontal atau vertikal. Dalam kombinasi dengan properti orientasi, properti ini dapat digunakan untuk melapisi hasil pengenalan dengan benar pada gambar asli, dengan memutar gambar asli atau hasil pengenalan dengan sudut yang sesuai di sekitar pusat gambar asli. Jika sudut tidak dapat dideteksi dengan percaya diri, properti ini tidak ada. Jika gambar berisi teks pada sudut yang berbeda, hanya sebagian teks yang akan dikenali dengan benar.

OcrWord

Informasi tentang kata yang dikenali.

Nama Jenis Deskripsi
boundingBox

string

Kotak pembatas kata yang dikenali. Empat bilangan bulat mewakili koordinat x tepi kiri, koordinat y tepi atas, lebar, dan tinggi kotak pembatas, dalam sistem koordinat gambar input, setelah diputar di sekitar tengahnya sesuai dengan sudut teks yang terdeteksi (lihat properti textAngle), dengan asal di sudut kiri atas, dan sumbu y menunjuk ke bawah.

text

string

Nilai string kata yang dikenali.