Mulai Cepat: Azure AI Vision v3.2 GA Read
Edisi OCR (Baca)
Penting
Pilih Edisi Baca yang paling sesuai dengan kebutuhan Anda.
Input | Contoh | Edisi baca | Keuntungan |
---|---|---|---|
Gambar: Gambar umum, di alam bebas | label, tanda jalan, dan poster | OCR untuk gambar (versi 4.0) | Dioptimalkan untuk gambar umum non-dokumen dengan API sinkron yang ditingkatkan performanya yang memudahkan penyematan OCR dalam skenario pengalaman pengguna Anda. |
Dokumen: Digital dan dipindai, termasuk gambar | buku, artikel, dan laporan | Model baca Kecerdasan Dokumen | Dioptimalkan untuk dokumen teks-berat yang dipindai dan digital dengan API asinkron untuk membantu mengotomatiskan pemrosesan dokumen cerdas dalam skala besar. |
Tentang Azure AI Vision v3.2 GA Read
Mencari Azure AI Vision v3.2 GA Read terbaru? Semua penyempurnaan Read OCR di masa mendatang adalah bagian dari dua layanan yang tercantum sebelumnya. Tidak ada pembaruan lebih lanjut untuk Azure AI Vision v3.2. Untuk informasi selengkapnya, lihat Memanggil AZURE AI Vision 3.2 GA Read API dan Quickstart: Azure AI Vision v3.2 GA Read.
Mulai menggunakan Azure AI Vision Read REST API atau pustaka klien. API Baca memberi Anda algoritma AI untuk mengekstrak teks dari gambar serta mengembalikannya sebagai string terstruktur. Ikuti langkah-langkah ini untuk menginstal paket ke aplikasi Anda dan cobalah kode sampel untuk tugas dasar.
Gunakan pustaka klien pengenalan karakter optik (OCR) untuk membaca teks cetak dan tulisan tangan dari gambar. Layanan OCR dapat membaca teks yang terlihat dalam gambar dan mengonversinya menjadi aliran karakter. Untuk informasi selengkapnya tentang pengenalan teks, lihat gambaran umum OCR. Kode di bagian ini menggunakan paket Azure AI Vision terbaru.
Tip
Anda juga dapat mengekstrak teks dari gambar lokal. Lihat metode ComputerVisionClient, seperti ReadInStreamAsync. Atau, lihat sampel kode pada GitHub untuk skenario yang melibatkan gambar lokal.
Dokumentasi referensi | Kode sumber pustaka | Paket (NuGet) | Sampel
Prasyarat
Langganan Azure - Buat langganan gratis.
IDE Visual Studio atau versi .NET Core saat ini.
Sumber daya Azure AI Vision. Anda dapat menggunakan tingkat harga gratis (
F0
) untuk percobaan, lalu meningkatkannya ke tingkat berbayar untuk produksi.Kunci dan titik akhir dari sumber daya yang Anda buat untuk menyambungkan aplikasi Anda ke layanan Azure AI Vision.
- Setelah sumber daya Azure Vision Anda disebarkan, pilih Buka sumber daya.
- Di menu navigasi kiri, pilih Kunci dan Titik Akhir.
- Salin salah satu kunci dan Titik Akhir untuk digunakan nanti di mulai cepat.
Membuat variabel lingkungan
Dalam contoh ini, tulis kredensial Anda ke variabel lingkungan di komputer lokal yang menjalankan aplikasi.
Buka portal Microsoft Azure. Jika sumber daya yang Anda buat di bagian Prasyarat berhasil disebarkan, pilih Buka sumber daya di bawah Langkah Berikutnya. Anda dapat menemukan kunci dan titik akhir Anda di bawah Manajemen Sumber Daya di halaman Kunci dan Titik Akhir. Kunci sumber daya Anda tidak sama dengan ID langganan Azure Anda.
Tip
Jangan sertakan kunci langsung dalam kode Anda, dan jangan pernah mempostingnya secara publik. Lihat artikel keamanan layanan Azure AI untuk opsi autentikasi lainnya seperti Azure Key Vault.
Untuk mengatur variabel lingkungan untuk kunci dan titik akhir Anda, buka jendela konsol dan ikuti instruksi untuk sistem operasi dan lingkungan pengembangan Anda.
- Untuk mengatur
VISION_KEY
variabel lingkungan, gantiyour-key
dengan salah satu kunci untuk sumber daya Anda. - Untuk mengatur
VISION_ENDPOINT
variabel lingkungan, gantiyour-endpoint
dengan titik akhir untuk sumber daya Anda.
setx VISION_KEY your-key
setx VISION_ENDPOINT your-endpoint
Setelah menambahkan variabel lingkungan, Anda mungkin perlu memulai ulang program yang sedang berjalan yang akan membaca variabel lingkungan, termasuk jendela konsol.
Baca teks tulisan tangan dan yang dicetak
Buat aplikasi C# baru.
Menggunakan Visual Studio, buat proyek Aplikasi Konsol (.NET Framework) untuk C#, Windows, Console.
Setelah Anda membuat proyek baru, instal pustaka klien:
- Klik kanan pada solusi proyek di Penjelajah Solusi dan pilih Kelola Paket NuGet untuk Solusi.
- Di manajer paket yang terbuka, pilih Telusuri. Pilih Sertakan prarilis.
- Cari dan pilih
Microsoft.Azure.CognitiveServices.Vision.ComputerVision
. - Dalam kotak dialog detail, pilih proyek Anda dan pilih versi stabil terbaru. Lalu pilih Pasang.
Dari direktori proyek, buka file Program.cs di editor atau IDE pilihan Anda. Ganti konten Program.cs dengan kode berikut.
using System; using System.Collections.Generic; using Microsoft.Azure.CognitiveServices.Vision.ComputerVision; using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models; using System.Threading.Tasks; using System.IO; using Newtonsoft.Json; using Newtonsoft.Json.Linq; using System.Threading; using System.Linq; namespace ComputerVisionQuickstart { class Program { // Add your Computer Vision key and endpoint static string key = Environment.GetEnvironmentVariable("VISION_KEY"); static string endpoint = Environment.GetEnvironmentVariable("VISION_ENDPOINT"); private const string READ_TEXT_URL_IMAGE = "https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg"; static void Main(string[] args) { Console.WriteLine("Azure Cognitive Services Computer Vision - .NET quickstart example"); Console.WriteLine(); ComputerVisionClient client = Authenticate(endpoint, key); // Extract text (OCR) from a URL image using the Read API ReadFileUrl(client, READ_TEXT_URL_IMAGE).Wait(); } public static ComputerVisionClient Authenticate(string endpoint, string key) { ComputerVisionClient client = new ComputerVisionClient(new ApiKeyServiceClientCredentials(key)) { Endpoint = endpoint }; return client; } public static async Task ReadFileUrl(ComputerVisionClient client, string urlFile) { Console.WriteLine("----------------------------------------------------------"); Console.WriteLine("READ FILE FROM URL"); Console.WriteLine(); // Read text from URL var textHeaders = await client.ReadAsync(urlFile); // After the request, get the operation location (operation ID) string operationLocation = textHeaders.OperationLocation; Thread.Sleep(2000); // Retrieve the URI where the extracted text will be stored from the Operation-Location header. // We only need the ID and not the full URL const int numberOfCharsInOperationId = 36; string operationId = operationLocation.Substring(operationLocation.Length - numberOfCharsInOperationId); // Extract the text ReadOperationResult results; Console.WriteLine($"Extracting text from URL file {Path.GetFileName(urlFile)}..."); Console.WriteLine(); do { results = await client.GetReadResultAsync(Guid.Parse(operationId)); } while ((results.Status == OperationStatusCodes.Running || results.Status == OperationStatusCodes.NotStarted)); // Display the found text. Console.WriteLine(); var textUrlFileResults = results.AnalyzeResult.ReadResults; foreach (ReadResult page in textUrlFileResults) { foreach (Line line in page.Lines) { Console.WriteLine(line.Text); } } Console.WriteLine(); } } }
Sebagai langkah opsional, lihat Menentukan cara memproses data. Misalnya, untuk secara eksplisit menentukan model GA terbaru, edit panggilan
ReadAsync
seperti yang telah ditunjukkan. Lewati parameter atau gunakan"latest"
untuk menggunakan model GA terbaru.// Read text from URL with a specific model version var textHeaders = await client.ReadAsync(urlFile,null,null,"2022-04-30");
Jalankan aplikasi lagi.
- Dari menu Debug , pilih Mulai Penelusuran Kesalahan.
Hasil
Azure AI Vision - .NET quickstart example
----------------------------------------------------------
READ FILE FROM URL
Extracting text from URL file printed_text.jpg...
Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.
Membersihkan sumber daya
Jika Anda ingin membersihkan dan menghapus langganan layanan Azure AI, Anda dapat menghapus sumber daya atau grup sumber daya. Menghapus grup sumber daya juga menghapus sumber daya apa pun yang terkait dengannya.
Langkah berikutnya
Dalam mulai cepat ini, Anda belajar cara memasang pustaka klien OCR dan menggunakan Read API. Selanjutnya, pelajari lebih lanjut fitur Read API.
- Gambaran umum OCR
- Kode sumber untuk sampel ini dapat ditemukan di GitHub.
Gunakan pustaka klien pengenalan karakter optik (OCR) untuk membaca teks cetak dan tulisan tangan dari gambar jarak jauh. Layanan OCR dapat membaca teks yang terlihat dalam gambar dan mengonversinya menjadi aliran karakter. Untuk informasi selengkapnya tentang pengenalan teks, lihat gambaran umum OCR.
Tip
Anda juga dapat membaca teks dari gambar lokal. Lihat metode ComputerVisionClientOperationsMixin, seperti read_in_stream. Atau, lihat sampel kode pada GitHub untuk skenario yang melibatkan gambar lokal.
Dokumentasi referensi | Kode sumber pustaka | Paket (PiPy) | Sampel
Prasyarat
Langganan Azure - Buat langganan gratis.
Penginstalan Python Anda harus menyertakan pip. Anda dapat memeriksa apakah Anda telah menginstal pip, berjalan
pip --version
pada baris perintah. Dapatkan pip dengan menginstal versi terbaru Python.Sumber daya Azure AI Vision. Anda dapat menggunakan tingkat harga gratis (
F0
) untuk percobaan, lalu meningkatkannya ke tingkat berbayar untuk produksi.Kunci dan titik akhir dari sumber daya yang Anda buat untuk menyambungkan aplikasi Anda ke layanan Azure AI Vision.
- Setelah sumber daya Azure Vision Anda disebarkan, pilih Buka sumber daya.
- Di menu navigasi kiri, pilih Kunci dan Titik Akhir.
- Salin salah satu kunci dan Titik Akhir untuk digunakan nanti di mulai cepat.
Membuat variabel lingkungan
Dalam contoh ini, tulis kredensial Anda ke variabel lingkungan di komputer lokal yang menjalankan aplikasi.
Buka portal Microsoft Azure. Jika sumber daya yang Anda buat di bagian Prasyarat berhasil disebarkan, pilih Buka sumber daya di bawah Langkah Berikutnya. Anda dapat menemukan kunci dan titik akhir Anda di bawah Manajemen Sumber Daya di halaman Kunci dan Titik Akhir. Kunci sumber daya Anda tidak sama dengan ID langganan Azure Anda.
Tip
Jangan sertakan kunci langsung dalam kode Anda, dan jangan pernah mempostingnya secara publik. Lihat artikel keamanan layanan Azure AI untuk opsi autentikasi lainnya seperti Azure Key Vault.
Untuk mengatur variabel lingkungan untuk kunci dan titik akhir Anda, buka jendela konsol dan ikuti instruksi untuk sistem operasi dan lingkungan pengembangan Anda.
- Untuk mengatur
VISION_KEY
variabel lingkungan, gantiyour-key
dengan salah satu kunci untuk sumber daya Anda. - Untuk mengatur
VISION_ENDPOINT
variabel lingkungan, gantiyour-endpoint
dengan titik akhir untuk sumber daya Anda.
setx VISION_KEY your-key
setx VISION_ENDPOINT your-endpoint
Setelah menambahkan variabel lingkungan, Anda mungkin perlu memulai ulang program yang sedang berjalan yang akan membaca variabel lingkungan, termasuk jendela konsol.
Baca teks tulisan tangan dan yang dicetak
Menginstal pustaka klien.
Di jendela konsol, jalankan perintah berikut:
pip install --upgrade azure-cognitiveservices-vision-computervision
Pasang pustaka Bantal.
pip install pillow
Buat file aplikasi Python baru, quickstart-file.py. Lalu buka file di editor atau IDE pilihan Anda.
Ganti konten quickstart-file.py dengan kode berikut.
from azure.cognitiveservices.vision.computervision import ComputerVisionClient from azure.cognitiveservices.vision.computervision.models import OperationStatusCodes from azure.cognitiveservices.vision.computervision.models import VisualFeatureTypes from msrest.authentication import CognitiveServicesCredentials from array import array import os from PIL import Image import sys import time ''' Authenticate Authenticates your credentials and creates a client. ''' subscription_key = os.environ["VISION_KEY"] endpoint = os.environ["VISION_ENDPOINT"] computervision_client = ComputerVisionClient(endpoint, CognitiveServicesCredentials(subscription_key)) ''' END - Authenticate ''' ''' OCR: Read File using the Read API, extract text - remote This example will extract text in an image, then print results, line by line. This API call can also extract handwriting style text (not shown). ''' print("===== Read File - remote =====") # Get an image with text read_image_url = "https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png" # Call API with URL and raw response (allows you to get the operation location) read_response = computervision_client.read(read_image_url, raw=True) # Get the operation location (URL with an ID at the end) from the response read_operation_location = read_response.headers["Operation-Location"] # Grab the ID from the URL operation_id = read_operation_location.split("/")[-1] # Call the "GET" API and wait for it to retrieve the results while True: read_result = computervision_client.get_read_result(operation_id) if read_result.status not in ['notStarted', 'running']: break time.sleep(1) # Print the detected text, line by line if read_result.status == OperationStatusCodes.succeeded: for text_result in read_result.analyze_result.read_results: for line in text_result.lines: print(line.text) print(line.bounding_box) print() ''' END - Read File - remote ''' print("End of Computer Vision quickstart.")
Sebagai langkah opsional, lihat Menentukan cara memproses data. Misalnya, untuk secara eksplisit menentukan model GA terbaru, edit pernyataan
read
seperti yang telah ditunjukkan. Melompati parameter atau menggunakan"latest"
secara otomatis menggunakan model GA terbaru.# Call API with URL and raw response (allows you to get the operation location) read_response = computervision_client.read(read_image_url, raw=True, model_version="2022-04-30")
Jalankan aplikasi dengan perintah
python
pada file mulai cepat Anda.python quickstart-file.py
Hasil
===== Read File - remote =====
The quick brown fox jumps
[38.0, 650.0, 2572.0, 699.0, 2570.0, 854.0, 37.0, 815.0]
Over
[184.0, 1053.0, 508.0, 1044.0, 510.0, 1123.0, 184.0, 1128.0]
the lazy dog!
[639.0, 1011.0, 1976.0, 1026.0, 1974.0, 1158.0, 637.0, 1141.0]
End of Azure AI Vision quickstart.
Membersihkan sumber daya
Jika Anda ingin membersihkan dan menghapus langganan layanan Azure AI, Anda dapat menghapus sumber daya atau grup sumber daya. Menghapus grup sumber daya juga menghapus sumber daya apa pun yang terkait dengannya.
Langkah berikutnya
Dalam mulai cepat ini, Anda belajar cara memasang pustaka klien OCR dan menggunakan Read API. Selanjutnya, pelajari lebih lanjut fitur Read API.
- Gambaran umum OCR
- Kode sumber untuk sampel ini dapat ditemukan di GitHub.
Gunakan pustaka klien pengenalan karakter optik (OCR) untuk membaca teks cetak dan tulisan tangan dengan API Baca. Layanan OCR dapat membaca teks yang terlihat dalam gambar dan mengonversinya menjadi aliran karakter. Untuk informasi selengkapnya tentang pengenalan teks, lihat gambaran umum OCR.
Tip
Anda juga dapat membaca teks dari gambar lokal. Lihat metode ComputerVisionClient, seperti readInStream. Atau, lihat sampel kode pada GitHub untuk skenario yang melibatkan gambar lokal.
Dokumentasi referensi | Kode sumber pustaka | Paket (npm) | Sampel
Prasyarat
Langganan Azure - Buat langganan gratis.
Versi terbaru Node.js.
Sumber daya Azure AI Vision. Anda dapat menggunakan tingkat harga gratis (
F0
) untuk percobaan, lalu meningkatkannya ke tingkat berbayar untuk produksi.Kunci dan titik akhir dari sumber daya yang Anda buat untuk menyambungkan aplikasi Anda ke layanan Azure AI Vision.
- Setelah sumber daya Azure Vision Anda disebarkan, pilih Buka sumber daya.
- Di menu navigasi kiri, pilih Kunci dan Titik Akhir.
- Salin salah satu kunci dan Titik Akhir untuk digunakan nanti di mulai cepat.
Membuat variabel lingkungan
Dalam contoh ini, tulis kredensial Anda ke variabel lingkungan di komputer lokal yang menjalankan aplikasi.
Buka portal Microsoft Azure. Jika sumber daya yang Anda buat di bagian Prasyarat berhasil disebarkan, pilih Buka sumber daya di bawah Langkah Berikutnya. Anda dapat menemukan kunci dan titik akhir Anda di bawah Manajemen Sumber Daya di halaman Kunci dan Titik Akhir. Kunci sumber daya Anda tidak sama dengan ID langganan Azure Anda.
Tip
Jangan sertakan kunci langsung dalam kode Anda, dan jangan pernah mempostingnya secara publik. Lihat artikel keamanan layanan Azure AI untuk opsi autentikasi lainnya seperti Azure Key Vault.
Untuk mengatur variabel lingkungan untuk kunci dan titik akhir Anda, buka jendela konsol dan ikuti instruksi untuk sistem operasi dan lingkungan pengembangan Anda.
- Untuk mengatur
VISION_KEY
variabel lingkungan, gantiyour-key
dengan salah satu kunci untuk sumber daya Anda. - Untuk mengatur
VISION_ENDPOINT
variabel lingkungan, gantiyour-endpoint
dengan titik akhir untuk sumber daya Anda.
setx VISION_KEY your-key
setx VISION_ENDPOINT your-endpoint
Setelah menambahkan variabel lingkungan, Anda mungkin perlu memulai ulang program yang sedang berjalan yang akan membaca variabel lingkungan, termasuk jendela konsol.
Baca teks tulisan tangan dan yang dicetak
Buat aplikasi Node.js baru.
Di jendela konsol, buat direktori baru untuk aplikasi Anda, dan navigasikan ke dalamnya.
mkdir myapp cd myapp
Jalankan perintah
npm init
untuk membuat aplikasi node dengan filepackage.json
. Pilih Enter untuk perintah apa pun.npm init
Untuk menginstal pustaka klien, instal
ms-rest-azure
paket npm dan@azure/cognitiveservices-computervision
:npm install ms-rest-azure npm install @azure/cognitiveservices-computervision
Instal modul asinkron:
npm install async
File aplikasi
package.json
Anda diperbarui dengan dependensi.Buat file baru, index.js, dan buka di editor teks.
Tempelkan kode berikut ke dalam file index.js.
'use strict'; const async = require('async'); const fs = require('fs'); const https = require('https'); const path = require("path"); const createReadStream = require('fs').createReadStream const sleep = require('util').promisify(setTimeout); const ComputerVisionClient = require('@azure/cognitiveservices-computervision').ComputerVisionClient; const ApiKeyCredentials = require('@azure/ms-rest-js').ApiKeyCredentials; /** * AUTHENTICATE * This single client is used for all examples. */ const key = process.env.VISION_KEY; const endpoint = process.env.VISION_ENDPOINT; const computerVisionClient = new ComputerVisionClient( new ApiKeyCredentials({ inHeader: { 'Ocp-Apim-Subscription-Key': key } }), endpoint); /** * END - Authenticate */ function computerVision() { async.series([ async function () { /** * OCR: READ PRINTED & HANDWRITTEN TEXT WITH THE READ API * Extracts text from images using OCR (optical character recognition). */ console.log('-------------------------------------------------'); console.log('READ PRINTED, HANDWRITTEN TEXT AND PDF'); console.log(); // URL images containing printed and/or handwritten text. // The URL can point to image files (.jpg/.png/.bmp) or multi-page files (.pdf, .tiff). const printedTextSampleURL = 'https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg'; // Recognize text in printed image from a URL console.log('Read printed text from URL...', printedTextSampleURL.split('/').pop()); const printedResult = await readTextFromURL(computerVisionClient, printedTextSampleURL); printRecText(printedResult); // Perform read and await the result from URL async function readTextFromURL(client, url) { // To recognize text in a local image, replace client.read() with readTextInStream() as shown: let result = await client.read(url); // Operation ID is last path segment of operationLocation (a URL) let operation = result.operationLocation.split('/').slice(-1)[0]; // Wait for read recognition to complete // result.status is initially undefined, since it's the result of read while (result.status !== "succeeded") { await sleep(1000); result = await client.getReadResult(operation); } return result.analyzeResult.readResults; // Return the first page of result. Replace [0] with the desired page if this is a multi-page file such as .pdf or .tiff. } // Prints all text from Read result function printRecText(readResults) { console.log('Recognized text:'); for (const page in readResults) { if (readResults.length > 1) { console.log(`==== Page: ${page}`); } const result = readResults[page]; if (result.lines.length) { for (const line of result.lines) { console.log(line.words.map(w => w.text).join(' ')); } } else { console.log('No recognized text.'); } } } /** * * Download the specified file in the URL to the current local folder * */ function downloadFilesToLocal(url, localFileName) { return new Promise((resolve, reject) => { console.log('--- Downloading file to local directory from: ' + url); const request = https.request(url, (res) => { if (res.statusCode !== 200) { console.log(`Download sample file failed. Status code: ${res.statusCode}, Message: ${res.statusMessage}`); reject(); } var data = []; res.on('data', (chunk) => { data.push(chunk); }); res.on('end', () => { console.log(' ... Downloaded successfully'); fs.writeFileSync(localFileName, Buffer.concat(data)); resolve(); }); }); request.on('error', function (e) { console.log(e.message); reject(); }); request.end(); }); } /** * END - Recognize Printed & Handwritten Text */ console.log(); console.log('-------------------------------------------------'); console.log('End of quickstart.'); }, function () { return new Promise((resolve) => { resolve(); }) } ], (err) => { throw (err); }); } computerVision();
Sebagai langkah opsional, lihat Menentukan cara memproses data. Misalnya, untuk secara eksplisit menentukan model GA terbaru, edit pernyataan
read
seperti yang telah ditunjukkan. Melompati parameter atau menggunakan"latest"
secara otomatis menggunakan model GA terbaru.let result = await client.read(url,{modelVersion:"2022-04-30"});
Jalankan aplikasi dengan perintah
node
pada file mulai cepat Anda.node index.js
Hasil
-------------------------------------------------
READ PRINTED, HANDWRITTEN TEXT AND PDF
Read printed text from URL... printed_text.jpg
Recognized text:
Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.
-------------------------------------------------
End of quickstart.
Membersihkan sumber daya
Jika Anda ingin membersihkan dan menghapus langganan layanan Azure AI, Anda dapat menghapus sumber daya atau grup sumber daya. Menghapus grup sumber daya juga menghapus sumber daya apa pun yang terkait dengannya.
Langkah berikutnya
Dalam mulai cepat ini, Anda belajar cara memasang pustaka klien OCR dan menggunakan Read API. Selanjutnya, pelajari lebih lanjut fitur Read API.
- Gambaran umum OCR
- Kode sumber untuk sampel ini dapat ditemukan di GitHub.
Gunakan REST API pengenalan karakter optik (OCR) untuk membaca teks cetak dan tulisan tangan.
Catatan
Mulai cepat ini menggunakan perintah cURL untuk memanggil REST API. Anda juga dapat memanggil REST API menggunakan bahasa pemrograman. Lihat sampel GitHub misalnya di C#, Python, Java, dan JavaScript.
Prasyarat
Langganan Azure - Buat langganan gratis.
cURL diinstal.
Sumber daya Azure AI Vision. Anda dapat menggunakan tingkat harga gratis (
F0
) untuk percobaan, lalu meningkatkannya ke tingkat berbayar untuk produksi.Kunci dan titik akhir dari sumber daya yang Anda buat untuk menyambungkan aplikasi Anda ke layanan Azure AI Vision.
- Setelah sumber daya Azure Vision Anda disebarkan, pilih Buka sumber daya.
- Di menu navigasi kiri, pilih Kunci dan Titik Akhir.
- Salin salah satu kunci dan Titik Akhir untuk digunakan nanti di mulai cepat.
Baca teks tulisan tangan dan yang dicetak
Layanan pengenalan karakter optik (OCR) dapat mengekstrak teks yang terlihat dalam gambar atau dokumen dan mengonversinya menjadi aliran karakter. Untuk informasi selengkapnya tentang ekstraksi teks, lihat gambaran umum OCR.
Hubungi Read API
Untuk membuat dan menjalankan sampel, lakukan langkah-langkah berikut:
Salin perintah berikut ke editor teks.
JIka diperlukan, buat perubahan berikut dalam perintah:
- Ganti nilai dengan
<key>
kunci Anda. - Ganti bagian pertama URL permintaan (
https://westcentralus.api.cognitive.microsoft.com/
) dengan teks di URL titik akhir Anda sendiri.Catatan
Sumber daya baru yang dibuat setelah 1 Juli 2019, akan menggunakan nama subdomain kustom. Untuk informasi selengkapnya dan daftar lengkap titik akhir regional, lihat Nama subdomain kustom untuk layanan Azure AI.
- Secara opsional, ubah URL gambar dalam isi permintaan (
https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png
) ke URL gambar yang berbeda untuk dianalisis.
- Ganti nilai dengan
Buka jendela wantian perintah.
Tempelkan perintah dari editor teks ke jendela perintah, lalu jalankan perintah.
curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"
Respons menyertakan Operation-Location
header, yang nilainya adalah URL unik. Anda menggunakan URL ini untuk mengkueri hasil operasi Baca. URL kedaluwarsa dalam 48 jam.
Secara opsional, tentukan versi model
Sebagai langkah opsional, lihat Menentukan cara memproses data. Misalnya, untuk secara eksplisit menentukan model GA terbaru, gunakan model-version=2022-04-30
sebagai parameter. Melompati parameter atau menggunakan model-version=latest
secara otomatis menggunakan model GA terbaru.
curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze?model-version=2022-04-30" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"
Dapatkan hasil Baca
Salin perintah berikut ke editor teks.
Ganti URL dengan nilai yang
Operation-Location
Anda salin di prosedur sebelumnya.Ganti nilai dengan
<key>
kunci Anda.Buka jendela konsol.
Tempelkan perintah dari editor teks ke jendela konsol, lalu jalankan perintah .
curl -v -X GET "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyzeResults/{operationId}" -H "Ocp-Apim-Subscription-Key: {key}" --data-ascii "{body}"
Periksa responsnya
Respons sukses dikembalikan dalam JSON. Aplikasi sampel mengurai dan menampilkan respons yang berhasil di jendela konsol, mirip dengan contoh berikut:
{
"status": "succeeded",
"createdDateTime": "2021-04-08T21:56:17.6819115+00:00",
"lastUpdatedDateTime": "2021-04-08T21:56:18.4161316+00:00",
"analyzeResult": {
"version": "3.2",
"readResults": [
{
"page": 1,
"angle": 0,
"width": 338,
"height": 479,
"unit": "pixel",
"lines": [
{
"boundingBox": [
25,
14,
318,
14,
318,
59,
25,
59
],
"text": "NOTHING",
"appearance": {
"style": {
"name": "other",
"confidence": 0.971
}
},
"words": [
{
"boundingBox": [
27,
15,
294,
15,
294,
60,
27,
60
],
"text": "NOTHING",
"confidence": 0.994
}
]
}
]
}
]
}
}
Membersihkan sumber daya
Jika Anda ingin membersihkan dan menghapus langganan layanan Azure AI, Anda dapat menghapus sumber daya atau grup sumber daya. Menghapus grup sumber daya juga menghapus sumber daya apa pun yang terkait dengannya.
Langkah berikutnya
Dalam mulai cepat ini, Anda belajar cara memanggil Read REST API. Selanjutnya, pelajari lebih lanjut fitur Read API.
Prasyarat
Langganan Azure - Buat langganan gratis.
Sumber daya Azure AI Vision. Anda dapat menggunakan tingkat harga gratis (
F0
) untuk percobaan, lalu meningkatkannya ke tingkat berbayar untuk produksi.Koneksi ke Studio Visi.
- Anda mungkin perlu masuk.
- Setelah Masuk, pilih Tampilkan semua sumber daya. Jika perlu, pilih Refresh. Verifikasi bahwa sumber daya Anda tersedia.
Untuk informasi selengkapnya, lihat Mulai menggunakan Vision Studio.
Baca teks tulisan tangan dan yang dicetak
Di bawah Pengenalan karakter optik, pilih Ekstrak teks dari gambar.
Di bawah Cobalah, akui bahwa demo ini menimbulkan penggunaan ke akun Azure Anda. Untuk informasi selengkapnya, lihat Harga Azure AI Vision.
Pilih gambar dari set yang tersedia atau unggah gambar Anda sendiri.
Jika perlu, pilih Pilih sumber daya untuk memilih sumber daya Anda.
Setelah Anda memilih gambar, teks yang diekstrak muncul di jendela output. Anda juga dapat memilih tab JSON untuk melihat output JSON yang dikembalikan oleh panggilan API.
Di bawah pengalaman uji coba adalah langkah berikutnya untuk mulai menggunakan kemampuan ini di aplikasi Anda sendiri.
Langkah berikutnya
Dalam mulai cepat ini, Anda menggunakan Vision Studio untuk mengakses READ API. Selanjutnya, pelajari lebih lanjut fitur Read API.