Menjelajahi opsi Azure AI Vision untuk membaca teks

Selesai

Azure AI menyediakan dua fitur berbeda yang membaca teks dari dokumen dan gambar, satu di Azure AI Vision Service, yang lainnya di Azure AI Document Intelligence. Ada tumpang tindih dalam apa yang disediakan setiap layanan, namun masing-masing dioptimalkan untuk hasil tergantung pada apa inputnya.

  • Pengenalan karakter Optik Analisis Gambar (OCR):
    • Gunakan fitur ini untuk dokumen umum yang tidak terstruktur dengan jumlah teks yang lebih kecil, atau gambar yang berisi teks.
    • Hasil dikembalikan segera (sinkron) dari satu panggilan API.
    • Memiliki fungsionalitas untuk menganalisis gambar yang telah mengekstrak teks, termasuk deteksi objek, menjelaskan atau mengategorikan gambar, menghasilkan gambar mini yang dipotong cerdas dan banyak lagi.
    • Contohnya meliputi: tanda jalan, catatan tulisan tangan, dan tanda toko.
  • Kecerdasan Dokumen:
    • Gunakan layanan ini untuk membaca teks dalam volume kecil hingga besar dari gambar dan dokumen PDF.
    • Layanan ini menggunakan konteks dan struktur dokumen untuk meningkatkan akurasi.
    • Panggilan fungsi awal mengembalikan ID operasi asinkron, yang harus digunakan dalam panggilan berikutnya untuk mengambil hasilnya.
    • Contohnya meliputi: tanda terima, artikel, dan faktur.

Anda dapat mengakses kedua teknologi melalui REST API atau pustaka klien. Dalam modul ini, kita akan fokus pada fitur OCR dalam Analisis Gambar. Jika Anda ingin mempelajari selengkapnya tentang Kecerdasan Dokumen, membaca modul ini akan memberikan pengenalan yang baik.