Bagikan melalui


Model pengenalan teks yang sudah dibuat sebelumnya

Model pra-bangun pengenalan teks mengekstrak kata-kata dari dokumen dan gambar menjadi aliran karakter yang dapat dibaca mesin. Ia menggunakan pengenalan karakter optik (OCR) canggih untuk mendeteksi teks tercetak dan tulisan tangan dalam gambar.

Model ini memproses gambar dan berkas dokumen untuk mengekstrak baris teks cetak atau tulisan tangan.

Gunakan di Power Apps

Model pra-bangun pengenalan teks tersedia di Power Apps dengan menggunakan komponen pengenal teks. Informasi lebih lanjut: Gunakan komponen pengenal teks di Power Apps

Penggunaan di Power Automate

Untuk informasi tentang cara menggunakan model ini di Power Automate, lihat Menggunakan model pengenalan teks bawaan di Power Automate.

Bahasa, format, dan ukuran yang didukung

File yang dapat Anda pindai dengan model pengenalan teks harus memiliki karakteristik berikut:

  • Bahasa untuk teks cetak: Afrikaans, Albania, Angika (Devanagiri), Arab, Asturian, Awadhi-Hindi (Devanagiri), Azerbaijan (Latin), Bagheli, Basque, Belarusia (Sirilik), Belarusia (Latin), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bosnia (Latin), Brajbha, Breton, Bulgaria, Bundeli, Buryat (Sirilik), Katalan, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Tionghoa (Sederhana), Tionghoa (Tradisional), Cornish, Korsika, Tatar Krimea (Latin), Kroasia, Ceko, Denmark, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Belanda, Inggris, Erzya (Sirilik), Estonia, Faroe, Fiji, Filipina, Finlandia, Prancis, Friulian, Gagauz (Latin), Galicia, Jerman, Gilbert, Gondi (Devanagiri), Greenland, Gurung (Devanagiri), Kreol Haiti, Halbi (Devanagiri), Hani, Haryanvi, Hawaii, Hindi, Hmong Daw (Latin), Ho (Devanagiri), Hongaria, Islandia, Inari Sami, Indonesia, Interlingua, Inuktitut (Latin), Irlandia, Italia, Jepang, Jaunsari (Devanagiri), Jawa, Kabuverdianu, Kachin (Latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (Sirilik), Kara-Kalpak (Latin), Kashubian, Kazakh (Sirilik), Kazakh (Latin), Khaling, Khasi, K'iche', Korea, Korku, Koryak, Kosraean, Kumyk (Sirilik), Kurdi (Arab), Kurdi (Latin), Kurukh (Dewanagiri), Kirgistan (Sirilik), Lakota, Latin, Lithuania, Sorbia Hilir, Lule Sami, Luksemburg, Mahasu Pahari (Devanagiri), Melayu (Latin), Malta, Malto (Devanagiri), Manx, Maori, Marathi, Mongolia (Sirilik), Montenegro (Sirilik), Montenegro (Latin), Napoli, Nepal, Niuean, Nogay, Sami Utara (Latin), Norwegia, Occitan, Ossetia, Pashtun, Persia, Polandia, Portugis, Punjabi (Arab), Ripuaria, Rumania, Romansh, Rusia, Sadri (Devanagiri), Samoa (Latin), Sansekerta (Devanagari), Santali (Devanagiri), Skotlandia, Gaelik Skotlandia, Serbia (Latin), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, Slowakia, Slovenia, Somali (Arab), Sami Selatan, Spanyol, Swahili (Latin), Swedia, Tajik (Sirilik), Tatar (Latin), Tetum, Thangmi, Tonga, Turki, Turkmen (Latin), Tuvan, Sorbia Hulu, Urdu, Uyghur (Arab), Uzbek (Arab), Uzbek (Sirilik), Uzbek (Latin), Volapük, Walser, Welsh, Frisia Barat, Maya Yucatec, Zhuang, Zulu
  • Bahasa untuk teks tulisan tangan: Inggris, Mandarin (Sederhana), Prancis, Jerman, Italia, Jepang, Korea, Portugis, Spanyol
  • Format:
    • JPG
    • PNG
    • BMP
    • PDF
  • Ukuran: Maksimum 20 MB
  • Untuk dokumen PDF, hanya 2.000 halaman pertama yang diproses.

Keluaran model

Jika suatu dokumen terdeteksi, model pengenalan teks akan mengeluarkan informasi berikut:

  • Hasil: Daftar baris yang diekstrak dari teks masukan.
  • Teks: String berisi baris teks yang terdeteksi.
  • BoundingBox: Empat nilai yang mewakili kotak pembatas, dijelaskan dengan menggunakan posisi atas dan kiri beserta lebar dan tingginya.

Batas

Tindakan Membatasi Periode pembaruan
Panggilan pengenalan teks (per lingkungan) 480 60 detik

Pelatihan: Mengenali teks dengan AI Builder (modul)