Model prebuilt pengenalan teks

Model prebuilt pengenalan teks mengekstrak kata-kata dari dokumen dan gambar ke dalam aliran karakter yang dapat dibaca mesin. Ini menggunakan pengenalan karakter optik (OCR) canggih untuk mendeteksi teks cetak dan tulisan tangan dalam gambar.

Model ini memproses gambar dan file dokumen untuk mengekstrak baris teks cetak atau tulisan tangan.

Gunakan di Power Apps

Model prebuilt pengenalan teks tersedia dengan Power Apps menggunakan komponen pengenal teks. Informasi selengkapnya: Menggunakan komponen pengenal teks di Power Apps

Gunakan di Power Automate

Untuk informasi tentang cara menggunakan model ini di, lihat Power AutomateMenggunakan model bawaan pengenalan teks di. Power Automate

Bahasa, format, dan ukuran yang didukung

File yang dapat Anda pindai dengan model pengenalan teks harus memiliki karakteristik berikut:

  • Bahasa untuk teks cetak: Afrikaans, Albania, Angika (Devanagiri), Arab, Asturia, Awadhi-Hindi (Devanagiri), Azerbaijan (Latin), Bagheli, Basque, Belarusia (Cyrillic), Belarusia (Latin), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bosnia (Latin), Brajbha, Breton, Bulgaria, Bundeli, Buryat (Cyrillic), Catalan, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Cina (Sederhana), Cina (Tradisional), Cornish, Korsika, Tatar Krimea (Latin), Kroasia, Ceko, Denmark, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Belanda, Inggris, Erzya (Sirilik), Estonia, Faroe, Fiji, Filipina, Finlandia, Prancis, Friulian, Gagauz (Latin), Galisia, Jerman, Gilbertese, Gondi (Devanagiri), Greenland, Gurung (Devanagiri), Kreol Haiti, Halbi (Devanagiri), Hani, Haryanvi, Hawaii, Hindi, Hmong Daw (Latin), Ho (Devanagiri), Hongaria, Islandia, Inari Sami, Indonesia, Interlingua, Inuktitut (Latin), Irlandia, Italia, Jepang, Jaunsari (Devanagiri), Jawa, Kabuverdianu, Kachin (Latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (Sirilik), Kara-Kalpak (Latin), Kashubia, Kazakh (Sirilik), Kazakh (Latin), Khaling, Khasi, K'iche', Korea, Korku, Koryak, Kosraean, Kumyk (Sirilik), Kurdi (Arab), Kurdi (Latin), Kurukh (Devanagiri), Kirgistan (Sirilik), Lakota, Latin, Lituania, Sorbia Hilir, Lule Sami, Luksemburg, Mahasu Pahari (Devanagiri), Melayu (Latin), Malta, Malto (Devanagiri), Manx, Maori, Marathi, Mongolia (Sirilik), Montenegro (Sirilik), Montenegro (Latin), Napoli, Nepal, Niue, Nogay, Sami Utara (Latin), Norwegia, Occitan, Ossetic, Pashto, Persia, Polandia, Portugis, Punjabi (Arab), Ripuarian, Rumania, Romansh, Rusia, Sadri (Devanagiri), Samoa (Latin), Sansekerta (Devanagari), Santali (Devanagiri), Skotlandia, Gaelik Skotlandia, Serbia (Latin), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, Slovakia, Slovenia, Somalia (Arab), Sami Selatan, Spanyol, Swahili (Latin), Swedia, Tajik (Sirilik), Tatar (Latin), Tetum, Thangmi, Tonga, Turki, Turkmenistan (Latin), Tuvan, Sorbia Hulu, Urdu, Uyghur (Arab), Uzbek (Arab), Uzbek (Sirilik), Uzbek (Latin), Volapük, Walser, Wales, Frisia Barat, Yucatec Maya, Zhuang, Zulu
  • Bahasa untuk teks tulisan tangan: Inggris, Cina (Sederhana), Prancis, Jerman, Italia, Jepang, Korea, Portugis, Spanyol
  • Format:
    • JPG
    • PNG
    • BMP
    • PDF
  • Ukuran: maksimal 20 MB
  • Untuk dokumen PDF, hanya 2.000 halaman pertama yang diproses.

Keluaran model

Jika dokumen terdeteksi, model pengenalan teks output informasi berikut:

  • Hasil: Daftar baris yang diekstrak dari teks input.
  • Teks: String yang berisi baris teks terdeteksi.
  • BoundingBox: Empat nilai yang mewakili kotak pembatas, dijelaskan dengan menggunakan posisi atas dan kiri bersama dengan lebar dan tingginya.

Batas

Perbuatan Batas Periode perpanjangan
Panggilan pengenalan teks (per lingkungan) 480 60 detik

Baca juga

Pelatihan: Kenali teks dengan AI Builder (modul)