Model prebuilt pengenalan teks
Model prebuilt pengenalan teks mengekstrak kata-kata dari dokumen dan gambar ke dalam aliran karakter yang dapat dibaca mesin. Ini menggunakan pengenalan karakter optik (OCR) canggih untuk mendeteksi teks cetak dan tulisan tangan dalam gambar.
Model ini memproses gambar dan file dokumen untuk mengekstrak baris teks cetak atau tulisan tangan.
Gunakan di Power Apps
Model prebuilt pengenalan teks tersedia dengan Power Apps menggunakan komponen pengenal teks. Informasi selengkapnya: Menggunakan komponen pengenal teks di Power Apps
Gunakan di Power Automate
Untuk informasi tentang cara menggunakan model ini di, lihat Power AutomateMenggunakan model bawaan pengenalan teks di. Power Automate
Bahasa, format, dan ukuran yang didukung
File yang dapat Anda pindai dengan model pengenalan teks harus memiliki karakteristik berikut:
- Bahasa untuk teks cetak: Afrikaans, Albania, Angika (Devanagiri), Arab, Asturia, Awadhi-Hindi (Devanagiri), Azerbaijan (Latin), Bagheli, Basque, Belarusia (Cyrillic), Belarusia (Latin), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bosnia (Latin), Brajbha, Breton, Bulgaria, Bundeli, Buryat (Cyrillic), Catalan, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Cina (Sederhana), Cina (Tradisional), Cornish, Korsika, Tatar Krimea (Latin), Kroasia, Ceko, Denmark, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Belanda, Inggris, Erzya (Sirilik), Estonia, Faroe, Fiji, Filipina, Finlandia, Prancis, Friulian, Gagauz (Latin), Galisia, Jerman, Gilbertese, Gondi (Devanagiri), Greenland, Gurung (Devanagiri), Kreol Haiti, Halbi (Devanagiri), Hani, Haryanvi, Hawaii, Hindi, Hmong Daw (Latin), Ho (Devanagiri), Hongaria, Islandia, Inari Sami, Indonesia, Interlingua, Inuktitut (Latin), Irlandia, Italia, Jepang, Jaunsari (Devanagiri), Jawa, Kabuverdianu, Kachin (Latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (Sirilik), Kara-Kalpak (Latin), Kashubia, Kazakh (Sirilik), Kazakh (Latin), Khaling, Khasi, K'iche', Korea, Korku, Koryak, Kosraean, Kumyk (Sirilik), Kurdi (Arab), Kurdi (Latin), Kurukh (Devanagiri), Kirgistan (Sirilik), Lakota, Latin, Lituania, Sorbia Hilir, Lule Sami, Luksemburg, Mahasu Pahari (Devanagiri), Melayu (Latin), Malta, Malto (Devanagiri), Manx, Maori, Marathi, Mongolia (Sirilik), Montenegro (Sirilik), Montenegro (Latin), Napoli, Nepal, Niue, Nogay, Sami Utara (Latin), Norwegia, Occitan, Ossetic, Pashto, Persia, Polandia, Portugis, Punjabi (Arab), Ripuarian, Rumania, Romansh, Rusia, Sadri (Devanagiri), Samoa (Latin), Sansekerta (Devanagari), Santali (Devanagiri), Skotlandia, Gaelik Skotlandia, Serbia (Latin), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, Slovakia, Slovenia, Somalia (Arab), Sami Selatan, Spanyol, Swahili (Latin), Swedia, Tajik (Sirilik), Tatar (Latin), Tetum, Thangmi, Tonga, Turki, Turkmenistan (Latin), Tuvan, Sorbia Hulu, Urdu, Uyghur (Arab), Uzbek (Arab), Uzbek (Sirilik), Uzbek (Latin), Volapük, Walser, Wales, Frisia Barat, Yucatec Maya, Zhuang, Zulu
- Bahasa untuk teks tulisan tangan: Inggris, Cina (Sederhana), Prancis, Jerman, Italia, Jepang, Korea, Portugis, Spanyol
- Format:
- JPG
- PNG
- BMP
- Ukuran: maksimal 20 MB
- Untuk dokumen PDF, hanya 2.000 halaman pertama yang diproses.
Keluaran model
Jika dokumen terdeteksi, model pengenalan teks output informasi berikut:
- Hasil: Daftar baris yang diekstrak dari teks input.
- Teks: String yang berisi baris teks terdeteksi.
- BoundingBox: Empat nilai yang mewakili kotak pembatas, dijelaskan dengan menggunakan posisi atas dan kiri bersama dengan lebar dan tingginya.
Batas
Perbuatan | Batas | Periode perpanjangan |
---|---|---|
Panggilan pengenalan teks (per lingkungan) | 480 | 60 detik |