Bagikan melalui


Persyaratan dan batasan untuk model pemrosesan dokumen

Bahasa yang didukung

Model untuk dokumen template tetap

Bahasa berikut didukung saat melatih model pemrosesan dokumen dan memilih Dokumen templat tetap sebagai jenis dokumen:

Abaza, Abkhazian, Achinese, Acoli, Adangme, Adyghe, Afar, Afrikaans, Akan, Albania, Algonquin, Angika (Devanagari), Arab, Asturian, Asu (Tanzania), Avaric, Awadhi-Hindi (Devanagari), Aymara, Azerbaijan (Latin), Bafia, Bagheli, Bambara, Bashkir, Basque, Belarusia (Sirilik), Belarusia (Latin), Bemba (Zambia), Bemba (Zambia), Bhojpuri-Hindi (Devanagari), Bikol, Bini, Bislama, Bodo (Devanagari), Bosnia (Latin), Brajbha, Breton, Bulgaria, Bundeli, Buryat (Sirilik), Catalan, Cebuano, Chamling, Chamorro, Chechnya, Chhattisgarhi (Devanagari), Chiga, Tiongkok Sederhana, Tiongkok Tradisional, Choctaw, Chukot, Chuvash, Cornish, Korsika, Cree, Creek, Tatar Krimea (Latin), Kroasia, Gagak, Ceko, Denmark, Dargwa, Dari, Dhimal (Devanagari), Dogri (Devanagari), Duala, Dungan, Belanda, Efik, Inggris, Erzya (Sirilik), Estonia, Faroe, Fiji, Filipina, Finlandia, Fon, Prancis, Friulian, Ga, Gagauz (Latin), Galicia, Ganda, Gayo, Jerman, Gilbert, Gondi (Devanagari), Yunani, Greenland, Guarani, Gurung (Devanagari), Gusii, Kreol Haiti, Halbi (Devanagari), Hani, Haryanvi, Hawaii, Ibrani, Herero, Hiligaynon, Hindi, Hmong Daw (Latin), Ho (Devanagiri), Hongaria, Iban, Islandia, Igbo, Iloko, Inari Sami, Indonesia, Ingush, Interlingua, Inuktitut (Latin), Irlandia, Italia, Jepang, Jaunsari (Devanagari), Jawa, Jola-Fonyi, Kabardian, Kabuverdianu, Kachin (Latin), Kalenjin, Kalmyk, Kangri (Devanagari), Kanuri, Karachay-Balkar, Kara-Kalpak (Sirilik), Kara-Kalpak (Latin), Kashubian, Kazakh (Sirilik), Kazakh (Latin), Khakas, Khaling, Khasi, K'iche', Kikuyu, Kildin Sami, Kinyarwanda, Komi, Kongo, Korea, Korku, Koryak, Kosraean, Kpelle, Kuanyama, Kumyk (Sirilik), Kurdi (Arab), Kurdi (Latin), Kurukh (Devanagari), Kirgistan (Sirilik), Lak, Lakota, Latin, Latvia, Lezghian, Lingala, Lituania, Sorbia Bawah, Lozi, Lule Sami, Luo (Kenya dan Tanzania), Luksemburg, Luyia luy, Makédonia, Machame, Madura, Mahasu Pahari (Devanagari), Makhuwa-Meetto, Makonde, Malagasi, Melayu (Latin), Malta, Malto (Devanagari), Mandinka, Manx, Maori, Mapudungun, Marathi, Mari (Rusia), Masai, Mende (Sierra Leone), Meru, Meta', Minangkabau, Mohawk, Mongolia (Sirilik), Mongondow, Montenegro (Sirilik), Montenegro (Latin), Morisyen, Mundang, Nahuatl, Navajo, Ndonga, Neapolitan, Nepal, Ngomba, Niuean, Nogay, Ndebele Utara, Sami Utara (Latin), Norwegia, Nyanja, Nyankole, Nzima, Occitan, Ojibwa, Oromo, Ossetic, Pampanga, Pangasinan, Papiamento, Pashto, Pedi, Persia, Polandia, Portugis, Punjabi (Arab), Quechua, Ripuarian, Rumania, Romansh, Rundi, Rusia, Rwa, Sadri (Devanagari), Sakha, Samburu, Samoa (Latin), Sango, Sangu (Gabon), Sansekerta (Devanagari), Santali (Devanagiri), Skotlandia, Gaelik Skotlandia, Sena, Serbia (Sirilik), Serbia (Latin), Shambala, Sherpa (Devanagari), Shona, Siksika, Sirmauri (Dewanagari), Skolt Sami, Slovakia, Slovenia, Soga, Somalia (Arab), Somalia (Latin), Songhai, Ndebele Selatan, Altai Selatan, Sami Selatan, Sotho Selatan, Spanyol, Sunda, Swahili (Latin), Swati, Swedia, Tabassaran, Tachelhit, Tahitian, Taita, Tajik (Sirilik), Tamil, Tatar (Sirilik), Tatar (Latin), Teso, Tetum, Thailand, Thangmi, Tok Pisin, Tonga, Tsonga, Tswana, Turki, Turkmenistan (Latin), Tuvan, Udmurt, Uighur (Sirilik), Ukraina, Sorbia Atas, Urdu, Uyghur (Arab), Uzbek (Arab), Uzbek (Sirilik), Uzbek (Latin), Vietnam, Volapük, Vunjo, Walser, Welsh, Frisia Barat, Wolof, Xhosa, Yucatec Maya, Zapotec, Zarma, Zhuang, Zulu

Model untuk dokumen umum

Bahasa berikut didukung saat melatih model pemrosesan dokumen dan memilih Dokumen umum sebagai jenis dokumen.

Bahasa Afrikaans, Albania, Arab, Bulgaria, Mandarin (Han (varian Sederhana)), Mandarin (Han (varian Tradisional)), Kroasia, Ceko, Denmark, Belanda, Estonia, Finlandia, Prancis, Jerman, Ibrani, Hindi, Hungaria, Indonesia, Italia, Jepang, Korea, Latvia, Lithuania, Makédonia, Marathi, Yunani Modern (1453-), Nepali (makrobahasa), Norwegia, Punjabi, Persia, Polandia, Portugis, Rumania, Rusia, Slowakia, Slovenia, Somalia (Arab), Somalia (Latin), Spanyol, Swahili (makrobahasa), Swedia, Tamil, Thai, Turki, Ukraina, Urdu, Vietnam

Persyaratan

Pemrosesan dokumen bekerja pada dokumen masukan yang memenuhi persyaratan berikut:

  • Format JPG, PNG, atau PDF (teks atau pindaian). PDF yang disematkan teks lebih baik, karena tidak akan ada kesalahan dalam ekstraksi dan lokasi karakter.
  • File TIFF tidak dapat digunakan untuk pelatihan. Anda perlu menggunakan dokumen dalam format PDF, JPG, atau PNG untuk melatih model. Setelah model dilatih, model dapat mengekstrak data dari file TIFF saat model digunakan dalam aliran cloud Power Automate.
  • Jika PDF Anda terkunci kata sandi, Anda harus menghapus kunci tersebut sebelum mengirimkannya.
  • Ukuran dokumen maksimum yang akan diproses tidak boleh melebihi 20 MB.
  • Untuk gambar, dimensi harus antara 50 × 50 dan 10.000 × 10.000 piksel.
  • Jika dipindai dari dokumen kertas, hasil pindaiannya harus berupa gambar berkualitas tinggi.
  • Anda dapat membuat hingga 200 koleksi per model.
  • Dalam aliran awan, batas bidang yang dapat ditandai untuk pemrosesan dokumen adalah 300.

Catatan

  • Mengekstrak tanda tangan dari dokumen saat ini hanya didukung untuk dokumen templat tetap.
  • Bidang yang terbagi melintasi batas halaman saat ini tidak didukung.
  • Baris yang berpindah dari satu halaman ke halaman lain saat ini tidak didukung.

Tips pengoptimalan

Pelajari cara meningkatkan kinerja model pemrosesan dokumen.

Langkah selanjutnya

Membuat model pemrosesan formulir