Bagikan melalui


Persyaratan dan batasan untuk model pemrosesan dokumen

Bahasa yang didukung

Model untuk dokumen templat tetap

Bahasa berikut didukung saat melatih model pemrosesan dokumen dan memilih dokumen templat tetap sebagai tipe dokumen:

Abaza, Abkhazia, Aceh, Acoli, Adangme, Adyghe, Afar, Afrikaans, Akan, Albania, Algonquin, Angika (Devanagari), Arab, Asturian, (Tanzania), Avaric, Awadhi-Hindi (Devanagari), Aymara, Azerbaijan (Latin), Bafia, Bagheli, Bambara, Bashkir, Basque, Belarusia (Cyrillic), Belarusia (Latin), Bemba (Zambia), Bemba (Zambia), Bhojpuri-Hindi (Devanagari), Bikol, Bini, Bislama, Bodo (Devanagari), Bosnia (Latin), Brajbha, Breton, Bulgaria, Bundeli, Buryat (Cyrillic), Catalan, Cebuano, Chamling, Chamorro, Chechnya, Chhattisgarhi (Devanagari), Chiga, Cina Sederhana, Cina Tradisional, Choctaw, Chukot, Chuvash, Cornish, Korsika, Cree, Creek, Tatar Krimea (Latin), Kroasia, Gagak, Ceko, Denmark, Dargwa, Dari, Dhimal (Devanagari), Dogri (Devanagari), Duala, Dungan, Belanda, Efik, Inggris, Erzya (Sirilik), Estonia, Faroe, Fiji, Filipina, Finlandia, Fon, Prancis, Friulian, Ga, Gagauz (Latin), Galisia, Ganda, Gayo, Jerman, Gilbertese, Gondi (Devanagari), Yunani, Greenland, Guarani, Gurung (Devanagari), Gusii, Kreol Haiti, Halbi (Devanagari), Hani, Haryanvi, Hawaii, Ibrani, Herero, Hiligaynon, Hindi, Hmong Daw (Latin), Ho (Devanagiri), Hongaria, Iban, Islandia, Igbo, Iloko, Inari Sami, Indonesia, Ingush, Interlingua, Inuktitut (Latin), Irlandia, Italia, Jepang, Jaunsari (Devanagari), Jawa, Jola-Fonyi, Kabardian, Kabuverdianu, Kachin (Latin), Kalenjin, Kalmyk, Kangri (Devanagari), Kanuri, Karachay-Balkar, Kara-Kalpak (Sirilik), Kara-Kalpak (Latin), Kashubian, Kazakh (Sirilik), Kazakh (Latin), Khakas, Khaling, Khasi, K'iche', Kikuyu, Kildin Sami, Kinyarwanda, Komi, Kongo, Korea, Korku, Koryak, Kosraean, Kpelle, Kuanyama, Kumyk (Sirilik), Kurdi (Arab), Kurdi (Latin), Kurukh (Devanagari), Kirgistan (Sirilik), Lak, Lakota, Latin, Latvia, Lezghian, Lingala, Lituania, Sorbia Hilir, Lozi, Lule Sami, Luo (Kenya dan Tanzania), Luksemburg, Luyia luy, Makedonia, Machame, Madura, Mahasu Pahari (Devanagari), Makhuwa-Meetto, Makonde, Malagasi, Melayu (Latin), Malta, Malto (Devanagari), Mandinka, Manx, Maori, Mapudungun, Marathi, Mari (Rusia), Masai, Mende (Sierra Leone), Meru, Meta', Minangkabau, Mohawk, Mongolia (Sirilik), Mongondow, Montenegro (Sirilik), Montenegro (Latin), Morisyen, Mundang, Nahuatl, Navajo, Ndonga, Napolitan, Nepal, Ngomba, Niuean, Nogay, Ndebele Utara, Sami Utara (Latin), Norwegia, Nyanja, Nyankole, Nzima, Occitan, Ojibwa, Oromo, Ossetic, Pampanga, Pangasinan, Papiamento, Pashto, Pedi, Persia, Polandia, Portugis, Punjabi (Arab), Quechua, Ripuarian, Rumania, Romansh, Rundi, Rusia, Rwa, Sadri (Devanagari), Sakha, Samburu, Samoa (Latin), Sango, Sangu (Gabon), Sansekerta (Devanagari), Santali(Devanagiri), Skotlandia, Gaelik Skotlandia, Sena, Serbia (Sirilik), Serbia (Latin), Shambala, Sherpa (Devanagari), Shona, Siksika, Sirmauri (Devanagari), Skolt Sami, Slovakia, Slovenia, Soga, Somalia (Arab), Somalia (Latin), Songhai, Ndebele Selatan, Altai Selatan, Sami Selatan, Sotho Selatan, Spanyol, Sunda, Swahili (Latin), Swati, Swedia, Tabassaran, Tachelhit, Tahiti, Taita, Tajik (Sirilik), Tamil, Tatar (Sirilik), Tatar (Latin), Teso, Tetum, Thailand, Thangmi, Tok Pisin, Tonga, Tsonga, Tswana, Turki, Turkmenistan (Latin), Tuvan, Udmurt, Uighur (Sirilik), Ukraina, Sorbia Hulu, Urdu, Uyghur (Arab), Uzbek (Arab), Uzbek (Sirilik), Uzbek (Latin), Vietnam, Volapük, Vunjo, Walser, Welsh, Frisia Barat, Wolof, Xhosa, Yucatec Maya, Zapotec, Zarma, Zhuang, Zulu

Model untuk dokumen Umum

Bahasa berikut didukung saat melatih model pemrosesan dokumen dan memilih dokumen Umum sebagai tipe dokumen.

Afrikaans, Albania, Arab, Bulgaria, Cina (Han (varian Sederhana)), Cina (Han (varian Tradisional)), Kroasia, Ceko, Denmark, Belanda, Estonia, Finlandia, Prancis, Jerman, Ibrani, Hindi, Hongaria, Indonesia, Italia, Jepang, Korea, Latvia, Lithuania, Makedonia, Marathi, Yunani Modern (1453-), Nepal (bahasa makro), Norwegia, Panjabi, Persia, Polandia, Portugis, Rumania, Rusia, Slovakia, Slovenia, Somalia (Arab), Somalia (Latin), Spanyol, Swahili (bahasa makro), Swedia, Tamil, Thailand, Turki, Ukraina, Urdu, Vietnam

Persyaratan

Pemrosesan dokumen bekerja pada dokumen input yang memenuhi persyaratan berikut:

  • Format JPG, PNG, atau PDF (teks atau pindaian). PDF yang disematkan teks lebih baik, karena tidak akan ada kesalahan dalam ekstraksi karakter dan lokasi.
  • File TIFF tidak dapat digunakan untuk pelatihan. Anda harus menggunakan dokumen dalam format PDF, JPG atau PNG untuk melatih model. Setelah model dilatih, model dapat mengekstrak data dari file TIFF saat model digunakan dalam Power Automate aliran cloud.
  • Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum mengirimkannya.
  • Ukuran dokumen maksimum untuk diproses tidak boleh melebihi 20 MB.
  • Untuk gambar, dimensi harus antara 50 × 50 dan 10.000 × 10.000 piksel.
  • Jika dipindai dari dokumen kertas, pemindaian harus berupa gambar berkualitas tinggi.
  • Anda dapat membuat hingga 200 koleksi per model.
  • Dalam aliran cloud, batas bidang yang dapat ditandai untuk pemrosesan dokumen adalah 300.

Catatan

  • Mengekstrak tanda tangan dari dokumen saat ini tidak didukung.
  • Bidang yang terpisah melintasi batas halaman saat ini tidak didukung.
  • Baris yang dipisahkan dari satu halaman ke halaman lain saat ini tidak didukung.

Tips pengoptimalan

Pelajari cara meningkatkan performa model pemrosesan dokumen.

Langkah selanjutnya

Membuat model pemrosesan formulir