Yêu cầu và giới hạn đối với mô hình xử lý tài liệu

Các ngôn ngữ được hỗ trợ

Mô hình cho các tài liệu mẫu cố định

Các ngôn ngữ sau đây được hỗ trợ khi đào tạo mô hình xử lý tài liệu và chọn Tài liệu mẫu cố định làm loại tài liệu:

Abaza, Abkhazian, Achinese, Acoli, Adangme, Adyghe, Afar, Afrikaans, Akan, Albanian, Algonquin, Angika (Devanagari), Ả Rập, Asturias, Asu (Tanzania), Avaric, Awadhi-Hindi (Devanagari), Aymara, Azerbaijan (Latin), Bafia, Bagheli, Bambara, Bashkir, Basque, Belarus (Cyrillic), Belarus (tiếng Latin), Bemba (Zambia), Bemba (Zambia), Bhojpuri-Hindi (Devanagari), Bikol, Bini, Bislama, Bodo (Devanagari), tiếng Bosnia (tiếng Latin), Brajbha, tiếng Breton, tiếng Bulgaria, Bundeli, Buryat (Cyrillic), tiếng Catalan, Cebuano, Chamling, Chamorro, Chechen, Chhattisgarhi (Devanagari), Chiga, tiếng Trung giản thể, tiếng Trung phồn thể, Choctaw, Chukot, Chuvash, Cornish, Corsican, Cree, Creek, Crimean Tatar (Latin), Croatian, Crow, Séc, Đan Mạch, Dargwa, Dari, Dhimal (Devanagari), Dogri (Devanagari), Duala, Dungan, Hà Lan, Efik, Anh, Erzya (Cyrillic), Estonian, Faroese, Fijian, Filipino, Phần Lan, Fon, Pháp, Friulian, Ga, Gagauz (Latin), Galicia, Ganda, Gayo, tiếng Đức, Gilbertese, Gondi (Devanagari), Hy Lạp, Greenlandic, Guarani, Gurung (Devanagari), Gusii, Haiti Creole, Halbi (Devanagari), Hani, Haryanvi, Hawaiian, Do Thái, Herero, Hiligaynon, Hindi, Hmong Daw (Latin), Ho (Devanagiri), Hungary, Iban, Iceland, Igbo, Iloko, Inari Sami, Indonesia, Ingush, Interlingua, Inuktitut (tiếng Latin), tiếng Ailen, Ý, Nhật Bản, Jaunsari (Devanagari), Java, Jola-Fonyi, Kabardian, Kabuverdianu, Kachin (Latin), Kalenjin, Kalmyk, Kangri (Devanagari), Kanuri, Karachay-Balkar, Kara-Kalpak (Cyrillic), Kara-Kalpak (Latin), Kashubian, Kazakhstan (Cyrillic), Kazakhstan (Latin), Khakas, Khaling, Khasi, K'iche', Kikuyu, Kildin Sami, Kinyarwanda, Komi, Kongo, Hàn Quốc, Korku, Koryak, Kosraean, Kpelle, Kuanyama, Kumyk (Cyrillic), Kurd (Ả Rập), Kurd (Latin), Kurukh (Devanagari), Kyrgyz (Cyrillic), Lak, Lakota, Latin, Latvian, Lezghian, Lingala, Lithuanian, Lower Sorbian, Lozi, Lule Sami, Luo (Kenya và Tanzania), Tiếng Luxembourg, tiếng Luyia luy, tiếng Macedonia, tiếng Machame, tiếng Madurese, tiếng Mahasu Pahari (Devanagari), tiếng Makhuwa-Meetto, Makonde, tiếng Malagasy, tiếng Mã Lai (tiếng Latin), tiếng Malta, tiếng Malto (Devanagari), tiếng Mandinka, Manx, tiếng Maori, tiếng Mapudungun, tiếng Marathi, tiếng Mari (Nga), Masai, Mende (Sierra Leone), Meru, Meta', Minangkabau, Mohawk, tiếng Mông Cổ (Cyrillic), Mongondow, Montenegrin (Cyrillic), Montenegrin (Latin), Morisyen, Mundang, Nahuatl, Navajo, Ndonga, Neapolitan, Nepali, Ngomba, Niuean, Nogay, Bắc Ndebele, Bắc Sami (Latin), Na Uy, Nyanja, Nyankole, Nzima, Occitan, Ojibwa, Oromo, Ossetic, Pampanga, Pangasinan, Papiamento, Tiếng Pashto, Pedi, Tiếng Ba Tư, Tiếng Ba Lan, tiếng Bồ Đào Nha, tiếng Punjabi (tiếng Ả Rập), tiếng Quechua, tiếng Ripuarian, tiếng Rumani, tiếng Romansh, tiếng Rundi, tiếng Nga, Rwa, Sadri (Devanagari), Sakha, Samburu, tiếng Samoan (tiếng Latin), sango, sangu (Gabon), tiếng Phạn (Devanagari), Santali(Devanagiri), tiếng Scotland, tiếng Gaelic Scotland, Sena, tiếng Serbia (Cyrillic), tiếng Serbia (tiếng Latin), Shambala, Sherpa (Devanagari), Shona, Siksika, Sirmauri (Devanagari), Skolt Sami, Slovak, Slovenia, Soga, Somali (Ả Rập), Somali (Latin), Songhai, Nam Ndebele, Nam Altai, Nam Sami, Nam Sotho, Tây Ban Nha, Sundanese, Swahili (Latin), Swati, Thụy Điển, Tabassaran, Tachelhit, Tahiti, Taita, Tajik (Cyrillic), Tamil, Tatar (Cyrillic), Tatar (Latinh), Teso, Tetum, Thái, Thangmi, Tok Pisin, Tongan, Tsonga, Tswana, Thổ Nhĩ Kỳ, Turkmen (Latin), Tuvan, Udmurt, Duy Ngô Nhĩ (Cyrillic), Ukraina, Thượng Sorbia, Urdu, Uyghur (Ả Rập), Uzbek (Ả Rập), Uzbek (Cyrillic), Uzbek (Latin), Tiếng Việt, Volapük, Vunjo, Walser, Welsh, Tây Frisian, Wolof, Xhosa, Yucatec Maya, Zapotec, Zarma, Zhuang, Zulu

Mẫu cho tài liệu chung

Các ngôn ngữ sau đây được hỗ trợ khi đào tạo mô hình xử lý tài liệu và chọn Tài liệu chung làm loại tài liệu.

Tiếng Afrikaans, tiếng Albania, tiếng Ả Rập, tiếng Bulgaria, tiếng Trung (Hán (biến thể giản thể)), tiếng Trung (Hán (biến thể phồn thể)), tiếng Croatia, tiếng Séc, tiếng Đan Mạch, tiếng Hà Lan, tiếng Estonia, tiếng Phần Lan, tiếng Pháp, tiếng Đức, tiếng Hebrew, tiếng Hindi, tiếng Hungary, tiếng Indonesia, tiếng Ý, tiếng Nhật, tiếng Hàn, tiếng Latvia, tiếng Litva, tiếng Macedonia, tiếng Marathi, tiếng Hy Lạp hiện đại (1453-), tiếng Nepal (ngôn ngữ vĩ mô), tiếng Na Uy, tiếng Panjabi, tiếng Ba Tư, tiếng Ba Lan, tiếng Bồ Đào Nha, tiếng Rumani, tiếng Nga, tiếng Slovak, tiếng Slovenia, tiếng Somali (tiếng Ả Rập), tiếng Somali (tiếng Latinh), tiếng Tây Ban Nha, tiếng Swahili (ngôn ngữ vĩ mô), tiếng Thụy Điển, tiếng Tamil, tiếng Thái, tiếng Thổ Nhĩ Kỳ, tiếng Ukraina, tiếng Urdu, tiếng Việt

Yêu cầu

Quá trình xử lý tài liệu thực hiện trên các tài liệu đầu vào đáp ứng các yêu cầu sau:

  • Định dạng JPG, PNG hoặc PDF (văn bản hoặc được quét). Các tệp PDF nhúng văn bản sẽ tốt hơn vì sẽ không có bất kỳ lỗi nào trong việc trích xuất ký tự và vị trí.
  • Không thể sử dụng tệp TIFF để đào tạo. Bạn cần sử dụng tài liệu ở định dạng PDF, JPG hoặc PNG để đào tạo mô hình. Sau khi mô hình được đào tạo, mô hình có thể trích xuất dữ liệu từ tệp TIFF khi mô hình được sử dụng trong dòng đám mây Power Automate.
  • Nếu tệp PDF của bạn bị khóa bằng mật khẩu, bạn phải gỡ khóa trước khi gửi.
  • Kích thước tài liệu tối đa cần xử lý không được vượt quá 20 MB.
  • Đối với hình ảnh, kích thước phải nằm trong khoảng từ 50 × 50 đến 10.000 × 10.000 pixel.
  • Nếu quét từ tài liệu giấy, hình ảnh quét phải có chất lượng cao.
  • Bạn có thể tạo tối đa 200 bộ sưu tập cho mỗi mô hình.
  • Trong luồng đám mây, giới hạn số trường có thể được gắn thẻ để xử lý tài liệu là 300.

Lưu ý

  • Trích xuất chữ ký từ tài liệu hiện chỉ được hỗ trợ cho các tài liệu mẫu cố định.
  • Hiện tại, các trường bị chia tách theo ranh giới trang không được hỗ trợ.
  • Hiện tại, tính năng này không hỗ trợ các hàng ngắt từ trang này sang trang khác.

Mẹo tối ưu hóa

Tìm hiểu cách cải thiện hiệu suất của các mô hình xử lý tài liệu.

Bước tiếp theo

Tạo mô hình xử lý biểu mẫu