Nhận dạng văn bản mô hình dựng sẵn
Mô hình dựng sẵn Nhận dạng văn bản trích xuất các từ từ tài liệu và hình ảnh thành luồng ký tự mà máy có thể đọc được. Nó sử dụng công nghệ nhận dạng ký tự quang học (OCR) tiên tiến nhất để phát hiện văn bản in và viết tay trong hình ảnh.
Mô hình này xử lý hình ảnh và tập tin tài liệu để trích xuất các dòng văn bản in hoặc viết tay.
Sử dụng trong Power Apps
Mô hình dựng sẵn Nhận dạng văn bản có sẵn trong Power Apps bằng cách sử dụng thành phần nhận dạng văn bản. Thông tin thêm: Sử dụng thành phần nhận dạng văn bản trong Power Apps
Sử dụng trong Power Automate
Để biết thông tin về cách sử dụng mô hình này trong Power Automate, hãy xem Sử dụng mô hình dựng sẵn Nhận dạng văn bản trong Power Automate.
Ngôn ngữ, định dạng và kích thước được hỗ trợ
Các tệp bạn có thể quét bằng mô hình Nhận dạng văn bản phải có những đặc điểm sau:
- Ngôn ngữ để in văn bản: Tiếng Afrikaans, Tiếng Albania, Tiếng Angika (Devanagiri), Tiếng Ả Rập, Tiếng Asturias, Tiếng Awadhi-Hindi (Devanagiri), Tiếng Azerbaijan (Latin), Tiếng Bagheli, Tiếng Basque, Tiếng Belarus (Cyrillic), Tiếng Belarus (Latin), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), tiếng Bosnia (Latin), Brajbha, Breton, tiếng Bungari, Bundeli, Buryat (Cyrillic), tiếng Catalan, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), tiếng Trung (Giản thể), Tiếng Trung (Phồn thể), tiếng Cornish, tiếng Corsican, tiếng Tatar Krym (tiếng Latin), tiếng Croatia, tiếng Séc, tiếng Đan Mạch, tiếng Dari, tiếng Dhimal (Devanagiri), tiếng Dogri (Devanagiri), tiếng Hà Lan, tiếng Anh, tiếng Erzya (chữ Cyrillic), tiếng Estonia, tiếng Faroese, tiếng Fiji, tiếng Philipin, Tiếng Phần Lan, Tiếng Pháp, Tiếng Friulian, Tiếng Gagauz (tiếng Latinh), Tiếng Galicia, Tiếng Đức, Tiếng Gilbert, Tiếng Gondi (Devanagiri), Tiếng Greenlandic, Tiếng Gurung (Devanagiri), Tiếng Creole Haiti, Tiếng Halbi (Devanagiri), Tiếng Hani, Tiếng Haryanvi, Tiếng Hawaii, Tiếng Hindi, Tiếng Hmong Daw (Latin ), Ho(Devanagiri), tiếng Hungary, tiếng Iceland, tiếng Inari Sami, tiếng Indonesia, tiếng Interlingua, tiếng Inuktitut (tiếng Latinh), tiếng Ireland, tiếng Ý, tiếng Nhật, tiếng Jaunsari (Devanagiri), tiếng Java, tiếng Kabuverdianu, tiếng Kachin (tiếng Latin), tiếng Kangri (Devanagiri), tiếng Karachay- Balkar, Kara-Kalpak (Cyrillic), Kara-Kalpak (Latin), Kashubian, Kazakhstan (Cyrillic), Kazakhstan (Latin), Khaling, Khasi, K'iche', Hàn Quốc, Korku, Koryak, Kosraean, Kumyk (Cyrillic), Tiếng Kurd (tiếng Ả Rập), tiếng Kurd (tiếng Latin), tiếng Kurukh (Devanagiri), tiếng Kyrgyz (tiếng Cyrillic), tiếng Lakota, tiếng Latin, tiếng Lithuania, tiếng Hạ Sorbian, tiếng Lule Sami, tiếng Luxembourg, tiếng Mahasu Pahari (Devanagiri), tiếng Mã Lai (tiếng Latin), tiếng Malta, tiếng Malto (Devanagiri) ), Manx, Maori, Marathi, Mông Cổ (Cyrillic), Montenegro (Cyrillic), Montenegro (Latin), Neapolitan, Nepali, Niuean, Nogay, Bắc Sami (Latin), Na Uy, Occitan, Ossetic, Pashto, Ba Tư, Ba Lan, Bồ Đào Nha, Punjabi (Ả Rập), Ripuarian, Romania, Romansh, Nga, Sadri (Devanagiri), Samoa (Latin), Sanskrit (Devanagari), Santali (Devanagiri), Scots, Gaelic Scotland, Serbia (Latin), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, tiếng Slovak, tiếng Slovenia, tiếng Somali (tiếng Ả Rập), tiếng Nam Sami, tiếng Tây Ban Nha, tiếng Swahili (tiếng Latinh), tiếng Thụy Điển, tiếng Tajik (tiếng Latinh), tiếng Tatar (tiếng Latinh), tiếng Tetum, tiếng Thangmi, tiếng Tongan, tiếng Thổ Nhĩ Kỳ, tiếng Turkmen (tiếng Latinh), Tuvan, Thượng Sorbia, Urdu, Uyghur (tiếng Ả Rập), tiếng Uzbek (tiếng Ả Rập), tiếng Uzbek (Cyrillic), tiếng Uzbek (tiếng Latin), Volapük, Walser, tiếng Wales, tiếng Frisian phương Tây, Yucatec Maya, Zhuang, Zulu
- Ngôn ngữ cho văn bản viết tay: Tiếng Anh, Tiếng Trung (Giản thể), Tiếng Pháp, Tiếng Đức, Tiếng Ý, Tiếng Nhật, Tiếng Hàn, Tiếng Bồ Đào Nha, Tiếng Tây Ban Nha
-
Định dạng:
- JPG
- PNG
- BMP
- Kích thước: tối đa 20 MB
- Đối với tài liệu PDF, chỉ 2.000 trang đầu tiên được xử lý.
Đầu ra mô hình
Nếu một tài liệu được phát hiện, mô hình Nhận dạng văn bản sẽ đưa ra thông tin sau:
- Kết quả: Danh sách các dòng được trích ra từ văn bản đầu vào.
- Text: Phát hiện chuỗi chứa dòng văn bản.
- BoundingBox: Bốn giá trị đại diện cho hộp giới hạn, được mô tả bằng cách sử dụng vị trí trên cùng và bên trái cùng với chiều rộng và chiều cao của hộp.
Giới hạn
Hoạt động | Giới hạn | Thời gian gia hạn |
---|---|---|
Cuộc gọi Nhận dạng văn bản (mỗi môi trường) | 480 | 60 giây |