Tekstin tunnistuksen valmis malli
Valmiit tekstintunnistusmallit poimivat sanoja asiakirjoista ja kuvista koneluettaviksi merkkitietovirroiksi. Se käyttää uusimman tekniikan mukaista optista merkintunnistusta (OCR), jolla tulostettu ja käsinkirjoitettu teksti kuvissa tunnistetaan.
Tämä malli käsittelee kuvat ja asiakirjat siten, että se poimii niistä rivejä tulostettua, painettua tai käsinkirjoitettua tekstiä.
Käyttö Power Appsissa
Valmis tekstintunnistusmalli on käytettävissä Power Appsissa tekstintunnistuskomponentin avulla. Lisätietoja: Tekstintunnistuskomponentin käyttäminen Power Appsissa
Käytetään Power Automatessa
Jos haluat tietoja siitä, miten tätä mallia käytetään Power Automatessa, katso kohta Valmiin tekstintunnistusmallin käyttäminen Power Automatessa.
Tuettu kieli, muoto ja koko
Jos haluat käsitellä tiedoston tekstintunnistusmallilla, sen on täytettävä seuraavat vaatimukset:
- Tulostetekstin kieli: Afrikaans, Albanian, Angika (Devanagiri), Arabic, Asturian, Awadhi-Hindi (Devanagiri), Azerbaijani (Latin), Bagheli, Basque, Belarusian (Cyrillic), Belarusian (Latin), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bosnian (Latin), Brajbha, Breton, Bulgarian, Bundeli, Buryat (Cyrillic), Catalan, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Chinese (Simplified), Chinese (Traditional), Cornish, Corsican, Crimean Tatar (Latin), Croatian, Czech, Danish, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Dutch, English, Erzya (Cyrillic), Estonian, Faroese, Fijian, Filipino, Finnish, French, Friulian, Gagauz (Latin), Galician, German, Gilbertese, Gondi (Devanagiri), Greenlandic, Gurung (Devanagiri), Haitian Creole, Halbi (Devanagiri), Hani, Haryanvi, Hawaiian, Hindi, Hmong Daw (Latin), Ho(Devanagiri), Hungarian, Icelandic, Inari Sami, Indonesian, Interlingua, Inuktitut (Latin), Irish, Italian, Japanese, Jaunsari (Devanagiri), Javanese, Kabuverdianu, Kachin (Latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (Cyrillic), Kara-Kalpak (Latin), Kashubian, Kazakh (Cyrillic), Kazakh (Latin), Khaling, Khasi, K'iche', Korean, Korku, Koryak, Kosraean, Kumyk (Cyrillic), Kurdish (Arabic), Kurdish (Latin), Kurukh (Devanagiri), Kyrgyz (Cyrillic), Lakota, Latin, Lithuanian, Lower Sorbian, Lule Sami, Luxembourgish, Mahasu Pahari (Devanagiri), Malay (Latin), Maltese, Malto (Devanagiri), Manx, Maori, Marathi, Mongolian (Cyrillic), Montenegrin (Cyrillic), Montenegrin (Latin), Neapolitan, Nepali, Niuean, Nogay, Northern Sami (Latin), Norwegian, Occitan, Ossetic, Pashto, Persian, Polish, Portuguese, Punjabi (Arabic), Ripuarian, Romanian, Romansh, Russian, Sadri (Devanagiri), Samoan (Latin), Sanskrit (Devanagari), Santali (Devanagiri), Scots, Scottish Gaelic, Serbian (Latin), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, Slovak, Slovenian, Somali (Arabic), Southern Sami, Spanish, Swahili (Latin), Swedish, Tajik (Cyrillic), Tatar (Latin), Tetum, Thangmi, Tongan, Turkish, Turkmen (Latin), Tuvan, Upper Sorbian, Urdu, Uyghur (Arabic), Uzbek (Arabic), Uzbek (Cyrillic), Uzbek (Latin), Volapük, Walser, Welsh, Western Frisian, Yucatec Maya, Zhuang, Zulu
- Käsin kirjoitetun tekstin kieli: englanti, kiina (yksinkertaistettu), ranska, saksa, italia, japani, korea, portugali, espanja
-
Muoto:
- JPG
- PNG
- BMP
- Koko: enintään 20 Mt
- PDF-asiakirjoissa käsitellään vain ensimmäiset 2 000 sivua.
Mallituloste
Jos asiakirja tunnistetaan, tekstintunnistusmalli tuottaa seuraavat tiedot:
- Tulokset: luettelo annetusta tekstistä poimituista riveistä.
- Teksti: merkkijonot, jotka sisältävät tunnistetut tekstirivit.
- BoundingBox: neljä arvoa, jotka edustavat täsmällistä kehikkoa (se kuvaa yläreunan ja alareunan sijainnit sekä leveyden ja korkeuden).
Rajoitukset
Toiminto | Raja | Uusimisjakso |
---|---|---|
Tekstintunnistuskutsut (ympäristöä kohden) | 480 | 60 sekuntia |