Jaa


Tekstin tunnistuksen valmis malli

Valmiit tekstintunnistusmallit poimivat sanoja asiakirjoista ja kuvista koneluettaviksi merkkitietovirroiksi. Se käyttää uusimman tekniikan mukaista optista merkintunnistusta (OCR), jolla tulostettu ja käsinkirjoitettu teksti kuvissa tunnistetaan.

Tämä malli käsittelee kuvat ja asiakirjat siten, että se poimii niistä rivejä tulostettua, painettua tai käsinkirjoitettua tekstiä.

Käyttö Power Appsissa

Valmis tekstintunnistusmalli on käytettävissä Power Appsissa tekstintunnistuskomponentin avulla. Lisätietoja: Tekstintunnistuskomponentin käyttäminen Power Appsissa

Käytetään Power Automatessa

Jos haluat tietoja siitä, miten tätä mallia käytetään Power Automatessa, katso kohta Valmiin tekstintunnistusmallin käyttäminen Power Automatessa.

Tuettu kieli, muoto ja koko

Jos haluat käsitellä tiedoston tekstintunnistusmallilla, sen on täytettävä seuraavat vaatimukset:

  • Tulostetekstin kieli: Afrikaans, Albanian, Angika (Devanagiri), Arabic, Asturian, Awadhi-Hindi (Devanagiri), Azerbaijani (Latin), Bagheli, Basque, Belarusian (Cyrillic), Belarusian (Latin), Bhojpuri-Hindi (Devanagiri), Bislama, Bodo (Devanagiri), Bosnian (Latin), Brajbha, Breton, Bulgarian, Bundeli, Buryat (Cyrillic), Catalan, Cebuano, Chamling, Chamorro, Chhattisgarhi (Devanagiri), Chinese (Simplified), Chinese (Traditional), Cornish, Corsican, Crimean Tatar (Latin), Croatian, Czech, Danish, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), Dutch, English, Erzya (Cyrillic), Estonian, Faroese, Fijian, Filipino, Finnish, French, Friulian, Gagauz (Latin), Galician, German, Gilbertese, Gondi (Devanagiri), Greenlandic, Gurung (Devanagiri), Haitian Creole, Halbi (Devanagiri), Hani, Haryanvi, Hawaiian, Hindi, Hmong Daw (Latin), Ho(Devanagiri), Hungarian, Icelandic, Inari Sami, Indonesian, Interlingua, Inuktitut (Latin), Irish, Italian, Japanese, Jaunsari (Devanagiri), Javanese, Kabuverdianu, Kachin (Latin), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (Cyrillic), Kara-Kalpak (Latin), Kashubian, Kazakh (Cyrillic), Kazakh (Latin), Khaling, Khasi, K'iche', Korean, Korku, Koryak, Kosraean, Kumyk (Cyrillic), Kurdish (Arabic), Kurdish (Latin), Kurukh (Devanagiri), Kyrgyz (Cyrillic), Lakota, Latin, Lithuanian, Lower Sorbian, Lule Sami, Luxembourgish, Mahasu Pahari (Devanagiri), Malay (Latin), Maltese, Malto (Devanagiri), Manx, Maori, Marathi, Mongolian (Cyrillic), Montenegrin (Cyrillic), Montenegrin (Latin), Neapolitan, Nepali, Niuean, Nogay, Northern Sami (Latin), Norwegian, Occitan, Ossetic, Pashto, Persian, Polish, Portuguese, Punjabi (Arabic), Ripuarian, Romanian, Romansh, Russian, Sadri (Devanagiri), Samoan (Latin), Sanskrit (Devanagari), Santali (Devanagiri), Scots, Scottish Gaelic, Serbian (Latin), Sherpa (Devanagiri), Sirmauri (Devanagiri), Skolt Sami, Slovak, Slovenian, Somali (Arabic), Southern Sami, Spanish, Swahili (Latin), Swedish, Tajik (Cyrillic), Tatar (Latin), Tetum, Thangmi, Tongan, Turkish, Turkmen (Latin), Tuvan, Upper Sorbian, Urdu, Uyghur (Arabic), Uzbek (Arabic), Uzbek (Cyrillic), Uzbek (Latin), Volapük, Walser, Welsh, Western Frisian, Yucatec Maya, Zhuang, Zulu
  • Käsin kirjoitetun tekstin kieli: englanti, kiina (yksinkertaistettu), ranska, saksa, italia, japani, korea, portugali, espanja
  • Muoto:
    • JPG
    • PNG
    • BMP
    • PDF
  • Koko: enintään 20 Mt
  • PDF-asiakirjoissa käsitellään vain ensimmäiset 2 000 sivua.

Mallituloste

Jos asiakirja tunnistetaan, tekstintunnistusmalli tuottaa seuraavat tiedot:

  • Tulokset: luettelo annetusta tekstistä poimituista riveistä.
  • Teksti: merkkijonot, jotka sisältävät tunnistetut tekstirivit.
  • BoundingBox: neljä arvoa, jotka edustavat täsmällistä kehikkoa (se kuvaa yläreunan ja alareunan sijainnit sekä leveyden ja korkeuden).

Rajoitukset

Toiminto Raja Uusimisjakso
Tekstintunnistuskutsut (ympäristöä kohden) 480 60 sekuntia

Harjoittelu: Tunnista teksiä AI Builderin avulla (moduuli)