Jagamisviis:


Tekstituvastuse valmismudel

Tekstituvastuse eelehitatud mudel eraldab sõnad dokumentidest ja piltidest masinloetavatesse märgivoogudesse. See kasutab tipptasemel optilist märgituvastust (OCR), et tuvastada piltidel trükitud ja käsitsi kirjutatud tekst.

See mudel töötleb pilte ja dokumendifaile, et eraldada trükitud või käsitsi kirjutatud teksti ridu.

Power Appsis kasutamine

Tekstituvastuse eelehitatud mudel on saadaval Power Apps tekstituvastuse komponendi abil. Lisateave: Tekstituvastuse komponendi kasutamine Power Apps

Power Automate’is kasutamine

Lisateavet selle mudeli Power Automate kasutamise kohta leiate teemast Tekstituvastuse valmismudeli kasutamine Power Automate.

Toetatud keel, vorming ja suurus

Tekstituvastusmudeliga skannitavatel failidel peavad olema järgmised omadused.

  • Trükiteksti keel: afrikaani, albaania, angika (devanagiri), araabia, astuuria, awadhi-hindi (devanagiri), aserbaidžaani (ladina), bagheli, baski, valgevene (kirillitsas), valgevene (ladina), bhojpuri-hindi (devanagiri), bislama, bodø (devanagiri), bosnia (ladina), brajbha, bretooni, bulgaaria, bundeli, burjaat (kirillitsa), katalaani, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), hiina (lihtsustatud), hiina (traditsiooniline), korni, korsika, krimmitatari (ladina keeles), horvaadi, tšehhi, taani, dari, dhimal (devanagiri), dogri (devanagiri), hollandi, inglise, ersa (kirillitsa), eesti, fääri saarte saar, fidži, filipiini, soome, prantsuse, friuli, gagauzi (ladina), gagauzi (ladina), saksa, gilberti, gondi (devanagiri), gröönimaa, gurng (devanagiri), haiti kreool, halbi (devanagiri), hani, haryanvi, hawaii, hindi, hmong daw (ladina), ho(devanagiri), ungari, islandi, inari saami, indoneesia, interlingua, inuktitut (ladina), iiri, itaalia, jaapani, jaunsari (devanagiri), jaava, kabuverdianu, katšin (ladina tähestik), kangri (devanagiri), karatšai-balkar, kara-kalpak (kirillitsa), kara-kalpak (ladina tähestik), kašubi, kasahhi (kirillitsa), kasahhi (ladina), kharing, k’iche’, korea, korku, korjak, kosraea, kumyk (kirillitsa), kurdi (araabia), kurdi (ladina), kurukh (devanagiri), kirgiisi (kirillitsa), lakota, ladina, leedu, alamsorbia, lule, lule, luksemburgi, mahasu pahari (devanagiri), malai (ladina), malta, malto (devanagiri), manx, maoori, marathi, mongoolia (kirillitsa), montenegro (kirillitsa), montenegro (ladina), napoli, nepali, niueani, nogai, põhjasaami (ladina), norra, oksitaan, osseeti, puštu, pärsia, poola, portugali, pandžabi (araabia), ripuaari, rumeenia, romaani, vene, sadri (devanagiri), samoa (ladina), sanskriti (devanagari), santali (devanagiri), šoti, šoti gaeli, serbia (ladina), šerpa (devanagiri), sirmauri (devanagiri), kolta saami, slovaki, sloveeni, somaali (araabia), lõunasaami, hispaania, suahiili (ladina), rootsi, tadžiki (kirillitsas), tatari (ladina tähestik), tetum, thangmi, tonga, türgi, türkmeeni (ladina), tuva, ülemsorbia, urdu, uiguuri (araabia), usbeki (araabia), usbeki (kirillitsa), usbeki (ladina), volapük, walser, kõmri, läänefriis, yutekide maiad, zhuang, zulu
  • Käsitsi kirjutatud teksti keel: inglise, hiina (lihtsustatud), prantsuse, saksa, itaalia, jaapani, korea, portugali, hispaania
  • Formaat:
    • JPG
    • PNG
    • BMP
    • PDF
  • Suurus: maksimaalselt 20 MB
  • PDF-dokumentide puhul töödeldakse ainult esimest 2,000 lehekülge.

Mudeli väljund

Dokumendi tuvastamisel väljastab tekstituvastusmudel järgmise teabe.

  • Tulemused: sisendtekstist eraldatud ridade loend.
  • Tekst: tuvastatud tekstirida sisaldavad stringid.
  • BoundingBox: neli väärtust, mis tähistavad piirdekasti, mida kirjeldatakse ülemise ja vasakpoolse asukoha ning selle laiuse ja kõrguse abil.

Limiidid

Tegevus Piirang Pikendamise periood
Tekstituvastuskõned (keskkonna kohta) 480 60 sekundi järel

Koolitus: Teksti tuvastamine ( AI Builder moodul)