Jagamisviis:


Tekstituvastus eelehitatud mudel

Tekstituvastus eelvalmistatud mudel ekstraktib dokumentidest ja piltidest sõnad masinloetavateks märgivoogudeks. See kasutab tipptasemel optilist märgituvastust (OCR), et tuvastada piltidel trükitud ja käsitsi kirjutatud tekst.

See mudel töötleb pilte ja dokumendifaile trükitud või käsitsi kirjutatud teksti ridade ekstraktimiseks.

Power Appsis kasutamine

Valmismudeli Tekstituvastus on saadaval Power Apps tekstituvastuse komponendi abil. Lisateave: Tekstituvastuse komponendi kasutamine Power Apps

Power Automate’is kasutamine

Lisateavet selle mudeli Power Automate kasutamise kohta leiate teemast Valmismudeli Tekstituvastus kasutamine Power Automate.

Toetatud keel, vorming ja suurus

Tekstituvastus mudeliga skannitavatel failidel peavad olema järgmised omadused:

  • Trükiteksti keel: afrikaani, albaania, angika (devanagiri), araabia, astuuria, awadhi-hindi (devanagiri), aserbaidžaani (ladina tähestik), bagheli, baski, valgevene (kirillitsa), valgevene (ladina tähestik), bhojpuri-hindi (devanagiri), bislama, bodo (devanagiri), bosnia (ladina tähestik), brajbha, bretooni, bulgaaria, bundeli, burjaat (kirillitsa), katalaani, cebuano, chamorro, chhattisgarhi (devanagiri), hiina (lihtsustatud), hiina (traditsiooniline), korsika, korsika, krimmitatarlane (ladina tähestik), horvaadi, tšehhi, Taani, Dari, Dhimal (Devanagiri), Dogri (Devanagiri), hollandi, inglise, erzya (kirillitsa), eesti, fääri, fidži, filipiini, soome, prantsuse, friuli, gagauzi (ladina tähestik), galeegi, saksa, gilberti, gondi (Devanagiri), gröönimaa, gurung (Devanagiri), Haiti kreool, halbi (Devanagiri), Hani, Haryanvi, Havai, hindi, Hmong Daw (ladina tähestik), Ho(Devanagiri), ungari, islandi, Inari saami, indoneesia, Interlingua, inuktitut (ladina tähestik), iiri, itaalia, jaapani, jaunsari (Devanagiri), jaava, Kabuverdianu, Kachin (ladina), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (kirillitsa), Kara-Kalpak (ladina tähestik), Kashubian, Kasahhi (kirillitsa), Kasahhi (ladina tähestik), Khaling, Khasi, K’iche’, Korea, Korku, Koryak, Kosraean, Kumyk (kirillitsa), kurdi (araabia), kurdi (ladina tähestik), Kurukh (Devanagiri), kirgiisi (kirillitsa), Lakota, ladina, leedu, alamsorbi, lule saami, luksemburgi, Mahasu Pahari (Devanagiri), malai (ladina tähestik), malta, malto (Devanagiri), manx, maoori, marathi, mongoolia (kirillitsa), Montenegro (kirillitsa), Montenegro (ladina tähestik), Napoli, Nepali, Niuean, Nogay, Põhjasaami (ladina tähestik), Norra, oksitaani, Osseetia, Puštu, Pärsia, Poola, Portugali, Pandžabi (araabia), Ripuariani, Rumeenia, romaani, vene, Sadri (Devanagiri), Samoan (ladina), Sanskriti (Devanagari), Santali (Devanagiri), šoti, šoti gaeli, serbia (ladina), šerpa (Devanagiri), Sirmauri (Devanagiri), Skolt saami, slovaki, sloveeni, somaalia (araabia), lõunasaami, hispaania, suahiili (ladina tähestik), rootsi, tadžiki (kirillitsa), tatari (ladina tähestik), tetum, thangmi, tongan, türgi, türkmeeni (ladina tähestik), tuvan, ülemsorbi, urdu, uiguuri (araabia), usbeki (araabia), usbeki (kirillitsa), usbeki (ladina tähestik), volapük, walser, kõmri, lääne-friisi, yucatec maya, zhuang, zulu
  • Käsitsi kirjutatud teksti keel: inglise, hiina (lihtsustatud), prantsuse, saksa, itaalia, jaapani, korea, portugali, hispaania
  • Mõõdud:
    • JPG
    • PNG
    • BMP
    • PDF
  • Suurus: maksimaalselt 20 MB
  • PDF-dokumentide puhul töödeldakse ainult esimest 2,000 lehekülge.

Mudeli väljund

Kui tuvastatakse dokument, väljastab Tekstituvastus mudel järgmise teabe.

  • Tulemused: sisendtekstist ekstraktitud ridade loend.
  • Tekst: stringid, mis sisaldavad tuvastatud tekstirida.
  • BoundingBox: neli piiritlusboksi tähistavat väärtust, mida kirjeldatakse ülemise ja vasaku asukoha ning laiuse ja kõrgusega.

Limiidid

Tegevus Piirang Uuendamise periood
Tekstituvastus kõned (keskkonna kohta) 480 60 sekundi järel

Koolitus: teksti tuvastamine koos AI Builder (moodul)