Előre felépített szövegfelismerési modell

A szövegfelismerési előre felépített modellek gépileg olvasható karakterfolyamokba nyernek ki szavakat dokumentumokból és képekből. A képeken található nyomtatott és kézzel írott szöveg felismerésére a legújabb technológiát képviselő optikai karakterfelismerést (OCR) használnak.

Ez az modell feldolgozza a képeket és a dokumentumfájlokat a nyomtatott vagy kézzel írott szövegsorok kinyeréséhez.

Használat a Power Apps szolgáltatásban

Az előkészített szövegfelismerő modell a Power Apps szolgáltatásban a szövegfelismerő összetevő használatával érhető el. További információ: A szövegfelismerő összetevő használata a következőben Power Apps

A Power Automate-ben való használat

További információ a modell használatáról Power Automate: A szövegfelismerés előre összeállított modelljének használata Power Automate.

Támogatott nyelv, formátum és méret

A szövegfelismerési modellel szkennelhető fájloknak az alábbi jellemzőkkel kell rendelkezniük:

  • A nyomtatott szöveg nyelve: afrikaans, albán, angika (devanagiri), arab, asztúriai, awadhi-hindi (devanagiri), azerbajdzsáni (latin betűs), bagheli, baszk, belarusz (cirill betűs), belarusz (latin betűs), bhojpuri-hindi (devanagiri), bislama, bodó (dévanagiri), bosnyák (latin betűs), brajbha, breton, bolgár, bundeli, burját (cirill betűs), katalán, cebuano, chamling, chamorro, chhattisgarhi (devanagiri), kínai (egyszerűsített), kínai (hagyományos), korni, korzikai, krími tatár (latin), horvát, cseh, angol, dán, dari, dhimal (devanagiri), dogri (devanagiri), holland, észt, feröeri, fidzsi, tagalog, finn, francia, friuli, gagauz (latin betűs), galíciai, német, gilberti, gondi (devanagiri), grönlandi, gurung (devanagiri), hani, haryanvi, hawaii, hindi, hmong daw (latin betűs), ho(devanagiri), magyar, izlandi, inari számi, indonéz, interlingva, inuktitut (latin betűs), ír, olasz, japán, jaunsari (dévanagiri), jávai, Kabuverdianu, Kachin (latin betűs), Kangri (Devanagiri), Karachay-Balkar, Kara-Kalpak (cirill betűs), Kara-Kalpak (latin), kasub, kazah (cirill), kazah (latin), Khaling, Khasi, K'iche', koreai, Korku, Koryak, Kosraean, Kumyk (cirill), kurd (arab), kurd (latin), Kurukh (Devanagiri), kirgiz (cirill betűs), lakota, latin, litván, alsó-szorb, Lule számi, luxemburgi, Mahasu Pahari (Devanagiri), maláj (latin), máltai, malto (devanagiri), manx, maori, marathi, mongol (cirill), montenegrói (cirill betűs), montenegrói (latin betűs), nápolyi, nepáli, niuei, nogay, északi számi (latin betűs), norvég, okcitán, csontosszetikus, pastu, perzsa, lengyel, portugál, pandzsábi (arab), ripuari, román, román, orosz, szadri (dévanagiri), szamoai (latin betűs), szanszkrit (dévanágari), Santali (dévanagiri), skót, skóciai kelta, szerb (latin betűs), serpa (dévanagiri), sirmauri (dévanagiri), skolt számi, szlovák, szlovén, szomáliai (arab), déli számi, spanyol, szuahéli (latin betűs), svéd, tádzsik (cirill betűs), tatár (latin betűs), tetum, thangmi, tongai, török, türkmén (latin betűs), tuvani, felső-szorb, urdu, ujgur (arab), üzbég (arab), üzbég (cirill), üzbég (latin betűs), volapük, walser, walesi, nyugati fríz, yucatec maya, zhuang, zulu
  • Kézzel írt szöveg nyelve: angol, francia, német, olasz, japán, koreai, portugál, spanyol
  • Formátum:
    • JPG
    • PNG
    • BMP
    • PDF
  • Méret: maximum 20 MB
  • PDF-dokumentumok esetén csak az első 2,000-oldalt dolgozza fel a rendszer.

A modell kimenete

Ha a rendszer egy dokumentumot észlel, a szövegfelismerési modell kimenete a következő információ:

  • Eredmények: A bemeneti szövegből kinyert sorok listája.
  • Szöveg: Az észlelt szövegsort tartalmazó karakterláncok.
  • BoundingBox: A határolókeretet képviselő négy érték, amelyek a felső és a bal oldali pozíciók, valamint a szélesség és magasság használatával vannak leírva.

Korlátozások

Akció Korlát Megújítási időszak
Szövegfelismerési hívások (környezetenként) 480 60 másodperc

Képzés: Szöveg felismerése a AI Builder (modul) segítségével